Toleranční interval se od intervalu spolehlivosti liší tím, že interval spolehlivosti ohraničuje s určitou jistotou jednohodnotový parametr populace (například průměr nebo rozptyl), zatímco toleranční interval ohraničuje rozsah hodnot dat, který zahrnuje určitou část populace. Zatímco velikost intervalu spolehlivosti je zcela způsobena výběrovou chybou a s rostoucí velikostí vzorku se bude blížit intervalu s nulovou šířkou u skutečného populačního parametru, velikost tolerančního intervalu je částečně způsobena výběrovou chybou a částečně skutečným rozptylem v populaci a s rostoucí velikostí vzorku se bude blížit pravděpodobnostnímu intervalu populace.
Toleranční interval je příbuzný s intervalem předpovědi v tom, že oba stanoví hranice rozptylu v budoucích vzorcích. Predikční interval však ohraničuje pouze jeden budoucí vzorek, zatímco toleranční interval ohraničuje celou populaci (ekvivalentně libovolnou posloupnost budoucích vzorků). Jinými slovy, predikční interval pokrývá v průměru určitou část populace, zatímco toleranční interval ji pokrývá s určitou úrovní spolehlivosti, takže toleranční interval je vhodnější, pokud má jediný interval ohraničit více budoucích vzorků.
PříkladyUpravit
uvádí následující příklad:
Uvažujme tedy ještě jednou příslovečný scénář testu ujetých kilometrů EPA, v němž se testuje několik nominálně stejných aut určitého modelu, aby se získaly hodnoty ujetých kilometrů y 1 , y 2 , . . . , y n {\displaystyle y_{1},y_{2},…,y_{n}}
. Pokud se taková data zpracují tak, aby vznikl 95% interval spolehlivosti pro průměrný počet ujetých kilometrů modelu, je možné je například použít k projekci průměrné nebo celkové spotřeby benzinu pro vyrobený vozový park těchto automobilů během prvních 5 000 kilometrů jejich používání. Takový interval by však příliš nepomohl osobě, která si pronajímá jeden z těchto vozů a přemýšlí, zda jí (plná) desetigalonová nádrž postačí na ujetí 350 mil do cíle. Pro tuto práci by byl mnohem užitečnější interval předpovědi. (Zvažte rozdílné důsledky toho, když si budete „na 95 % jisti“, že μ ≥ 35 {\displaystyle \mu \geq 35}.
na rozdíl od „95% jistoty“, že y n + 1 ≥ 35 {\displaystyle y_{n+1}\geq 35}
.) Ale ani interval spolehlivosti pro μ {\displaystyle \mu }
ani interval předpovědi pro jeden další kilometr je přesně to, co potřebuje konstruktér, který má za úkol určit, jak velkou nádrž na plyn model skutečně potřebuje, aby bylo zaručeno, že 99 % vyrobených aut bude mít dojezd 400 mil. Inženýr skutečně potřebuje interval tolerance pro zlomek p = .99 {\displaystyle p=.99}.
ujetých kilometrů takových aut.
Jiný příklad je dán:
Hladiny olova v ovzduší byly získány od n = 15 {\displaystyle n=15}.
různých oblastí v objektu. Bylo zjištěno, že logaritmicky transformované hladiny olova dobře odpovídají normálnímu rozdělení (to znamená, že údaje pocházejí z lognormálního rozdělení. Nechť μ {\displaystyle \mu }
a σ 2 {\displaystyle \sigma ^{2}}.
označují populační průměr a rozptyl pro logaritmicky transformovaná data. Jestliže X {\displaystyle X}
označuje příslušnou náhodnou veličinu, máme tedy X ∼ N ( μ , σ 2 ) {\displaystyle X\sim {\mathcal {N}}(\mu ,\sigma ^{2})}.
. Všimneme si, že exp ( μ ) {\displaystyle \exp(\mu )}
je medián hladiny olova ve vzduchu. Interval spolehlivosti pro μ {\displaystyle \mu }
lze sestrojit obvyklým způsobem na základě t-rozdělení; to zase poskytne interval spolehlivosti pro medián hladiny olova v ovzduší. Jestliže X ¯ {\displaystyle {\bar {X}}}
a S {\displaystyle S}
označují výběrový průměr a směrodatnou odchylku logaritmicky transformovaných dat pro vzorek o velikosti n, 95% interval spolehlivosti pro μ {\displaystyle \mu }
je dán vztahem X¯ ± t n – 1 , 0,975 S / ( n ) {\displaystyle {\bar {X}}\pm t_{n-1,0,975}S/{\sqrt {(}}n)}
, kde t m , 1 – α {\displaystyle t_{m,1-\alfa }}
označuje 1 – α {\displaystyle 1-\alfa }
kvantil t-rozdělení s m {\displaystyle m}
stupňů volnosti. Zajímavé může být také odvození 95% horní meze spolehlivosti pro medián hladiny olova v ovzduší. Taková hranice pro μ {\displaystyle \mu }
je dána vztahem X¯ + t n – 1 , 0,95 S / n {\displaystyle {\bar {X}}+t_{n-1,0,95}S/{\sqrt {n}}}.
. Z toho vyplývá, že 95% horní hranice spolehlivosti pro medián náskoku ve vzduchu je dána vztahem exp ( X¯ + t n – 1 , 0,95 S / n ) {\displaystyle \exp {\left({\bar {X}}+t_{n-1,0,95}S/{\sqrt {n}}\right)}}}.
. Nyní předpokládejme, že chceme předpovědět hladinu olova ve vzduchu v určité oblasti v laboratoři. Horní mez 95% předpovědi pro logaritmicky transformovanou hladinu olova je dána vztahem X¯ + t n – 1 , 0,95 S ( 1 + 1 / n ) {\displaystyle {\bar {X}}+t_{n-1,0,95}S{\sqrt {\left(1+1/n\right)}}}.
. Podobně lze vypočítat i oboustranný interval předpovědi. Význam a interpretace těchto intervalů jsou dobře známy. Například pokud interval spolehlivosti X¯ ± t n – 1 , 0,975 S / n {\displaystyle {\bar {X}}\pm t_{n-1,0,975}S/{\sqrt {n}}})
se počítá opakovaně z nezávislých vzorků, 95 % takto vypočtených intervalů bude obsahovat skutečnou hodnotu μ {\displaystyle \mu }
, v dlouhodobém horizontu. Jinými slovy, interval má poskytnout informace týkající se parametru μ {\displaystyle \mu }.
. Interval předpovědi má podobnou interpretaci a má poskytovat informace týkající se pouze jedné úrovně vedení. Nyní předpokládejme, že chceme vzorek použít k závěru, zda alespoň 95 % hladiny olova v populaci je či není pod prahovou hodnotou. Interval spolehlivosti a predikční interval nemohou na tuto otázku odpovědět, protože interval spolehlivosti se týká pouze mediánu hladiny olova a predikční interval se týká pouze jedné hladiny olova. To, co je požadováno, je toleranční interval; přesněji řečeno horní toleranční mez. Horní mez tolerance má být vypočtena za podmínky, že alespoň 95 % hladin olova v populaci je pod touto mezí, s určitou hladinou spolehlivosti, řekněme 99 %.
.