Przedział tolerancji jest mniej powszechnie znany niż przedział ufności i przedział predykcji, nad czym ubolewają niektórzy pedagodzy, ponieważ może to prowadzić do niewłaściwego stosowania innych przedziałów, w przypadku których przedział tolerancji jest bardziej odpowiedni.
Przedział tolerancji różni się od przedziału ufności tym, że przedział ufności ogranicza parametr populacji o jednej wartości (na przykład średnią lub wariancję) z pewną pewnością, natomiast przedział tolerancji ogranicza zakres wartości danych, który obejmuje określoną część populacji. Podczas gdy wielkość przedziału ufności jest całkowicie spowodowana błędem próbkowania i zbliży się do przedziału o zerowej szerokości przy prawdziwym parametrze populacji wraz ze wzrostem wielkości próbki, wielkość przedziału tolerancji jest spowodowana częściowo błędem próbkowania, a częściowo rzeczywistą wariancją w populacji i zbliży się do przedziału prawdopodobieństwa populacji wraz ze wzrostem wielkości próbki.
Przedział tolerancji jest związany z przedziałem predykcji w tym, że oba nakładają granice na zmienność w przyszłych próbkach. Jednakże przedział predykcji ogranicza tylko pojedynczą przyszłą próbkę, podczas gdy przedział tolerancji ogranicza całą populację (równoważnie, arbitralną sekwencję przyszłych próbek). Innymi słowy, przedział predykcji obejmuje średnio określoną część populacji, podczas gdy przedział tolerancji obejmuje ją z pewnym poziomem ufności, dzięki czemu przedział tolerancji jest bardziej odpowiedni, jeśli pojedynczy przedział ma na celu związanie wielu przyszłych próbek.
PrzykładyEdit
podaje następujący przykład:
Rozważmy więc jeszcze raz przysłowiowy scenariusz testu przebiegu EPA, w którym kilka nominalnie identycznych aut danego modelu jest testowanych w celu uzyskania danych dotyczących przebiegu y 1 , y 2 , . . . , y n {{displaystyle y_{1},y_{2},…,y_{n}}
. Jeśli takie dane są przetwarzane w celu uzyskania 95% przedziału ufności dla średniego przebiegu modelu, możliwe jest, na przykład, wykorzystanie go do prognozowania średniego lub całkowitego zużycia benzyny dla wyprodukowanej floty takich samochodów w ciągu pierwszych 5 000 mil ich użytkowania. Taki interwał nie byłby jednak zbyt pomocny dla osoby wynajmującej jeden z tych samochodów i zastanawiającej się, czy (pełny) 10-galonowy zbiornik gazu wystarczy, aby przewieźć ją 350 mil do celu. Dla tego zadania, przedział przewidywań byłby o wiele bardziej użyteczny. (Rozważ różne implikacje bycia „95% pewnym”, że μ ≥ 35
w przeciwieństwie do bycia „95% pewnym”, że y n + 1 ≥ 35 {displaystyle y_{n+1} ≥ 35}
). Ale ani przedział ufności dla μ {displaystyle y_{n+1}}geq 35}
., ani przedział przewidywań dla pojedynczego dodatkowego przebiegu nie jest dokładnie tym, czego potrzebuje inżynier projektant, któremu powierzono zadanie określenia, jak dużego zbiornika gazu model naprawdę potrzebuje, aby zagwarantować, że 99% wyprodukowanych samochodów będzie miało zasięg 400 mil. To, czego inżynier naprawdę potrzebuje, to przedział tolerancji dla ułamka p = .99 {{displaystyle p=.99}}.przebiegów takich aut.
Inny przykład jest podany przez:
Poziomy ołowiu w powietrzu zostały zebrane z n = 15 {przykład n=15}
różnych obszarów w obiekcie. Zauważono, że log-transformowane poziomy ołowiu dobrze pasują do rozkładu normalnego (to znaczy, że dane pochodzą z rozkładu lognormalnego. Niech μ {{displaystyle \mu }
oraz σ 2 {displaystyle ^{2}}, odpowiednio, oznaczają średnią i wariancję populacji dla danych przekształconych logarytmicznie. Jeśli X {{displaystyle X}
oznacza odpowiednią zmienną losową, to mamy X ∼ N ( μ , σ 2 ) {{displaystyle X {{sim {{mathcal {N}}(∼mu ,∼ sigma ^{2})}}
. Zauważamy, że exp ( μ ) {{displaystyle \exp(\mu )}
jest medianą poziomu ołowiu w powietrzu. Przedział ufności dla μ { {displaystyle \mu }
można skonstruować w zwykły sposób, na podstawie rozkładu t; to z kolei dostarczy przedziału ufności dla mediany poziomu ołowiu w powietrzu. Jeśli X ¯ {displaystyle {bar {X}}i S {displaystyle S}
oznaczają średnią z próby i odchylenie standardowe danych przekształconych logarytmicznie dla próby o liczebności n, 95% przedział ufności dla μ {{displaystyle \mu }
jest dany przez X ¯ ± t n – 1 , 0.975 S / ( n ) { {displaystyle {{bar {X}}} t_{n-1,0.975}S/{sqrt {(}}n)}, gdzie t m , 1 – α {{displaystyle t_{m,1-{alpha }}
oznacza 1 – α {displaystyle t_{m,1-alfa }}
kwantyl rozkładu t z m {{displaystyle m}
stopni swobody. Interesujące może być również wyznaczenie 95% górnej granicy ufności dla mediany poziomu ołowiu w powietrzu. Taka granica dla μ {displaystyle ™mu }
jest dany przez X Ż + t n – 1 , 0.95 S / n {displaystyle {bar {X}}+t_{n-1,0.95}S/{sqrt {n}}}. W konsekwencji 95% górna granica ufności dla mediany ołowiu w powietrzu jest dana przez exp ( X Ż + t n – 1 , 0.95 S / n ) {displaystyle \exp {left({{bar {X}}+t_{n-1,0.95}S/{sqrt {n}}}right)}}.
. Załóżmy teraz, że chcemy przewidzieć poziom ołowiu w powietrzu w określonym obszarze laboratorium. Górna granica predykcji 95% dla log-transformowanego poziomu ołowiu jest dana przez X Ż + t n – 1 , 0.95 S ( 1 + 1 / n ) {{displaystyle {{bar {X}}+t_{n-1,0.95} S{{sqrt {{left(1+1/n}}}}}}.
. W podobny sposób można obliczyć dwustronny przedział predykcji. Znaczenie i interpretacja tych przedziałów są dobrze znane. Na przykład, jeśli przedział ufności X ¯ ± t n – 1 , 0.975 S / n {{displaystyle {{bar {X}}}} t_{n-1,0.975}S/{sqrt {n}}}
jest obliczany wielokrotnie na podstawie niezależnych próbek, 95% tak obliczonych przedziałów będzie zawierać prawdziwą wartość μ {displaystyle }
, w długim okresie czasu. Innymi słowy, interwał ma dostarczać informacji dotyczących parametru μ {displaystyle \mu }mutylko i wyłącznie. Przedział predykcji ma podobną interpretację i ma dostarczać informacji dotyczących tylko jednego poziomu ołowiu. Załóżmy teraz, że chcemy wykorzystać próbkę do stwierdzenia, czy co najmniej 95% poziomów ołowiu w populacji jest poniżej pewnego progu. Przedział ufności i przedział predykcji nie mogą odpowiedzieć na to pytanie, ponieważ przedział ufności dotyczy tylko mediany poziomu ołowiu, a przedział predykcji dotyczy tylko jednego poziomu ołowiu. Wymagany jest przedział tolerancji, a dokładniej górna granica tolerancji. Górna granica tolerancji ma być obliczona pod warunkiem, że co najmniej 95% poziomów ołowiu w populacji jest poniżej tej granicy, z pewnym poziomem ufności, powiedzmy 99%..