Toleranssiväli

Pääartikkeli: Intervalliestimointi

Toleranssiväli on vähemmän tunnettu kuin luottamusväli ja ennustusväli, mikä on joidenkin kasvatustieteilijöiden mielestä valitettavaa, sillä se voi johtaa muiden intervallien väärinkäyttöön silloin, kun toleranssiväli on tarkoituksenmukaisempi.

Toleranssiväli eroaa luottamusvälistä siinä, että luottamusväli rajaa yksittäisen arvoisen populaatioparametrin (esimerkiksi keskiarvon tai varianssin) jollakin varmuudella, kun taas toleranssiväli rajaa datan arvojen vaihteluvälialueen, joka pitää sisällään tietyn prosenttiosuuden populaatiosta. Siinä missä luottamusvälin koko johtuu kokonaan otantavirheestä ja lähestyy otoskoon kasvaessa todellisen populaatioparametrin kohdalla nollaleveyttä, toleranssivälin koko johtuu osittain otantavirheestä ja osittain populaation todellisesta varianssista ja lähestyy otoskoon kasvaessa populaation todennäköisyysväliä.

Toleranssiväli liittyy ennusteväliin siten, että molemmat rajoittavat tulevien otosten vaihtelua. Ennustusväli rajoittaa kuitenkin vain yhtä tulevaa näytettä, kun taas toleranssiväli rajoittaa koko populaatiota (vastaavasti mielivaltaista tulevien näytteiden sarjaa). Toisin sanoen ennustusväli kattaa keskimäärin tietyn osuuden populaatiosta, kun taas toleranssiväli kattaa populaation tietyllä luotettavuustasolla, jolloin toleranssiväli on sopivampi, jos yhdellä väliajalla on tarkoitus rajata useita tulevia otoksia.

EsimerkkejäMuutos

antaa seuraavan esimerkin:

Tarkastellaan siis vielä kerran sananlaskuista EPA:n ajokilometritestiskenaariota, jossa useita nimellisesti identtisiä tietyn mallin autoja testataan tuottamaan ajokilometrilukuja y 1 , y 2 , … . , y n {\displaystyle y_{1},y_{2},…,y_{n}}}

y_{1},y_{2},...,y_{n}

. Jos tällaisia tietoja käsitellään siten, että saadaan 95 prosentin luottamusväli mallin keskimääräiselle ajokilometrimäärälle, sen avulla voidaan esimerkiksi ennustaa tällaisten autojen valmistetun autokannan keskimääräinen tai kokonaisbensiininkulutus niiden ensimmäisten 5 000 kilometrin ajalta. Tällaisesta välistä ei kuitenkaan olisi paljon apua henkilölle, joka vuokraa tällaisen auton ja miettii, riittääkö (täysi) 10 gallonan bensatankki kuljettamaan hänet 350 mailin matkan määränpäähänsä. Tätä varten ennustusväli olisi paljon hyödyllisempi. (Mieti, mitä erilaisia vaikutuksia on sillä, että on ”95 % varma” siitä, että μ ≥ 35 {\displaystyle \mu \geq 35}

\mu \geq 35

verrattuna siihen, että on ”95 % varma”, että y n + 1 ≥ 35 {\displaystyle y_{n+1}\geq 35}

y_{{n+1}}\geq 35

.). Mutta ei myöskään luottamusväliä μ:lle {\displaystyle \mu }

\mu

eikä yhden lisäkilometrimäärän ennustusväli ole juuri sitä, mitä suunnitteluinsinööri, jonka tehtävänä on määrittää, kuinka suuri bensatankki mallissa todella tarvitaan, jotta voidaan taata, että 99 prosentilla valmistetuista autoista on 400 mailin matkustusmatka. Se, mitä insinööri todella tarvitsee, on toleranssiväli murto-osalle p = .99 {\displaystyle p=.99}

p=.99

tällaisten autojen ajokilometreistä.

Toinen esimerkki on annettu:

A ilman lyijypitoisuudet kerättiin n=15 {\displaystyle n=15}

n=15

eri alueilta laitoksen sisällä. Todettiin, että log-muunnetut lyijytasot sopivat hyvin normaalijakaumaan (eli tiedot ovat lognormaalijakaumasta. Olkoon μ {\displaystyle \mu}

\mu

ja σ 2 {\displaystyle \sigma ^{2}}

\sigma ^{2}

kuvaavat vastaavasti log-muunnetun aineiston populaation keskiarvoa ja varianssia. Jos X {\displaystyle X}

X

tarkoittaa vastaavaa satunnaismuuttujaa, meillä on siis X ∼ N ( μ , σ 2 ) {\displaystyle X\sim {\mathcal {N}}(\mu ,\sigma ^{2})} }

X\sim {\mathcal {N}}(\mu ,\sigma ^{2})

. Huomataan, että exp ( μ ) {\displaystyle \exp(\mu )}

{\displaystyle \exp(\mu )}

on ilman lyijytason mediaani. Luottamusväli μ {\displaystyle \mu }

\mu

voidaan muodostaa tavalliseen tapaan t-jakauman perusteella; tämä puolestaan antaa luottamusvälin ilman lyijytason mediaanille. Jos X ¯ {\displaystyle {\bar {X}}}

{\bar {X}}

ja S {\displaystyle S}

S

merkitsevät log-muunnettujen tietojen otoskeskiarvoa ja keskihajontaa n-kokoiselle otokselle, 95 %:n luottamusväli μ {\displaystyle \mu }

\mu

on seuraava: X ¯ ± t n – 1 , 0.975 S / ( n ) {\displaystyle {\bar {X}}\pm t_{n-1,0.975}S/{\sqrt {(}}n)}

{\bar {X}}\pm t_{{n-1,0.975}}S/{\sqrt (}n)

, missä t m , 1 – α {\displaystyle t_{m,1-\alpha }}

t_{m,1-\alpha }}

tarkoittaa 1 – α {\displaystyle 1-\alpha }

1-\alpha

kvantiili t-jakaumassa, jossa m {\displaystyle m}

m

vapausasteita. Voi myös olla kiinnostavaa johtaa 95 prosentin ylempi luottamusraja ilman lyijypitoisuuden mediaanille. Tällainen raja μ {\displaystyle \mu }

\mu

saadaan kaavalla X ¯ + t n – 1 , 0.95 S / n {\displaystyle {\bar {X}}+t_{n-1,0.95}S/{\sqrt {n}}}}

{\bar {X}}+t_{{n-1,0.95}}S/{\sqrt {n}}

. Näin ollen 95 %:n ylempi luottamusraja ilman lyijyn mediaanille saadaan seuraavasti: exp ( X ¯ + t n – 1 , 0.95 S / n ) {\displaystyle \exp {\left({\bar {X}}+t_{n-1,0.95}S/{\sqrt {n}}\right)}}

\exp {\left({\bar {X}}+t_{{n-1,0.95}}S/{\sqrt {n}}\right)}

. Oletetaan nyt, että haluamme ennustaa ilman lyijypitoisuuden tietyllä alueella laboratoriossa. Log-muunnetun lyijytason 95 %:n ylempi ennusteraja on seuraava: X ¯ + t n – 1 , 0.95 S ( 1 + 1 / n ) {\displaystyle {\bar {\X}}+t_{n-1,0.95}S{\sqrt {\left(1+1/n\right)}}}}

{\bar {X}}+t_{n-1,0.95}}S{\sqrt {\left(1+1/n\right)}}

. Kaksipuolinen ennustusväli voidaan laskea vastaavalla tavalla. Näiden intervallien merkitys ja tulkinta tunnetaan hyvin. Jos esimerkiksi luottamusväli X ¯ ± t n – 1 , 0.975 S / n {\displaystyle {\bar {X}}\pm t_{n-1,0.975}S/{\sqrt {n}}}

{\bar {X}}\pm t_{{n-1,0.975}}S/{\sqrt {n}}

lasketaan toistuvasti riippumattomista otoksista, 95 % näin lasketuista väleistä sisältää todellisen arvon μ {\displaystyle \mu }

\mu

, pitkällä aikavälillä. Toisin sanoen intervalli on tarkoitettu antamaan tietoa parametrista μ {\displaystyle \mu }

\mu

ainoastaan. Ennustevälillä on samanlainen tulkinta, ja sen tarkoituksena on antaa tietoa vain yhdestä johtotasosta. Oletetaan nyt, että otoksen avulla halutaan päätellä, onko vähintään 95 % populaation lyijypitoisuuksista tietyn raja-arvon alapuolella vai ei. Luottamusväli ja ennustusväli eivät voi vastata tähän kysymykseen, koska luottamusväli koskee vain lyijytason mediaania ja ennustusväli vain yhtä lyijytasoa. Tarvitaan toleranssiväli, tarkemmin sanottuna ylempi toleranssiraja. Ylempi toleranssiraja on laskettava sillä edellytyksellä, että vähintään 95 % populaation lyijytasoista on rajan alapuolella tietyllä luotettavuustasolla, esimerkiksi 99 %.

Vastaa

Sähköpostiosoitettasi ei julkaista.