A toleranciaintervallum kevésbé ismert, mint a konfidenciaintervallum és az előrejelzési intervallum, ami miatt egyes pedagógusok sajnálkoznak, mivel ez a többi intervallum helytelen használatához vezethet, amikor a toleranciaintervallum megfelelőbb lenne.
A toleranciaintervallum abban különbözik a konfidenciaintervallumtól, hogy a konfidenciaintervallum a populáció egyetlen értékű paraméterét (például az átlagot vagy a szórást) korlátozza bizonyos biztonsággal, míg a toleranciaintervallum az adatértékek azon tartományát korlátozza, amely a populáció egy bizonyos hányadát tartalmazza. Míg a konfidenciaintervallum mérete teljes egészében a mintavételi hibának köszönhető, és a minta méretének növekedésével közelít a nulla szélességű intervallumhoz a valódi populációs paraméternél, addig a toleranciaintervallum mérete részben a mintavételi hibának, részben a populáció tényleges szórásának köszönhető, és a minta méretének növekedésével közelít a populáció valószínűségi intervallumához.
A toleranciaintervallum annyiban kapcsolódik az előrejelzési intervallumhoz, hogy mindkettő korlátot szab a jövőbeli minták szórásának. Az előrejelzési intervallum azonban csak egyetlen jövőbeli mintát határol, míg a toleranciaintervallum a teljes sokaságot (vagyis a jövőbeli minták tetszőleges sorozatát) határolja. Más szóval, az előrejelzési intervallum átlagosan a populáció egy meghatározott hányadát fedi le, míg a tűrésintervallum egy bizonyos megbízhatósági szinttel, így a tűrésintervallum megfelelőbb, ha egyetlen intervallummal több jövőbeli mintát kívánunk lehatárolni.
PéldákSzerkesztés
a következő példát adja:
Még egyszer nézzük meg a közmondásos EPA kilométer-teszt forgatókönyvét, amelyben egy adott modell több névlegesen azonos autóját vizsgálják, hogy y 1 , y 2 , … . , y n {\displaystyle y_{1},y_{2},…,y_{n}}}
. Ha az ilyen adatokat úgy dolgozzuk fel, hogy a modell átlagos futásteljesítményére 95%-os konfidenciaintervallumot kapjunk, akkor például felhasználható az ilyen autók gyártott flottájának átlagos vagy teljes benzinfogyasztásának előrejelzésére az első 5000 mérföldes használat során. Egy ilyen intervallum azonban nem sokat segítene egy olyan személynek, aki kibérel egy ilyen autót, és azon töpreng, hogy a (teli) 10 gallonos benzintartály elegendő lesz-e ahhoz, hogy 350 mérföldet megtegyen az úti céljáig. Ehhez a feladathoz sokkal hasznosabb lenne egy előrejelzési intervallum. (Gondoljunk csak arra, hogy milyen eltérő következményei vannak annak, ha “95%-ban biztos”, hogy μ ≥ 35 {\displaystyle \mu \geq 35}
szemben azzal, hogy “95%-ban biztos”, hogy y n + 1 ≥ 35 {\displaystyle y_{n+1}\geq 35}
.). De sem a μ {\displaystyle \mu } konfidenciaintervallumot, sem a μ {\displaystyle \mu }
sem az egyetlen további kilométerre vonatkozó előrejelzési intervallum pontosan az, amire egy tervezőmérnöknek szüksége van, akinek az a feladata, hogy meghatározza, mekkora gáztartályra van valóban szüksége a modellnek ahhoz, hogy garantálja, hogy a gyártott autók 99%-ának 400 mérföldes hatótávolsága lesz. Amire a mérnöknek valójában szüksége van, az egy p = .99 {\displaystyle p=.99} törtrész toleranciaintervalluma.
az ilyen autók futásteljesítményének egy része.
Egy másik példa a következő:
A levegő ólomszintjét n=15 {\displaystyle n=15}
különböző területekről a létesítményen belül. Megállapították, hogy a log-transzformált ólomszintek jól illeszkednek a normális eloszláshoz (vagyis az adatok lognormális eloszlásból származnak. Legyen μ {\displaystyle \mu }
és σ 2 {\displaystyle \sigma ^{2}}
jelölik a log-transzformált adatok populációs átlagát és varianciáját. Ha X {\displaystyle X}
a megfelelő véletlen változót jelöli, akkor tehát X ∼ N ( μ , σ 2 ) {\displaystyle X\sim {\mathcal {N}}(\mu , \sigma ^{2})}
. Megjegyezzük, hogy exp ( μ ) {\displaystyle \exp(\mu )}
a levegő ólomszintjének mediánja. A μ {\displaystyle \mu } bizalmi intervalluma
a szokásos módon, a t-eloszlás alapján konstruálható; ez viszont a levegő ólomszintjének mediánjára vonatkozó konfidenciaintervallumot adja meg. Ha X ¯ {\displaystyle {\bar {X}}}
és S {\displaystyle S}
jelöli a log-transzformált adatok mintaátlagát és szórását egy n méretű mintára, akkor a μ {\displaystyle \mu} 95%-os konfidenciaintervallumát
a következő: X ¯ ± t n – 1 , 0.975 S / ( n ) {\displaystyle {\bar {X}}\pm t_{n-1,0.975}S/{\sqrt {(}}n)}
, ahol t m , 1 – α {\displaystyle t_{m,1-\alpha }}
az 1 – α {\displaystyle 1-\alpha }
kvantilisét egy t-eloszlás m {\displaystyle m}
szabadsági fokokkal. Az is érdekes lehet, ha levezetjük a levegő ólomszintjének mediánjára vonatkozó 95%-os felső konfidenciahatárt. Egy ilyen korlát μ {\displaystyle \mu }
a következő: X ¯ + t n – 1 , 0.95 S / n {\displaystyle {\bar {\X}}+t_{n-1,0.95}S/{\sqrt {n}}}}
. Következésképpen a levegő ólom mediánjának 95%-os felső konfidenciahatára a következő: exp ( X ¯ + t n – 1 , 0.95 S / n ) {\displaystyle \exp {\left({\bar {X}}+t_{n-1,0.95}S/{\sqrt {n}}\right)}}
. Most tegyük fel, hogy meg akarjuk jósolni a levegő ólomszintjét egy adott területen a laboratóriumban. A log-transzformált ólomszint 95%-os felső előrejelzési határa a következő: X ¯ + t n – 1 , 0.95 S ( 1 + 1 / n ) {\displaystyle {\bar {\X}}+t_{n-1,0.95}S{\sqrt {\left(1+1/n\right)}}}}
. Hasonlóan kiszámítható a kétoldali előrejelzési intervallum is. Ezen intervallumok jelentése és értelmezése jól ismert. Például, ha az X ¯ ± t n – 1 , 0.975 S / n {\displaystyle {\bar {X}}\pm t_{n-1,0.975}S/{\sqrt {n}}} bizalmi intervallum
ismételten kiszámítjuk független mintákból, az így kiszámított intervallumok 95%-a tartalmazza μ {\displaystyle \mu } valódi értékét.
, hosszú távon. Más szóval, az intervallum a μ {\displaystyle \mu } paraméterre vonatkozó információt hivatott szolgáltatni.
kizárólag. Az előrejelzési intervallum hasonló értelmezéssel bír, és csak egyetlen vezetési szintre vonatkozó információt hivatott szolgáltatni. Most tegyük fel, hogy a minta alapján arra szeretnénk következtetni, hogy a populáció ólomszintjének legalább 95%-a egy küszöbérték alatt van-e vagy sem. A konfidenciaintervallum és az előrejelzési intervallum nem tud választ adni erre a kérdésre, mivel a konfidenciaintervallum csak a medián ólomszintre, az előrejelzési intervallum pedig csak egyetlen ólomszintre vonatkozik. Amire szükség van, az egy tűrésintervallum, pontosabban egy felső tűréshatár. A felső tűréshatárt azzal a feltétellel kell kiszámítani, hogy a populáció ólomszintjeinek legalább 95%-a a határérték alatt van, egy bizonyos megbízhatósági szinttel, mondjuk 99%-kal.