Interval de toleranță

Articol principal: Estimare pe intervale

Intervalul de toleranță este mai puțin cunoscut decât intervalul de încredere și intervalul de predicție, situație pe care unii educatori au deplâns-o, deoarece poate duce la utilizarea greșită a celorlalte intervale în cazul în care un interval de toleranță este mai adecvat.

Intervalul de toleranță diferă de intervalul de încredere prin faptul că intervalul de încredere delimitează un parametru al populației cu o singură valoare (media sau varianța, de exemplu) cu o anumită încredere, în timp ce intervalul de toleranță delimitează intervalul de valori ale datelor care include o anumită proporție din populație. În timp ce mărimea unui interval de încredere se datorează în întregime erorii de eșantionare și se va apropia de un interval de lățime zero la parametrul adevărat al populației pe măsură ce mărimea eșantionului crește, mărimea unui interval de toleranță se datorează parțial erorii de eșantionare și parțial variației reale din populație și se va apropia de intervalul de probabilitate al populației pe măsură ce mărimea eșantionului crește.

Intervalul de toleranță este înrudit cu un interval de predicție prin faptul că ambele pun limite la variația din eșantioanele viitoare. Cu toate acestea, intervalul de predicție delimitează doar un singur eșantion viitor, în timp ce un interval de toleranță delimitează întreaga populație (în mod echivalent, o secvență arbitrară de eșantioane viitoare). Cu alte cuvinte, un interval de predicție acoperă în medie o anumită proporție a unei populații, în timp ce un interval de toleranță o acoperă cu un anumit nivel de încredere, ceea ce face ca intervalul de toleranță să fie mai adecvat dacă un singur interval este destinat să delimiteze mai multe eșantioane viitoare.

ExempleEdit

oferă următorul exemplu:

Considerăm încă o dată scenariul proverbial al testului de kilometraj EPA, în care mai multe autoturisme nominal identice ale unui anumit model sunt testate pentru a produce cifrele de kilometraj y 1 , y 2 , . . . , y n {\displaystyle y_{1},y_{2},…,y_{n}}}.

y_{1},y_{2},...,y_{n}

. Dacă astfel de date sunt prelucrate pentru a produce un interval de încredere de 95% pentru kilometrajul mediu al modelului, este posibil, de exemplu, să se utilizeze pentru a proiecta consumul mediu sau total de benzină pentru flota fabricată de astfel de autoturisme pe parcursul primelor 5.000 de mile de utilizare. Cu toate acestea, un astfel de interval nu ar fi de mare ajutor pentru o persoană care închiriază una dintre aceste mașini și se întreabă dacă rezervorul (plin) de 10 galoane de benzină va fi suficient pentru a parcurge cele 350 de mile până la destinație. Pentru această sarcină, un interval de predicție ar fi mult mai util. (Luați în considerare implicațiile diferite ale faptului de a fi „95% sigur” că μ ≥ 35 {\displaystyle \mu \geq 35}

\mu \geq 35

spre deosebire de a fi „95% sigur” că y n + 1 ≥ 35 {\displaystyle y_{n+1}\geq 35}

y_{{n+1}}\geq 35

.) Dar nici un interval de încredere pentru μ {\displaystyle \mu }

\mu

nici un interval de predicție pentru un singur kilometraj suplimentar nu este exact ceea ce are nevoie un inginer de proiectare însărcinat să determine cât de mare este rezervorul de benzină de care are nevoie cu adevărat modelul pentru a garanta că 99% dintre automobilele produse vor avea o autonomie de croazieră de 400 de mile. Ceea ce are nevoie cu adevărat inginerul este un interval de toleranță pentru o fracțiune p = 0,99 {\displaystyle p=.99}.

p=.99

din kilometrii parcurși de astfel de automobile.

Un alt exemplu este dat de:

Nivelurile de plumb din aer au fost colectate de la n = 15 {\displaystyle n=15}

n=15

zone diferite din cadrul instalației. S-a observat că nivelurile de plumb transformate în logaritmi se potrivesc bine unei distribuții normale (adică datele provin dintr-o distribuție lognormală. Fie μ {\displaystyle \mu }

\mu

și σ 2 {\displaystyle \sigma ^{2}}

\sigma ^{2}

, respectiv, desemnează media și varianța populației pentru datele transformate în logaritm. Dacă X {\displaystyle X}

X

denotă variabila aleatoare corespunzătoare, avem astfel X ∼ N ( μ , σ 2 ) {\displaystyle X\sim {\mathcal {N}}(\mu ,\sigma ^{2})}

X\sim {\mathcal {N}}(\mu ,\sigma ^{2})

. Observăm că exp ( μ ) {\displaystyle \exp(\mu )}

{\displaystyle \exp(\mu )}

este nivelul median de plumb din aer. Un interval de încredere pentru μ {\displaystyle \mu }

\mu

poate fi construit în mod obișnuit, pe baza distribuției t; acesta, la rândul său, va furniza un interval de încredere pentru nivelul median al plumbului din aer. Dacă X ¯ {\displaystyle {\bar {X}}}}

{\bar {X}}

și S {\displaystyle S}

S

reprezintă media eșantionului și abaterea standard a datelor transformate logaritmic pentru un eșantion de dimensiune n, un interval de încredere de 95% pentru μ {\displaystyle \mu }

\mu

este dat de X ¯ ± t n – 1 , 0,975 S / ( n ) {\displaystyle {\bar {X}}\pm t_{n-1,0,975}S/{\sqrt {(}}n)}

{\bar {X}}\pm t_{{n-1,0.975}}S/{\sqrt (}n)

, unde t m , 1 – α {\displaystyle t_{m,1-\alpha }}

t_{{m,1-\alpha }}

reprezintă 1 – α {\displaystyle 1-\alpha }

1-\alpha

cuantila unei distribuții t cu m {\displaystyle m}

m

grade de libertate. De asemenea, poate fi interesant să se obțină o limită superioară de încredere de 95% pentru nivelul median de plumb din aer. O astfel de limită pentru μ {\displaystyle \mu }

\mu

este dată de X ¯ + t n – 1 , 0.95 S / n {\displaystyle {\bar {X}}+t_{n-1,0.95}S/{\sqrt {n}}}.

{\bar {X}}+t_{{n-1,0.95}}S/{\sqrt {n}}

. În consecință, o limită superioară de încredere de 95% pentru mediana plumbului din aer este dată de exp ( X ¯ + t n – 1 , 0.95 S / n ) {\displaystyle \exp {\left({\bar {X}}+t_{n-1,0.95}S/{\sqrt {n}}\right)}}}.

\exp {\left({\bar {X}}+t_{{{n-1,0.95}}S/{\sqrt {n}}\right)}

. Să presupunem acum că dorim să prezicem nivelul de plumb din aer într-o anumită zonă din cadrul laboratorului. O limită superioară de predicție de 95% pentru nivelul de plumb transformat logaritmic este dată de X ¯ + t n – 1 , 0.95 S ( 1 + 1 / n ) {\displaystyle {\bar {X}}+t_{n-1,0.95}S{\sqrt {\left(1+1/n\right)}}}.

{\bar {X}}+t_{{n-1,0.95}}S{\sqrt {\left(1+1/n\right)}}

. Un interval de predicție cu două laturi poate fi calculat în mod similar. Semnificația și interpretarea acestor intervale sunt bine cunoscute. De exemplu, în cazul în care intervalul de încredere X ¯ ± t n – 1 , 0,975 S / n {\displaystyle {\bar {X}}\pm t_{n-1,0.975}S/{\sqrt {n}}}}

{\bar {X}}\pm t_{{n-1,0.975}}S/{\sqrt {n}}

este calculat în mod repetat din eșantioane independente, 95% din intervalele astfel calculate vor include adevărata valoare a lui μ {\displaystyle \mu }

\mu

, pe termen lung. Cu alte cuvinte, intervalul este menit să furnizeze informații cu privire la parametrul μ {\displaystyle \mu }

\mu

numai

\mu

. Un interval de predicție are o interpretare similară și este menit să furnizeze informații referitoare doar la un singur nivel de plumb. Să presupunem acum că dorim să folosim eșantionul pentru a concluziona dacă cel puțin 95% din nivelurile de plumb din populație sunt sau nu sub un prag. Intervalul de încredere și intervalul de predicție nu pot răspunde la această întrebare, deoarece intervalul de încredere se referă doar la nivelul median de plumb, iar intervalul de predicție se referă doar la un singur nivel de plumb. Ceea ce este necesar este un interval de toleranță; mai precis, o limită superioară de toleranță. Limita superioară de toleranță trebuie calculată cu condiția ca cel puțin 95% din nivelurile de plumb din populație să fie sub limită, cu un anumit nivel de încredere, de exemplu 99%.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.