L’intervalle de tolérance est moins connu que l’intervalle de confiance et l’intervalle de prédiction, une situation que certains éducateurs ont déplorée, car elle peut conduire à une mauvaise utilisation des autres intervalles lorsqu’un intervalle de tolérance est plus approprié.
L’intervalle de tolérance diffère d’un intervalle de confiance en ce que l’intervalle de confiance délimite un paramètre de population à valeur unique (la moyenne ou la variance, par exemple) avec une certaine confiance, tandis que l’intervalle de tolérance délimite la plage de valeurs des données qui inclut une proportion spécifique de la population. Alors que la taille d’un intervalle de confiance est entièrement due à l’erreur d’échantillonnage, et s’approchera d’un intervalle de largeur nulle au niveau du vrai paramètre de la population lorsque la taille de l’échantillon augmente, la taille d’un intervalle de tolérance est due en partie à l’erreur d’échantillonnage et en partie à la variance réelle dans la population, et s’approchera de l’intervalle de probabilité de la population lorsque la taille de l’échantillon augmente.
L’intervalle de tolérance est lié à un intervalle de prédiction en ce sens que les deux mettent des limites à la variation dans les échantillons futurs. Cependant, l’intervalle de prédiction ne limite qu’un seul échantillon futur, alors qu’un intervalle de tolérance limite la population entière (de manière équivalente, une séquence arbitraire d’échantillons futurs). En d’autres termes, un intervalle de prédiction couvre une proportion spécifiée d’une population en moyenne, alors qu’un intervalle de tolérance la couvre avec un certain niveau de confiance, ce qui rend l’intervalle de tolérance plus approprié si un seul intervalle est destiné à délimiter plusieurs échantillons futurs.
ExemplesLa modification
donne l’exemple suivant :
Si l’on considère une fois de plus un scénario proverbial de test de kilométrage de l’EPA, dans lequel plusieurs automobiles nominalement identiques d’un modèle particulier sont testées pour produire des chiffres de kilométrage y 1 , y 2 , …. , y n {\displaystyle y_{1},y_{2},…,y_{n}}
. Si de telles données sont traitées pour produire un intervalle de confiance de 95% pour le kilométrage moyen du modèle, il est, par exemple, possible de l’utiliser pour projeter la consommation moyenne ou totale d’essence pour la flotte fabriquée de ces automobiles sur leurs 5 000 premiers kilomètres d’utilisation. Un tel intervalle ne serait toutefois pas d’une grande utilité pour une personne louant l’une de ces voitures et se demandant si le réservoir (plein) de 10 gallons d’essence suffira à lui faire parcourir les 350 miles jusqu’à sa destination. Pour cette tâche, un intervalle de prédiction serait beaucoup plus utile. (Considérez les différentes implications d’être « sûr à 95 % » que μ ≥ 35 {\displaystyle \mu \geq 35}.
par opposition à être « sûr à 95% » que y n + 1 ≥ 35 {\displaystyle y_{n+1}\geq 35}
.) Mais ni un intervalle de confiance pour μ {\displaystyle \mu }
ni un intervalle de prédiction pour un seul kilométrage supplémentaire n’est exactement ce dont a besoin un ingénieur concepteur chargé de déterminer la taille du réservoir d’essence dont le modèle a réellement besoin pour garantir que 99% des autos produites auront une autonomie de 400 miles. Ce dont l’ingénieur a réellement besoin, c’est d’un intervalle de tolérance pour une fraction p = .99 {\displaystyle p=.99}
des kilométrages de telles autos.
Un autre exemple est donné par :
Les niveaux de plomb dans l’air ont été recueillis auprès de n = 15 {\displaystyle n=15}.
différentes zones de l’établissement. On a remarqué que les niveaux de plomb transformés en logarithme s’adaptaient bien à une distribution normale (c’est-à-dire que les données proviennent d’une distribution lognormale. Soit μ {\displaystyle \mu }
et σ 2 {\displaystyle \sigma ^{2}}
, respectivement, désignent la moyenne et la variance de la population pour les données transformées en logarithme. Si X {\displaystyle X}
désigne la variable aléatoire correspondante, on a donc X ∼ N ( μ , σ 2 ) {\displaystyle X\sim {\mathcal {N}}(\mu ,\sigma ^{2})}
. On note que exp ( μ ) {\displaystyle \exp(\mu )}
est la médiane du niveau de plomb dans l’air. Un intervalle de confiance pour μ {\displaystyle \mu }
peut être construit de la manière habituelle, sur la base de la distribution t ; cela fournira à son tour un intervalle de confiance pour le niveau médian de plomb dans l’air. Si X ¯ {\displaystyle {\bar {X}}}
et S {\displaystyle S}
désignent la moyenne de l’échantillon et l’écart type des données transformées en logarithme pour un échantillon de taille n, un intervalle de confiance à 95 % pour μ {\displaystyle \mu }.
est donné par X ¯ ± t n – 1 , 0,975 S / ( n ) {\displaystyle {\bar {X}}\pm t_{n-1,0.975}S/{\sqrt {(}}n)}
, où t m , 1 – α {\displaystyle t_{m,1-\alpha }}
désigne la 1 – α {\displaystyle 1-\alpha }
quantile d’une distribution t avec m {\displaystyle m}
degrés de liberté. Il peut également être intéressant de dériver une borne de confiance supérieure à 95 % pour la médiane de la plombémie. Une telle limite pour μ {\displaystyle \mu }
est donnée par X ¯ + t n – 1 , 0,95 S / n {\displaystyle {\bar {X}}+t_{n-1,0.95}S/{\sqrt {n}}}.
. Par conséquent, une limite supérieure de confiance de 95 % pour la médiane de la plombémie est donnée par exp ( X ¯ + t n – 1 , 0,95 S / n ) {\displaystyle \exp {\left({\bar {X}}+t_{n-1,0.95}S/{\sqrt {n}}\right)}}.
. Supposons maintenant que l’on veuille prédire la teneur en plomb de l’air dans une zone particulière du laboratoire. Une limite supérieure de prédiction de 95% pour le niveau de plomb transformé en logarithme est donnée par X ¯ + t n – 1 , 0,95 S ( 1 + 1 / n ) {\displaystyle {\bar {X}}+t_{n-1,0.95}S{\sqrt {\left(1+1/n\right)}}.
. Un intervalle de prédiction bilatéral peut être calculé de manière similaire. La signification et l’interprétation de ces intervalles sont bien connues. Par exemple, si l’intervalle de confiance X ¯ ± t n – 1 , 0,975 S / n {\displaystyle {\bar {X}}\pm t_{n-1,0.975}S/{\sqrt {n}}}
est calculé de manière répétée à partir d’échantillons indépendants, 95% des intervalles ainsi calculés incluront la vraie valeur de μ {\displaystyle \mu }.
, à long terme. En d’autres termes, l’intervalle est censé fournir des informations concernant le paramètre μ {\displaystyle \mu }
uniquement. Un intervalle de prédiction a une interprétation similaire, et est destiné à fournir des informations concernant un seul niveau de plomb seulement. Supposons maintenant que nous voulions utiliser l’échantillon pour conclure si oui ou non au moins 95% des niveaux de plomb de la population sont inférieurs à un seuil. L’intervalle de confiance et l’intervalle de prédiction ne peuvent pas répondre à cette question, puisque l’intervalle de confiance ne concerne que la plombémie médiane, et l’intervalle de prédiction ne concerne qu’une seule plombémie. Ce qu’il faut, c’est un intervalle de tolérance ; plus précisément, une limite de tolérance supérieure. La limite de tolérance supérieure doit être calculée à la condition qu’au moins 95% des niveaux de plomb de la population soient inférieurs à la limite, avec un certain niveau de confiance, disons 99%.