El intervalo de tolerancia es menos conocido que el intervalo de confianza y el intervalo de predicción, una situación que algunos educadores han lamentado, ya que puede llevar a un mal uso de los otros intervalos cuando un intervalo de tolerancia es más apropiado.
El intervalo de tolerancia difiere de un intervalo de confianza en que el intervalo de confianza limita un parámetro poblacional de un solo valor (la media o la varianza, por ejemplo) con cierta confianza, mientras que el intervalo de tolerancia limita el rango de valores de los datos que incluye una proporción específica de la población. Mientras que el tamaño de un intervalo de confianza se debe enteramente al error de muestreo, y se acercará a un intervalo de ancho cero en el verdadero parámetro de la población a medida que aumente el tamaño de la muestra, el tamaño de un intervalo de tolerancia se debe en parte al error de muestreo y en parte a la varianza real en la población, y se acercará al intervalo de probabilidad de la población a medida que aumente el tamaño de la muestra.
El intervalo de tolerancia está relacionado con un intervalo de predicción en el sentido de que ambos ponen límites a la variación en muestras futuras. Sin embargo, el intervalo de predicción sólo limita una única muestra futura, mientras que un intervalo de tolerancia limita toda la población (equivalentemente, una secuencia arbitraria de muestras futuras). En otras palabras, un intervalo de predicción cubre una proporción específica de una población en promedio, mientras que un intervalo de tolerancia la cubre con un cierto nivel de confianza, lo que hace que el intervalo de tolerancia sea más apropiado si se pretende que un solo intervalo delimite múltiples muestras futuras.
EjemplosEdit
da el siguiente ejemplo:
Pues considere una vez más un escenario proverbial de prueba de kilometraje de la EPA, en el que varios automóviles nominalmente idénticos de un modelo particular se prueban para producir cifras de kilometraje y 1 , y 2 , . , y n {\displaystyle y_{1},y_{2},…,y_{n}}
. Si estos datos se procesan para producir un intervalo de confianza del 95% para el kilometraje medio del modelo, es posible, por ejemplo, utilizarlo para proyectar el consumo medio o total de gasolina para la flota fabricada de dichos automóviles durante sus primeros 8.000 kilómetros de uso. Sin embargo, este intervalo no sería de gran ayuda para una persona que alquila uno de estos coches y se pregunta si el depósito (lleno) de 10 galones de gasolina le bastará para recorrer los 350 kilómetros hasta su destino. Para ese trabajo, un intervalo de predicción sería mucho más útil. (Considere las diferentes implicaciones de estar «95% seguro» de que μ ≥ 35 {\displaystyle \mu \geq 35}
en lugar de estar «95% seguro» de que y n + 1 ≥ 35 {\displaystyle y_{n+1}\geq 35}
.) Pero tampoco un intervalo de confianza para μ {\displaystyle \mu }
ni un intervalo de predicción para un solo kilometraje adicional es exactamente lo que necesita un ingeniero de diseño encargado de determinar el tamaño del depósito de gasolina que realmente necesita el modelo para garantizar que el 99% de los automóviles producidos tendrán una autonomía de 400 millas. Lo que el ingeniero realmente necesita es un intervalo de tolerancia para una fracción p = .99
de millas de tales autos.
Otro ejemplo viene dado por:
Los niveles de plomo en el aire se recogieron de n = 15 {\displaystyle n=15}
diferentes áreas dentro de la instalación. Se observó que los niveles de plomo transformados en logaritmos se ajustaban bien a una distribución normal (es decir, los datos proceden de una distribución lognormal. Sea μ {\displaystyle \mu }
y σ 2 {\displaystyle \sigma ^{2}}
, respectivamente, denotan la media y la varianza de la población para los datos transformados logarítmicamente. Si X {\displaystyle X}
denota la variable aleatoria correspondiente, tenemos entonces X ∼ N ( μ , σ 2 ) {\displaystyle X\sim {\mathcal {N}}(\mu ,\sigma ^{2})}
. Observamos que exp ( μ ) {\displaystyle \exp(\mu )}
es la mediana del nivel de plomo en el aire. Un intervalo de confianza para μ {\displaystyle \mu }
puede construirse de la forma habitual, basándose en la distribución t; esto, a su vez, proporcionará un intervalo de confianza para la mediana del nivel de plomo en el aire. Si X ¯ {\displaystyle {\bar {X}}
y S {\displaystyle S}
denotan la media muestral y la desviación estándar de los datos transformados logarítmicamente para una muestra de tamaño n, un intervalo de confianza del 95% para μ {\displaystyle \mu }
está dado por X ¯ ± t n – 1 , 0,975 S / ( n ) {\displaystyle {\bar {X}}pm t_{n-1,0,975}S/{{sqrt {}n)}
, donde t m , 1 – α {{displaystyle t_{m,1-{alpha }}
denota el 1 – α {\displaystyle 1-\alpha }
cuantil de una distribución t con m {{displaystyle m}}
grados de libertad. También puede ser interesante derivar un límite de confianza superior del 95% para la mediana del nivel de plomo en el aire. Dicho límite para μ {\displaystyle \mu }
viene dada por X ¯ + t n – 1 , 0,95 S / n {\displaystyle {\bar {X}}+t_{n-1,0,95}S/{sqrt {n}}
. En consecuencia, un límite de confianza superior del 95% para la mediana del plomo del aire viene dado por exp ( X ¯ + t n – 1 , 0,95 S / n ) {\displaystyle \exp {\left({\bar {X}+t_{n-1,0,95}S/{sqrt {n}}right)}
. Supongamos ahora que queremos predecir el nivel de plomo en el aire en una zona concreta del laboratorio. Un límite superior de predicción del 95% para el nivel de plomo transformado por el logaritmo viene dado por X ¯ + t n – 1 , 0,95 S ( 1 + 1 / n ) {\displaystyle {\bar {X}}+t_{n-1,0,95}S{{sqrt {\left(1+1/n\right)}}.
. Un intervalo de predicción de dos lados puede ser calculado de manera similar. El significado y la interpretación de estos intervalos son bien conocidos. Por ejemplo, si el intervalo de confianza X ¯ ± t n – 1 , 0,975 S / n {\displaystyle {\bar {X}}pm t_{n-1,0,975}S/{{sqrt {n}}
se calcula repetidamente a partir de muestras independientes, el 95% de los intervalos así calculados incluirán el verdadero valor de μ {\displaystyle \mu }
, a la larga. En otras palabras, el intervalo está destinado a proporcionar información sobre el parámetro μ {\displaystyle \mu }
únicamente. Un intervalo de predicción tiene una interpretación similar, y está destinado a proporcionar información sobre un único nivel de plomo. Ahora supongamos que queremos utilizar la muestra para concluir si al menos el 95% de los niveles de plomo de la población están por debajo de un umbral. El intervalo de confianza y el intervalo de predicción no pueden responder a esta pregunta, ya que el intervalo de confianza es sólo para la mediana del nivel de plomo, y el intervalo de predicción es sólo para un único nivel de plomo. Lo que se necesita es un intervalo de tolerancia; más concretamente, un límite superior de tolerancia. El límite superior de tolerancia debe calcularse con la condición de que al menos el 95% de los niveles de plomo de la población estén por debajo del límite, con un determinado nivel de confianza, digamos el 99%.