O intervalo de tolerância é menos conhecido que o intervalo de confiança e o intervalo de previsão, situação que alguns educadores lamentaram, pois pode levar ao mau uso dos outros intervalos onde um intervalo de tolerância é mais apropriado.
O intervalo de tolerância difere de um intervalo de confiança na medida em que o intervalo de confiança limita com alguma confiança um parâmetro de população de valor único (a média ou a variância, por exemplo), enquanto o intervalo de tolerância limita o intervalo de valores de dados que inclui uma proporção específica da população. Enquanto o tamanho de um intervalo de confiança é inteiramente devido a erro de amostragem, e se aproximará de um intervalo de largura zero no parâmetro de população real à medida que o tamanho da amostra aumenta, o tamanho de um intervalo de tolerância é devido em parte a erro de amostragem e em parte à variância real na população, e se aproximará do intervalo de probabilidade da população à medida que o tamanho da amostra aumenta.
O intervalo de tolerância está relacionado a um intervalo de previsão, na medida em que ambos colocam limites de variação em amostras futuras. No entanto, o intervalo de previsão só limita uma única amostra futura, enquanto um intervalo de tolerância limita toda a população (equivalentemente, uma sequência arbitrária de amostras futuras). Em outras palavras, um intervalo de previsão cobre uma proporção especificada de uma população em média, enquanto um intervalo de tolerância o cobre com um certo nível de confiança, tornando o intervalo de tolerância mais apropriado se um único intervalo for destinado a delimitar várias amostras futuras.
ExemplosEditar
dá o exemplo a seguir:
Então considere mais uma vez um cenário proverbial de teste de quilometragem EPA, no qual vários autos nominalmente idênticos de um determinado modelo são testados para produzir números de quilometragem y 1 , y 2 , . . , y n {\displaystyle y_{1},y_{2},…,y_{n}}}
. Se esses dados forem processados para produzir um intervalo de confiança de 95% para a quilometragem média do modelo, é possível, por exemplo, usá-los para projetar o consumo médio ou total de gasolina para a frota fabricada de tais automóveis ao longo de suas primeiras 5.000 milhas de uso. Tal intervalo, porém, não seria de grande ajuda para uma pessoa que aluga um desses carros e se pergunta se o tanque (cheio) de 10 galões de gasolina será suficiente para carregá-lo até as 350 milhas até o seu destino. Para esse trabalho, um intervalo de previsão seria muito mais útil. (Considere as diferentes implicações de ter “95% de certeza” que μ ≥ 35 {\i1}displaystyle {\i}geq 35
em vez de ter “95% de certeza” que y n + 1 ≥ 35 {\displaystyle y_{n+1}geq 35}
.) Mas nem um intervalo de confiança para μ {\n+1}displaystyle {\n+2}
nem um intervalo de previsão para uma única quilometragem adicional é exactamente o que é necessário para um engenheiro de design encarregado de determinar o tamanho de um tanque de gás que o modelo realmente precisa para garantir que 99% dos automóveis produzidos terão um alcance de cruzeiro de 400 milhas. O que o engenheiro realmente precisa é de um intervalo de tolerância para uma fração p = .99 {\displaystyle p=.99}
de quilometragem de tais autos.
Um outro exemplo é dado por:
Os níveis de chumbo aéreo foram coletados de n = 15 {\displaystyle n=15}
diferentes áreas dentro da instalação. Foi observado que os níveis de chumbo logtransformado se ajustaram bem a uma distribuição normal (ou seja, os dados são de uma distribuição lognormal). Deixe μ {\displaystyle \mu }
e σ 2 ^{\i1}displaystyle ^{\i}
, respectivamente, denotam a média e a variância da população para os dados log-transformados. Se X {\displaystyle X}
denota a variável aleatória correspondente, temos assim X ∼ N ( μ , σ 2 ) {\displaystyle X\sim ^{\mu ,^sigma ^{2}}(^\mu ,^sigma ^{2})}
. Notamos que a exp ( μ ) exp(mu ,xp(mu )}
é o nível médio de chumbo do ar. Um intervalo de confiança para μ {\\i1}displaystyle {\i}
pode ser construído da forma usual, com base na distribuição t; isto, por sua vez, proporcionará um intervalo de confiança para o nível médio de chumbo do ar. Se X ¯ ¯bar ¯x
e S {\i1}displaystyle S
denota a média amostral e o desvio padrão dos dados logarítmicos transferidos para uma amostra de tamanho n, um intervalo de confiança de 95% para μ {\\i}
é dado por X ¯ ± t n – 1 , 0,975 S / ( n ) {\\i}{\i1}pm t_{n-1,0,975}S/{\i}sqrt {(}}n)}
, onde t m , 1 – α {\i1}displaystyle t_{m,1-alpha }}
denota o 1 – α {\i1}displaystyle 1-alfa }
quantil de uma distribuição em t com m m
graus de liberdade. Também pode ser interessante derivar uma confiança superior de 95% para o nível mediano de chumbo do ar. Um tal limite para μ {\i1}displaystyle {\i}
. Consequentemente, um limite superior de 95% de confiança para a mediana do chumbo aéreo é dado por exp ( X ¯ + t n – 1 , 0.95 S / n ) {\i1}exp {\i1}esquerda({\i}+t_{n-1,0.95}S/{\i}S/{\i}{\i}}{\i1}S/{\i}direita){\i}
>2232>exp {{\i1}esquerda(X}}+t_{n-1,0.95}}S/{\i1,0.95}S/{\i}direita)}9987>. Agora suponha que queremos prever o nível de chumbo do ar em uma área particular dentro do laboratório. Um limite superior de previsão de 95% para o nível de chumbo logtransformado é dado por X ¯ + t n – 1 , 0,95 S ( 1 + 1 / n ) {\i1}displaystyle {\i}+t_{n-1,0,95}S{\i}Sqrt {\i1+1/n direita)}
. Um intervalo de previsão em dois lados pode ser calculado de forma semelhante. O significado e a interpretação destes intervalos são bem conhecidos. Por exemplo, se o intervalo de confiança X ¯ ± t n – 1 , 0,975 S / n {\i1}{\i1}displaystyle {\i}{\i}pm t_{n-1,0,975}S/{\i}Sqrt {\i}}
é calculado repetidamente a partir de amostras independentes, 95% dos intervalos assim calculados incluirão o verdadeiro valor de μ {\i}displaystyle {\i}
, a longo prazo. Em outras palavras, o intervalo destina-se a fornecer informações sobre o parâmetro μ {\i1}displaystyle {\i}
apenas. Um intervalo de previsão tem uma interpretação semelhante, e destina-se a fornecer informações relativas apenas a um único nível de chumbo. Agora suponha que queremos usar a amostra para concluir se pelo menos 95% dos níveis de chumbo da população estão ou não abaixo de um limiar. O intervalo de confiança e o intervalo de previsão não podem responder a essa pergunta, pois o intervalo de confiança é apenas para o nível de chumbo mediano, e o intervalo de previsão é apenas para um único nível de chumbo. O que é necessário é um intervalo de tolerância; mais especificamente, um limite de tolerância superior. O limite de tolerância superior deve ser calculado com a condição de que pelo menos 95% dos níveis de chumbo da população estejam abaixo do limite, com um certo nível de confiança, digamos 99%.