許容区間は信頼区間や予測区間に比べてあまり知られていない。 信頼区間のサイズは完全にサンプリング・エラーによるもので,サンプル・サイズが大きくなると真の母集団パラメータでゼロ幅の区間に近づくのに対し,許容区間のサイズは一部がサンプリング・エラー,一部が母集団の実際の分散によるもので,サンプル・サイズが大きくなると母集団の確率区間に近づく. しかし、予測区間は将来の単一標本にのみ境界を設けるのに対し、許容区間は母集団全体(等価に将来の標本の任意の列)に境界を設けます。 言い換えると,予測区間は平均的に母集団の指定された割合をカバーするのに対し,許容区間はある信頼度でそれをカバーし,1つの区間が複数の将来のサンプルを拘束することを意図している場合,許容区間の方がより適切となります。
ExamplesEdit
は次の例を示しています。
では、もう一度、ことわざのような EPA マイレージ テスト シナリオを考えてみましょう。 y n {displaystyle y_{1},y_{2},…,y_{n}} とする。
…。 このようなデータが処理されてモデルの平均走行距離の95%信頼区間を生成する場合、例えば、それを使用して、最初の5,000マイルの使用にわたって、そのような自動車の製造フリートに対する平均または総ガソリン消費量を予測することが可能である。 しかし、このような間隔は、これらの自動車を借りている人が、目的地まで350マイルを運ぶのに10ガロンのガソリンタンク(満タン)で十分かどうかを考えるのにはあまり役立たないだろう。 そのような場合には、予測間隔の方がはるかに有用であろう。 (μ ≧ 35 {displaystyle \mu \geq 35}を「95%確実」とすることの意味合いが異なることを考慮し てみてください。
as well as being “95% sure” that y n + 1≥ 35 {displaystyle y_{n+1}geq 35}.
.). しかし、μ {displaystyle \mu }の信頼区間はありません。
あるいは1マイル追加の予測区間は、生産される自動車の99%が400マイルの航続距離を持つことを保証するために、モデルが本当に必要とするガソリンタンクの大きさを決定しなければならない設計エンジニアがまさに必要としているものである。 このエンジニアが本当に必要としているのは、分数p=.99の許容範囲である{displaystyle p=.99} 。
そのような自動車の走行距離の
別の例を挙げると、次のようになる。
The air lead levels were collected from n = 15 {displaystyle n=15}.
施設内のさまざまなエリア。 対数変換された鉛レベルは正規分布によく適合することが指摘されている(つまり、対数正規分布のデータである)。 μ{displaystyle \mu }とする。
and σ 2 { {displaystyle \sigma ^{2}} } }.
はそれぞれ対数変換されたデータの母平均と分散を表す。 また、X{Θdisplaystyle X}
を対応する確率変数とすると、X ∼ N ( μ , σ 2 ) {Θdisplaystyle Xsim {Θmathcal {N}}(\mu ,\sigma ^{2})} が成立する。
…………………………….1. ここで、exp ( μ ) {displaystyle \exp(\mu )}となることに注目します。
は空気中の鉛濃度の中央値である。 μ {displaystyle \mu }の信頼区間。
は、t分布に基づいて通常の方法で構築することができ、これによって空気中の鉛濃度の中央値の信頼区間が得られる。 もしX ¯ { {displaystyle {bar {X}}} ならば
{bar {X}}and S {displaystyle S}
はサイズnのサンプルに対する対数変換データのサンプル平均と標準偏差、μ{displaystyle \mu }の95%信頼区間を表す。
is given by X ¯ ± t n – 1 , 0.975 S / ( n ) {displaystyle {bar {X}}pm t_{n-1,0.975}S/{}sqrt {(}}n)} } {X }pm t_{n-1,0.975}S/{}n }} {displaystyle {bar {X}}pm {displaystyle {bar #0.975}S/{}n
, where t m , 1 – α {displaystyle t_{m,1-alpha }} {displaystyle t_{m,1-alpha }} {t_{m,1-alpha }} , t_{n-1,0.975}S/{sqrt (}n){5468} は1 – α {displaystyle 1-alpha }を表し、1 – α {displaystyle 1-alpha }は1 – α {displaystyle 1-alpha }を表します。
quantile of t-distribution with m {displaystyle m}.
自由度。 また、空気中の鉛濃度の中央値に対する95%上方信頼区間を導き出すことも興味あることであろう。 このようなμ{displaystyle \mu }の境界は、以下の通りである。
は、X ¯ + t n – 1 , 0.95 S / n { {displaystyle {}bar {X}+t_{n-1,0.95}S/{}sqrt {n}}} によって与えられる。
. したがって、空気中の鉛の中央値の95%上方信頼区間は、exp ( X ¯ + t n – 1 , 0.95 S / n ) {}displaystyle \exp {left({}bar {X}}+t_{n-1,0.95}S/{}sqrt {n}}right)}} で与えられる。
… 続きを読む ここで、実験室内の特定の場所での空気中の鉛濃度を予測したいとする。 対数変換された鉛レベルの95%予測上限は、X ¯ + t n – 1 , 0.95 S ( 1 + 1 / n ) {displaystyle {bar {X}}+t_{n-1,0.95}S{sqrt {plerft(1+1/n>right)}} で与えられます。}
. 両側予測区間も同様に計算することができます。 これらの区間の意味と解釈はよく知られています。 例えば、信頼区間X ¯ ± t n – 1 , 0.975 S / n {}displaystyle {}bar {X}}pm t_{n-1,0.975}S/{sqrt {n}}} の場合。
を独立したサンプルから繰り返し計算すると、その計算区間の95%にμ{displaystyle \mu }の真の値が含まれることになります。
, 長い目で見ると、このようになる。 つまり、この区間はパラメータμ {displaystyle \mu }に関する情報を提供するものである。
のみである。 予測区間も同様の解釈で、単一の鉛レベルに関する情報のみを提供することを意味する。 今、我々は、母集団の鉛レベルの少なくとも95%が閾値以下であるかどうかを結論づけるためにサンプルを使用したいと仮定します。 信頼区間は鉛レベルの中央値に対してのみ、予測区間は単一の鉛レベルに対してのみなので、信頼区間と予測区間はこの質問に答えることができない。 必要なのは許容範囲であり、より具体的には許容範囲の上限である。 この上限値は、ある信頼度、例えば99%で、母集団の鉛レベルの少なくとも95%が上限値以下であることを条件として計算されることになっている。