信頼区間

データからの推論、推定、意思決定

x̄ = 5.2のような点推定はちょうど真の平均でないことがほぼ確実なので、単一の数だけでは不正です。信頼区間は範囲と信頼水準を報告する:「真のθは[L, U]にあり、95%の信頼で。」有限の標本が推定をどれだけ信頼できるかを定量化する。

最も一般的なケースは中心極限定理を使う:標本平均は近似的に正規なので、区間は推定プラスマイナス誤差範囲です:

標準誤差σ/√nはnが大きくなると縮む:4倍のデータで誤差範囲が半分。z値が信頼を設定する:95%で1.96、99%で2.576。

機械学習における位置づけこれが正直なML論文が結果を報告する方法です。「91.2% ± 0.4%」の精度は信頼区間です;±が誤差範囲です。2つのモデルの区間が大きく重なるとき、「勝者」はただの幸運なサンプリングかもしれない。母集団σが未知または分布が変なとき、ブートストラップ(テストセットを復元抽出して再サンプリング)が区間を経験的に構築する、公式不要。
▶ 信頼区間
← ベイズ推定フレームワーク →