バイアス・分散分解

データからの推論、推定、意思決定

なぜ訓練データに完璧にフィットするモデルが新しいデータでよく失敗するのか？バイアス・分散分解が正確で定量的な答えを与える。モデルの期待予測誤差を3つのピースに分割し、そのうち2つが逆方向に引く。

バイアス²は間違った仮定からの誤差です：真実を捉えるには単純すぎるモデル（過小適合）。分散は特定の訓練標本への感度からの誤差です：ノイズを暗記するほど柔軟なモデル（過学習）。ノイズは還元不能です：どのモデルも決して除去できないデータのランダム性。

図で複雑さをスライドする。モデルがより複雑になるにつれ、バイアス²（緑）は下がるが分散（珊瑚）は上がる。総テスト誤差（黒）はそれらの和プラスノイズの床です：U字型で底が最適な複雑さ。

機械学習における位置づけこの分解が過小適合 vs 過学習の理論で、学習曲線の読み方です。高い訓練とテスト誤差 = 高バイアス = 過小適合（より大きなモデルを使う）。低い訓練だが高いテスト誤差 = 高分散 = 過学習（正則化、より多くのデータ、または単純化）。モデルの複雑さの選択は文字通りこのUの底を見つけること。

▶ バイアス・分散分解

← 正則化回帰交差検証 →