バイアス・分散分解

データからの推論、推定、意思決定

なぜ訓練データに完璧にフィットするモデルが新しいデータでよく失敗するのか?バイアス・分散分解が正確で定量的な答えを与える。モデルの期待予測誤差を3つのピースに分割し、そのうち2つが逆方向に引く。

バイアス²は間違った仮定からの誤差です:真実を捉えるには単純すぎるモデル(過小適合)。分散は特定の訓練標本への感度からの誤差です:ノイズを暗記するほど柔軟なモデル(過学習)。ノイズは還元不能です:どのモデルも決して除去できないデータのランダム性。

図で複雑さをスライドする。モデルがより複雑になるにつれ、バイアス²(緑)は下がるが分散(珊瑚)は上がる。総テスト誤差(黒)はそれらの和プラスノイズの床です:U字型で底が最適な複雑さ。

機械学習における位置づけこの分解が過小適合 vs 過学習の理論で、学習曲線の読み方です。高い訓練とテスト誤差 = 高バイアス = 過小適合(より大きなモデルを使う)。低い訓練だが高いテスト誤差 = 高分散 = 過学習(正則化、より多くのデータ、または単純化)。モデルの複雑さの選択は文字通りこのUの底を見つけること。
▶ バイアス・分散分解
← 正則化回帰交差検証 →