正則化回帰

データからの推論、推定、意思決定

OLSは訓練データに最もよくフィットする係数を見つけるが、それがまさに特徴が多いかデータが少ないときの問題です：ノイズにもフィットし、係数が狂った値に振れる。正則化回帰は大きな係数を罰するペナルティを加えることでこれを飼いならす、少しの訓練フィットをはるかに良い汎化と引き換える。

リッジ回帰はL2ペナルティ、係数ベクトルの2乗長を加える：

ノブλが強さを制御する。λ = 0はプレーンなOLS；λが大きくなると各係数はゼロに向かって縮む、モデルを滑らかにする。この縮小はまた前のレッスンの悪条件の(XᵀX)⁻¹を修正する：リッジはλIを加え、可逆性を保証する。

機械学習における位置づけリッジペナルティは重み減衰で、ディープラーニングで最も一般的な正則化器で、すべてのオプティマイザーに組み込まれる。そしてレッスン8で見たように、リッジ = ガウス事前でのMAP、ラッソ = ラプラス事前でのMAP。正則化、重み減衰、ベイズ事前は同じアイデアの3つの名前です：データが強く主張しない限りより単純な重みを好む。

▶ 正則化回帰

← モデルの診断バイアス・分散分解 →