最尤推定
データからの推論、推定、意思決定
パラメータθの単一の値を選ばなければならないなら、最も自然なルールはこれです:実際に観測したデータを最もありそうにするθを選ぶ。それが最尤推定(MLE)で、MLのほぼすべてのモデルの訓練の背後にある原理です。
独立と仮定したデータx₁, …, xₙが与えられ、標本全体の確率は点ごとの確率の積です。θの関数として、この積が尤度です:
多くの小さな確率を掛けるとアンダーフローしてゼロになり、微分しにくい。修正はlogを取ることです:積のlogは和で、logは単調増加なので最大化するものを動かさない。対数尤度を最大化する:
機械学習における位置づけモデルの訓練は最尤推定です。クロスエントロピー損失の最小化はちょうどラベルの対数尤度の最大化です;クロスエントロピーは負の対数尤度です。平均2乗誤差の最小化はガウシアンノイズ仮定の下でのMLEです。.backward()を呼びオプティマイザーをステップするとき、上の対数尤度曲面を登っている、ただし数百万の次元で。
▶ 最尤推定