主要な離散分布 — 確率 · Mathematics for Machine Learning

いくつかの名前付き分布がMLのほとんどの離散状況をカバーする。各々は既知の平均と分散を持つ既製のPMFで、ゼロから再導出する代わりに正しいものを選ぶ。

ベルヌーイ(p)は2つの結果を持つ1回の試行をモデル化する：確率pで成功(1)、確率1−pで失敗(0)。他のすべての離散分布が作られる構成要素です。

2つの日常的なカウントが代表的な分布を示しています。コインを10回投げて表の数を数えます。そのカウントは二項分布であり、10回の独立した「はい/いいえ」の試行の合計です。次に、ヘルプデスクが1時間に受け取る電話の件数を数えてみましょう。そのカウントはポアソン分布であり、時間に散りばめられたまれな事象の法則であり、平均と分散の両方を兼ねる単一の率λを持っています。

機械学習における位置づけ分類損失を選ぶとき、本当にこれらの分布の1つを選んでいる。バイナリクロスエントロピーはベルヌーイの負の対数尤度です：モデルの単一確率を0/1ラベルに対してスコアする。多クラスクロスエントロピーはカテゴリカルの負の対数尤度で、softmax出力をone-hotラベルに対してスコアする。選ぶ損失がラベルが従うと仮定する分布を符号化する。