確率の公理

不確実性の数学

「どれくらいありそうか」に数をどう割り当てるか?アンドレイ・コルモゴロフは理論全体がちょうど3つのルールに基づくことを示した。使う他のすべての公式はこれらの帰結です。

言葉で言うと:確率は決して負にならない;何かが起きる確率はちょうど1;重なり得ない事象について、確率は単純に加わる。以上。確率は総質量1を結果にわたって分割する方法です。

1つの結果につき1切れずつ、ホールパイをスライスに切り分ける様子を想像してください。負の大きさを持つスライスは存在できず(それがP(A) ≥ 0のルールです)、すべてのスライスを合わせるとパイ全体を満たす必要があり、それ以上でも以下でもありません。これはまさにP(Ω) = 1です。事象の確率を尋ねることは、それに属するスライスを足し合わせることを意味します。

機械学習における位置づけsoftmax層は生スコアを構造上これらの公理に従う確率分布に変える:各出力は非負(公理1)でクラスにわたって和が1(公理2)。モデルが「P(cat) = 0.7」と報告するとき、残り0.3は他のすべてのクラスに分割され、それが補事象の法則の実践です。スコアを確率に再正規化するたびに、コルモゴロフの公理を強制している。
▶ 確率の公理
← 標本空間と事象条件付き確率 →