PDFとCDF
不確実性の数学
身長、体重、ピクセル強度のような連続量について、P(X = 3.0000…)を問うのは絶望的です:無限に多くの値があり、任意の1つは確率ゼロを持つ。代わりに確率密度関数f(x)で確率がどう分布するかを記述し、確率を面積として読み取る。
密度自体は確率ではなく、1を超え得る。成り立たなければならないのは非負で総面積が1であることで、「PMFの和が1」の連続版です:
上のμとσをドラッグしてください:曲線がスライドし伸縮するが、下の面積は常にちょうど1に保たれる。区間の確率はその上に乗る面積のスライスです。
機械学習における位置づけ生成モデルの出力p(x | θ)は密度です。1次元分布からサンプリングするには逆変換サンプリングが使える:一様u ∈ [0,1]を引きF⁻¹(u)を返す、CDFを逆転する。正規化フローはまさにこのアイデアを一般化し、変数変換が単純な密度を複雑なものに変える可逆写像を学習する。
▶ PDFとCDF