同時分布

不確実性の数学

これまで各確率変数は単独で生きていた。しかし面白い問いは関係についてです:身長と体重、画像とそのラベル。同時分布p(x, y)はすべてのペアの値の確率を一度に与える。2つ(以上)の変数が一緒にどう振る舞うかの完全な記述です。

離散変数について、グリッドを想像する:行がXの値、列がYの値で、各セルがその組合せの確率を持つ。すべてのセルは非負で和が1、公理の再び、今は2次元で。連続変数では密度f(x, y)で確率は2次元曲面の下の体積です。

身長と体重で同時に分類された人々の二元表を想像してください。「低くて軽い」があるセルに、「高くて重い」が別のセルにあり、すべてのセルにそのペアがどれくらい一般的であるかを示す数字が入っています。そのペアリングのグリッド全体が同時分布 p(x, y)です。これは身長と体重を個別にではなく一緒に説明します。すべてのセルを埋め、それらを非負にして合計を1にすれば、2つの特性がどのように一緒に動くかについての完全な全体像を捉えたことになります。

機械学習における位置づけ教師あり学習は入力とラベルの同時p(x, y)をモデル化する、またはその一部を。生成モデルは完全な同時p(x, y)を学習し新しいデータを合成できる;識別モデルは予測に必要な条件付きp(y | x)のみを学習する。生成対識別の全体の区別は同時にどれだけ煩わしくモデル化するかについてです。
▶ 同時分布
← 多変量ガウス周辺分布 →