Distribusi Marginal

Matematika ketidakpastian

Diberikan gabungan p(x, y), misalkan Anda hanya peduli X dan ingin melupakan Y. Anda memarginalkan: jumlahkan (atau integralkan) gabungan atas semua nilai variabel yang tidak diinginkan. Yang tersisa adalah distribusi marginal X sendiri.

Nama berasal dari tabel probabilitas lama: Anda menjumlahkan setiap baris dan menulis total di margin. Jumlah-baris itu adalah marginal satu variabel, dan jumlah-kolom adalah marginal yang lain. Memarginalkan berarti "integralkan variabel yang tidak Anda inginkan."

Ambil tabel tinggi–berat badan dua arah itu dan misalkan Anda hanya peduli pada tinggi badan, mengabaikan berat badan sepenuhnya. Anda cukup menjumlahkan setiap baris dari gabungan p(x, y) dan mencatat totalnya di margin — total baris itu adalah seberapa sering setiap tinggi badan terjadi tidak peduli berapa pun berat badannya. Membaca hanya total-total margin itu akan memberikan distribusi marginal dari X, yaitu satu variabel yang dilihat dengan sendirinya.

Di mana ini berlaku dalam MLMemarginalkan variabel laten adalah komputasi sentral sekaligus pusingan sentral pemodelan generatif. Likelihood data adalah p(x) = ∫ p(x, z) dz = ∫ p(x | z) p(z) dz, integral atas setiap laten z mungkin. Integral itu biasanya intractable, persis mengapa VAE mengoptimalkan batas bawah tractable (ELBO) alih-alih menghitung marginal langsung.
▶ Distribusi Marginal
← Distribusi GabunganDistribusi Kondisional →