Expectation-Maximization (EM)

Inferensi, estimasi, dan pengambilan keputusan dari data

Kadang variabel paling penting adalah yang tidak pernah Anda amati. Cluster mana titik ini berasal? Topik mana menghasilkan dokumen ini? Variabel laten Z yang tersembunyi ini membuat maksimum likelihood sulit: Anda tidak bisa sekadar memaksimalkan log-likelihood karena sekarang berisi jumlah dalam log. Expectation–Maximization (EM) adalah perbaikan elegan.

EM memecah optimisasi gabungan sulit menjadi dua langkah bergantian mudah, diulang sampai konvergensi:

Kuantitas yang EM dorong naik setiap putaran adalah batas bawah log-likelihood disebut ELBO (evidence lower bound). Langkah-E mengencangkan batas; langkah-M menaikkannya.

Di mana ini berlaku dalam MLEM adalah mesin di balik Gaussian mixture models dan clustering, dan struktur E/M-nya adalah leluhur konseptual variational autoencoders. Encoder VAE memainkan peran langkah-E (menyimpulkan laten z), decoder dan objektif ELBO memainkan langkah-M. Pola "maksimalkan batas bawah dengan bergantian menyimpulkan laten dan memperbarui parameter" ada di mana-mana di model variabel-laten modern.

▶ Expectation-Maximization (EM)

← Generatif vs Diskriminatif Ketidaksamaan Konsentrasi (singkat) →