Esperanza-Máximo (EM)

Inferencia, estimación y toma de decisiones a partir de datos

A veces la variable más importante es aquella que nunca observas. ¿De qué agrupación proviene este punto? ¿Qué tema generó este documento? Estas variables latentes ocultas Z hacen difícil el máximo verosímil: no puedes simplemente maximizar la log-verosimilitud porque ahora contiene una suma dentro de un logaritmo. Esperanza-Máximo (EM) es la solución elegante.

EM divide una optimización conjunta dura en dos pasos fáciles, alternados hasta convergencia:

La cantidad que EM realmente aumenta en cada ronda es una cota inferior de la log-verosimilitud llamada ELBO (cota inferior del evidencia). El paso E-tightena el límite; el paso M lo eleva.

Dónde aparece en el MLEM es el motor detrás de los modelos mixtos gaussianos y agrupamiento, y su estructura E/M es el antecesor conceptual de los autoencoders variacionales. El codificador de un VAE juega el papel del paso E (infiriendo latentes z), el decodificador y la función objetivo ELBO juegan el papel del paso M. El patrón "maximizar una cota inferior alternando entre inferir latentes y actualizar parámetros"…

▶ Esperanza-Máximo (EM)

← Generativo vs Discriminante Desigualdades de Concentración (breve) →