Distribuciones Conjuntas

Las matemáticas de la incertidumbre

Hasta ahora cada variable aleatoria vivía sola. Pero las preguntas interesantes son sobre relaciones: altura y peso, una imagen y su etiqueta. Una distribución conjunta p(x, y) da la probabilidad de cada par de valores a la vez. Es la descripción completa de cómo dos (o más) variables se comportan juntas.

Para variables discretas, imagina una cuadrícula: las filas son los valores de X, las columnas los valores de Y, y cada celda contiene la probabilidad de esa combinación. Todas las celdas son no negativas y suman 1, los axiomas nuevamente, ahora en dos dimensiones. Para variables continuas es una densidad f(x, y) y las probabilidades son volúmenes bajo una superficie de 2-D.

Imagina una tabla de doble entrada de personas clasificadas por altura y peso al mismo tiempo: bajos y ligeros en una celda, altos y pesados en otra, y un número en cada celda diciendo cuán común es ese emparejamiento. Toda esa cuadrícula de emparejamientos es la distribución conjunta p(x, y); describe la altura y el peso juntos, no uno a la vez. Llena cada celda, haz que sean no negativas y sumen 1, y habrás capturado la imagen completa de cómo los dos rasgos viajan juntos.

Dónde aparece en el MLEl aprendizaje supervisado modela un conjunto p(x, y) de entradas y etiquetas, o una parte de él. Modelos generativos aprenden el conjunto completo p(x, y) y pueden sintetizar nuevos datos; modelos discriminativos aprenden solo la condicional p(y | x) necesaria para predecir. La distinción completa entre generativo y discriminativo es sobre cuánto del conjunto te molesta modelar.
▶ Distribuciones Conjuntas
← Gaussiana MultivariadaDistribuciones marginales →