Distributions Jointes

Les mathématiques de l'incertitude

Jusqu'ici chaque variable aléatoire vivait seule. Mais les questions intéressantes portent sur des relations : taille et poids, une image et son label. Une distribution jointe p(x, y) donne la probabilité de chaque paire de valeurs à la fois. C'est la description complète de la façon dont deux (ou plus) variables se comportent ensemble.

Pour des variables discrètes, imaginez une grille : les lignes sont les valeurs de X, les colonnes les valeurs de Y, et chaque cellule contient la probabilité de cette combinaison. Toutes les cellules sont non négatives et somment à 1, les axiomes à nouveau, maintenant en deux dimensions. Pour des variables continues c'est une densité f(x, y) et les probabilités sont des volumes sous une surface 2D.

Imaginez un tableau à double entrée de personnes triées par taille et poids en même temps : petit-et-léger dans une cellule, grand-et-lourd dans une autre, et un nombre dans chaque cellule indiquant à quel point cet appariement est courant. Toute cette grille d'appariements est la distribution conjointe p(x, y) — elle décrit la taille et le poids ensemble, pas un à la fois. Remplissez chaque cellule, rendez-les non négatives et totalisant 1, et vous avez capturé l'image complète de la façon dont les deux traits voyagent ensemble.

Où cela apparaît en MLL'apprentissage supervisé modélise une jointe p(x, y) d'entrées et de labels, ou un morceau d'elle. Les modèles génératifs apprennent la jointe complète p(x, y) et peuvent synthétiser de nouvelles données ; les modèles discriminatifs apprennent seulement la conditionnelle p(y | x) nécessaire pour prédire. Toute la distinction génératif-vs-discriminatif porte sur la part de la jointe que vous…

▶ Distributions Jointes

← Gaussienne Multivariée Distributions Marginales →