Probabilité Conditionnelle

Les mathématiques de l'incertitude

Une nouvelle information change les chances. Une fois que vous apprenez que « le dé est tombé sur pair », la probabilité que ce soit un 2 n'est plus 1/6, parce que vous avez éliminé les faces impaires. La probabilité conditionnelle est la machinerie pour mettre à jour une probabilité quand vous savez qu'un événement B s'est déjà produit.

Lisez P(A | B) comme « la probabilité de A sachant B. » Géométriquement c'est un zoom-et-renormalisation : jetez tout ce qui est hors de B, traitez B comme le nouveau monde entier, et demandez quelle fraction de ce monde est aussi dans A. Diviser par P(B) remet à l'échelle pour que le monde rétréci ait toujours une probabilité totale de 1.

Imaginez un test de dépistage qui vient de revenir positif. Cet indice ne change pas la réalité, mais il réduit les possibilités : vous pouvez écarter tous ceux dont le test était négatif et ne regarder que le groupe positif B. La question "ai-je réellement la maladie ?" devient P(A | B), la fraction de ce groupe restreint qui est vraiment malade.

Où cela apparaît en MLUn classifieur calcule une probabilité conditionnelle. Tout son travail est P(class | input), la probabilité de chaque label sachant les pixels ou tokens qu'il voit. Le vecteur softmax est littéralement P(y | x). Conditionner sur l'entrée est ce qui transforme un a priori sur les classes en une prédiction.
▶ Probabilité Conditionnelle
← Axiomes des ProbabilitésThéorème de Bayes →