Probabilità Condizionata

La matematica dell'incertezza

Nuove informazioni cambiano le probabilità. Una volta che sai che "il dado è uscito pari", la probabilità che sia un 2 non è più 1/6, perché hai escluso le facce dispari. La probabilità condizionata è il meccanismo che permette di aggiornare una probabilità quando sai che un certo evento B si è già verificato.

Leggi P(A | B) come "la probabilità di A dato B". Geometricamente è un'operazione di zoom e rinormalizzazione: scarti tutto ciò che sta fuori da B, consideri B come il nuovo mondo intero e ti chiedi quale frazione di quel mondo cade anche in A. Dividere per P(B) riscala il tutto, in modo che il mondo ristretto abbia di nuovo probabilità totale 1.

Immagina un test di screening che è appena risultato positivo. Quell'indizio non cambia la realtà, ma restringe le possibilità: puoi scartare tutti coloro il cui test è risultato negativo e guardare solo il gruppo positivo B. La domanda "ho davvero la malattia?" diventa P(A | B), la frazione di quel gruppo ristretto che è veramente malata.

Dove si trova nel MLUn classificatore calcola una probabilità condizionata. Il suo intero lavoro è P(class | input), la probabilità di ciascuna etichetta dato i pixel o i token che vede. Il vettore softmax è letteralmente P(y | x). Condizionare sull'input è ciò che trasforma una prior sulle classi in una predizione.

▶ Probabilità Condizionata

← Assiomi della Probabilità Teorema di Bayes →