PDF e CDF

La matematica dell'incertezza

Per grandezze continue come un'altezza, un peso o un'intensità di pixel, chiedersi quanto vale P(X = 3.0000…) non ha senso: i valori sono infiniti, quindi ognuno preso singolarmente ha probabilità zero. Descriviamo invece come la probabilità è distribuita tramite una funzione di densità di probabilità f(x), e leggiamo le probabilità come aree.

Una densità non è di per sé una probabilità, e può superare 1. Ciò che deve valere è che sia non negativa e che l'area totale sia 1, l'analogo continuo del fatto che "la PMF somma a 1":

Trascina μ e σ qui sopra: la curva trasla e si allarga o si restringe, ma l'area sottesa resta sempre esattamente 1. La probabilità di un intervallo è la porzione di area che vi sta sopra.

Dove si trova nel MLL'output di un modello generativo p(x | θ) è una densità. Per campionare da una distribuzione 1-D puoi usare il campionamento per trasformata inversa: estrai una uniforme u ∈ [0,1] e restituisci F⁻¹(u), invertendo la CDF. I normalizing flow generalizzano esattamente questa idea, imparando una mappa invertibile il cui cambio di variabili trasforma una densità semplice in una complessa.

▶ PDF e CDF

← Distribuzioni Discrete Chiave Attesa e Varianza (continue) →