PDF & CDF

A matemática da incerteza

Para quantidades contínuas, como altura, peso ou intensidade de um pixel, perguntar P(X = 3.0000…) não leva a lado nenhum: há infinitos valores, por isso cada valor isolado tem probabilidade zero. Em vez disso, descrevemos como a probabilidade está distribuída por meio de uma função densidade de probabilidade f(x), e lemos as probabilidades como áreas.

Uma densidade não é, em si, uma probabilidade, e pode exceder 1. O que tem de valer é que seja não-negativa e que a área total seja 1, o eco contínuo de "a PMF soma 1":

Arrasta μ e σ acima: a curva desliza e estica-se, mas a área sob ela permanece sempre exatamente 1. A probabilidade de um intervalo é a fatia de área que assenta sobre ele.

Onde isto aparece no MLA saída de um modelo generativo p(x | θ) é uma densidade. Para amostrar de uma distribuição unidimensional, podes usar a amostragem por transformada inversa: sorteia um valor uniforme u ∈ [0,1] e devolve F⁻¹(u), invertendo a CDF. Os normalizing flows generalizam exatamente esta ideia, aprendendo uma aplicação invertível cuja mudança de variáveis transforma uma densidade simples numa complexa.
▶ PDF & CDF
← Distribuições Discretas ChaveExpectativa & Variância (contínuo) →