PDF & CDF

A matemática da incerteza

Para quantidades contínuas, como altura, peso ou intensidade de um pixel, perguntar P(X = 3.0000…) não leva a nada: há infinitos valores, então cada valor isolado tem probabilidade zero. Em vez disso, descrevemos como a probabilidade está distribuída por meio de uma função densidade de probabilidade f(x), e lemos as probabilidades como áreas.

Uma densidade não é, em si, uma probabilidade, e pode exceder 1. O que precisa valer é que ela seja não-negativa e que a área total seja 1, o eco contínuo de "a PMF soma 1":

Arraste μ e σ acima: a curva desliza e se estica, mas a área sob ela permanece sempre exatamente 1. A probabilidade de um intervalo é a fatia de área que repousa sobre ele.

Onde isso aparece no MLA saída de um modelo generativo p(x | θ) é uma densidade. Para amostrar de uma distribuição unidimensional, você pode usar a amostragem por transformada inversa: sorteie um valor uniforme u ∈ [0,1] e devolva F⁻¹(u), invertendo a CDF. Os normalizing flows generalizam exatamente essa ideia, aprendendo uma aplicação invertível cuja mudança de variáveis transforma uma densidade simples em uma…
▶ PDF & CDF
← Distribuições Discretas ChaveExpectativa & Variância (contínuo) →