Gaussiana Multivariada

A matemática da incerteza

Os dados reais raramente são um único número. São um vetor. A gaussiana multivariada N(μ, Σ) estende a curva em sino a muitas dimensões. A média passa a ser um vetor μ ∈ ℝⁿ (o centro da nuvem) e a variância passa a ser uma matriz de covariância Σ (a forma e a inclinação da nuvem).

O expoente generaliza o z-score: (x−μ)ᵀΣ⁻¹(x−μ) é o quadrado da distância de Mahalanobis, a distância à média medida em unidades da própria dispersão dos dados. Os pontos de igual densidade formam elipses (elipsoides em dimensões superiores); a matriz de covariância determina seu tamanho, alongamento e inclinação.

A diagonal de Σ contém as variâncias de cada coordenada; os elementos fora da diagonal contêm as covariâncias, indicando se as coordenadas sobem juntas. Uma Σ diagonal dá elipses alinhadas com os eixos (coordenadas independentes); os termos fora da diagonal as inclinam. A matriz Σ tem de ser semidefinida positiva, já que não existe variância negativa em direção alguma.

Onde isso aparece no MLQuando um processo gaussiano faz regressão com barras de erro incorporadas, está colocando uma gaussiana multivariada sobre funções. O prior latente de um VAE é uma normal multivariada padrão N(0, I). Os modelos de variáveis latentes gaussianos e os escalonamentos de ruído dos modelos de difusão se apoiam todos no fato de que aplicações lineares e condicionais de gaussianas permanecem gaussianas.

▶ Gaussiana Multivariada

← Distribuições Contínuas Essenciais Distribuições Conjuntas →