Gaussiana Multivariada

A matemática da incerteza

Os dados reais raramente são um único número. São um vetor. A gaussiana multivariada N(μ, Σ) estende a curva em sino a muitas dimensões. A média passa a ser um vetor μ ∈ ℝⁿ (o centro da nuvem) e a variância passa a ser uma matriz de covariância Σ (a forma e a inclinação da nuvem).

O expoente generaliza o z-score: (x−μ)ᵀΣ⁻¹(x−μ) é o quadrado da distância de Mahalanobis, a distância à média medida em unidades da própria dispersão dos dados. Os pontos de igual densidade formam elipses (elipsoides em dimensões superiores); a matriz de covariância determina o seu tamanho, alongamento e inclinação.

A diagonal de Σ contém as variâncias de cada coordenada; os elementos fora da diagonal contêm as covariâncias, indicando se as coordenadas sobem juntas. Uma Σ diagonal dá elipses alinhadas com os eixos (coordenadas independentes); os termos fora da diagonal inclinam-nas. A matriz Σ tem de ser semidefinida positiva, já que não existe variância negativa em direção alguma.

Onde isto aparece no MLQuando um processo gaussiano faz regressão com barras de erro incorporadas, está a colocar uma gaussiana multivariada sobre funções. O prior latente de um VAE é uma normal multivariada padrão N(0, I). Os modelos de variáveis latentes gaussianos e os escalonamentos de ruído dos modelos de difusão apoiam-se todos no facto de que aplicações lineares e condicionais de gaussianas permanecem gaussianas.

▶ Gaussiana Multivariada

← Distribuições Contínuas Essenciais Distribuições Conjuntas →