A matemática da incerteza
Os dados reais raramente são um único número. São um vetor. A gaussiana multivariada N(μ, Σ) estende a curva em sino a muitas dimensões. A média passa a ser um vetor μ ∈ ℝⁿ (o centro da nuvem) e a variância passa a ser uma matriz de covariância Σ (a forma e a inclinação da nuvem).
O expoente generaliza o z-score: (x−μ)ᵀΣ⁻¹(x−μ) é o quadrado da distância de Mahalanobis, a distância à média medida em unidades da própria dispersão dos dados. Os pontos de igual densidade formam elipses (elipsoides em dimensões superiores); a matriz de covariância determina o seu tamanho, alongamento e inclinação.
A diagonal de Σ contém as variâncias de cada coordenada; os elementos fora da diagonal contêm as covariâncias, indicando se as coordenadas sobem juntas. Uma Σ diagonal dá elipses alinhadas com os eixos (coordenadas independentes); os termos fora da diagonal inclinam-nas. A matriz Σ tem de ser semidefinida positiva, já que não existe variância negativa em direção alguma.