Las matemáticas de la incertidumbre
Los datos reales rara vez son un solo número. Es una vector. La gaussiana multivariada N(μ, Σ) extiende la curva de campana a muchas dimensiones. El promedio se convierte en un vector μ ∈ ℝⁿ (el centro de la nube) y la varianza se convierte en una matriz de covarianzas Σ (la forma y el inclinamiento de la nube).
El exponente generaliza la z-score: (x−μ)ᵀΣ⁻¹(x−μ) es la distancia cuadrada de Mahalanobis, distancia desde la media medida en unidades de la propia dispersión del dato. Los puntos de densidad igual forman elipses (elipsoides en dimensiones más altas); la matriz de covarianzas establece su tamaño, estiramiento y inclinación.
La diagonal de Σ contiene las varianzas por coordenada; los elementos fuera de la diagonal contienen covarianzas, diciéndote si las coordenadas suben juntas. Una diagonal Σ da elipses alineadas con los ejes (coordenadas independientes); los términos fuera de la diagonal las inclinan. Σ debe ser semidefinida positiva, ya que no hay tal cosa como varianza negativa en ninguna dirección.