Die Mathematik der Unsicherheit
Echte Daten sind selten nur eine Zahl. Meist sind sie ein Vektor. Die multivariate Gauß-Verteilung N(μ, Σ) erweitert die Glockenkurve auf mehrere Dimensionen. Der Mittelwert wird zu einem Vektor μ ∈ ℝⁿ (dem Mittelpunkt der Punktwolke) und die Varianz zu einer Kovarianzmatrix Σ (der Form und Neigung der Wolke).
Der Exponent verallgemeinert den z-Wert: (x−μ)ᵀΣ⁻¹(x−μ) ist die quadrierte Mahalanobis-Distanz, der Abstand vom Mittelwert, gemessen in Einheiten der eigenen Streuung der Daten. Punkte gleicher Dichte bilden Ellipsen (in höheren Dimensionen Ellipsoide); die Kovarianzmatrix legt ihre Größe, Dehnung und Neigung fest.
Die Diagonale von Σ enthält die Varianzen je Koordinate; die Nebendiagonalen enthalten die Kovarianzen, die angeben, ob Koordinaten gemeinsam steigen. Eine diagonale Σ ergibt achsenparallele Ellipsen (unabhängige Koordinaten); Nebendiagonalterme neigen sie. Σ muss positiv semidefinit sein, denn es gibt so etwas wie eine negative Varianz in irgendeiner Richtung nicht.