Multivariate Gauß-Verteilung

Die Mathematik der Unsicherheit

Echte Daten sind selten nur eine Zahl. Meist sind sie ein Vektor. Die multivariate Gauß-Verteilung N(μ, Σ) erweitert die Glockenkurve auf mehrere Dimensionen. Der Mittelwert wird zu einem Vektor μ ∈ ℝⁿ (dem Mittelpunkt der Punktwolke) und die Varianz zu einer Kovarianzmatrix Σ (der Form und Neigung der Wolke).

Der Exponent verallgemeinert den z-Wert: (x−μ)ᵀΣ⁻¹(x−μ) ist die quadrierte Mahalanobis-Distanz, der Abstand vom Mittelwert, gemessen in Einheiten der eigenen Streuung der Daten. Punkte gleicher Dichte bilden Ellipsen (in höheren Dimensionen Ellipsoide); die Kovarianzmatrix legt ihre Größe, Dehnung und Neigung fest.

Die Diagonale von Σ enthält die Varianzen je Koordinate; die Nebendiagonalen enthalten die Kovarianzen, die angeben, ob Koordinaten gemeinsam steigen. Eine diagonale Σ ergibt achsenparallele Ellipsen (unabhängige Koordinaten); Nebendiagonalterme neigen sie. Σ muss positiv semidefinit sein, denn es gibt so etwas wie eine negative Varianz in irgendeiner Richtung nicht.

Wo das im ML vorkommtWenn ein Gauß-Prozess eine Regression mit eingebauten Fehlerbalken durchführt, legt er eine multivariate Gauß-Verteilung über Funktionen. Der latente Prior eines VAE ist eine multivariate Standardnormalverteilung N(0, I). Gaußsche latente Variablenmodelle und die Rauschpläne von Diffusionsmodellen beruhen alle darauf, dass lineare Abbildungen und bedingte Verteilungen von Gauß-Verteilungen wieder…

▶ Multivariate Gauß-Verteilung

← Wichtige stetige Verteilungen Gemeinsame Verteilungen →