PDF und CDF

Die Mathematik der Unsicherheit

Für stetige Größen wie eine Körpergröße, ein Gewicht oder eine Pixelintensität ist die Frage nach P(X = 3.0000…) aussichtslos: Es gibt unendlich viele Werte, sodass jeder einzelne die Wahrscheinlichkeit null hat. Stattdessen beschreiben wir mit einer Wahrscheinlichkeitsdichtefunktion f(x), wie sich die Wahrscheinlichkeit verteilt, und lesen Wahrscheinlichkeiten als Flächen ab.

Eine Dichte ist selbst keine Wahrscheinlichkeit, und sie kann größer als 1 sein. Gelten muss nur, dass sie nicht-negativ ist und die gesamte Fläche 1 beträgt — das stetige Gegenstück zu "die PMF summiert sich zu 1":

Ziehen Sie oben an μ und σ: Die Kurve verschiebt sich und dehnt sich, doch die Fläche darunter bleibt stets genau 1. Die Wahrscheinlichkeit eines Intervalls ist der Teil der Fläche, der über diesem Intervall liegt.

Wo das im ML vorkommtDie Ausgabe eines generativen Modells p(x | θ) ist eine Dichte. Um aus einer 1-D-Verteilung zu ziehen, können Sie das Inverse-Transform-Sampling verwenden: Sie ziehen eine gleichverteilte Zahl u ∈ [0,1] und geben F⁻¹(u) zurück, invertieren also die CDF. Normalisierende Flüsse verallgemeinern genau diese Idee: Sie lernen eine invertierbare Abbildung, deren Variablenwechsel eine einfache Dichte in…

▶ PDF und CDF

← Wichtige diskrete Verteilungen Erwartungswert & Varianz (stetig) →