Zufallsvariablen

Die Mathematik der Unsicherheit

Mit Ergebnissen wie "Kopf" oder "die dritte rote Karte" lässt sich schlecht rechnen. Eine Zufallsvariable behebt das: Sie ist eine Regel, die jedem Ergebnis eine Zahl zuordnet, formal X: Ω → ℝ. Wirft man drei Münzen und lässt X die Anzahl der Köpfe zählen, so wird jedes Ergebnis auf 0, 1, 2 oder 3 abgebildet, und wir können Mittelwerte bilden, quadrieren und summieren.

Ein Glücksrad landet auf farbigen Feldern, und jede Farbe zahlt einen anderen Betrag aus: eine Zahl, die jedem Ergebnis angeheftet ist. Diese Zahl ist eine Zufallsvariable X, das Bargeld, das du bei einem Dreh gewinnst. Aufzulisten, wie oft jede Auszahlung vorkommt, p(x) = P(X = x), zeigt dir die gesamte Verteilung deines Preises.

Für eine diskrete Zufallsvariable gibt die Wahrscheinlichkeitsfunktion (PMF) p(x) = P(X = x) die Wahrscheinlichkeit für jeden Wert an. Sie muss nicht-negativ sein und sich über den Träger zu 1 summieren — das sind lediglich die Axiome, neu formuliert auf Zahlen.

Wo das im ML vorkommtEin Label Y ist eine Zufallsvariable, und ebenso die Vorhersage eines Modells. Das argmax des Softmax, die vorhergesagte Klasse, ist eine Zufallsvariable, die die Ausgabeverteilung des Modells auf einen einzelnen Index abbildet. Das Sampeln aus einem Sprachmodell ist das Ziehen einer Zufallsvariablen (des nächsten Tokens) aus der PMF über dem Vokabular.

▶ Zufallsvariablen

← Unabhängigkeit Erwartungswert →