Erwartungswert

Die Mathematik der Unsicherheit

Der Erwartungswert einer Zufallsvariablen ist ihr Langzeitmittel: der Wert, gegen den Sie konvergieren würden, wenn Sie das Experiment unendlich oft wiederholen und die Ergebnisse mitteln. Er ist ein gewichteter Mittelwert der möglichen Werte, jeder mit seiner Wahrscheinlichkeit gewichtet:

Stellen Sie sich die PMF als eine Reihe von Gewichten entlang eines Lineals vor; E[X] ist der Gleichgewichtspunkt. Er muss kein Wert sein, den X tatsächlich annimmt: Ein fairer Würfel hat den Mittelwert 3,5, obwohl keine Seite diesen Wert zeigt.

Stell dir einen Spielautomaten vor, den du tausende Male fütterst. Bei jedem einzelnen Zug kannst du groß gewinnen oder deine Münze verlieren, aber der Automat hat eine feste langfristige durchschnittliche Auszahlung pro Spiel, und diese Zahl ist E[X]. Es ist der stabile Wert, auf den dein Durchschnitt zuschleicht, während sich die Spiele anhäufen, auch wenn kein einzelner Dreh jemals genau darauf landet.

Wo das im ML vorkommtDas Training minimiert einen erwarteten Verlust E_D[L(θ)], den durchschnittlichen Verlust über die Datenverteilung. Diesen Erwartungswert können wir nicht exakt berechnen, daher nähern wir ihn durch einen Mittelwert über eine endliche Stichprobe (das Trainingsset) und für jeden Gradientenschritt über ein Minibatch an. Die Linearität des Erwartungswerts ist der Grund dafür, dass der mittlere…

▶ Erwartungswert

← Zufallsvariablen Varianz →