Maße der zentralen Tendenz

Inferenz, Schätzung und Entscheidungsfindung aus Daten

Bevor Sie Daten modellieren, müssen Sie sie ehrlich zusammenfassen. Die einfachste Zusammenfassung ist eine einzelne Zahl, die die Frage beantwortet: "Wo liegt das Zentrum der Daten?" Es gibt drei klassische Antworten, und sie stimmen nicht immer überein – genau deshalb müssen Sie alle drei kennen.

Der Mittelwert ist der Gleichgewichtspunkt: Addieren Sie jeden Wert und teilen Sie durch die Anzahl der Werte. Der Median ist der mittlere Wert, nachdem Sie die Werte sortiert haben. Der Modus ist schlicht der häufigste Wert.

Stell dir die Angebotspreise in einer kurzen Straße vor, in Hunderttausenden: 3, 4, 4, 5, 30. Vier gewöhnliche Häuser und eine Villa am Wasser. Der Durchschnittspreis ist 46/5 = 9.2, doch kein einziges gewöhnliches Haus kostet auch nur annähernd so viel. Der Median, der mittlere Wert nach dem Sortieren, ist nur 4 und berichtet den Preis des typischen Hauses ehrlich, weil die einzelne Villa die Mitte der Liste nicht sehr weit ziehen kann.

Wo das im ML vorkommtJede Verlustkennzahl, die Sie melden, ist ein Maß der zentralen Tendenz über die Testmenge. Der "mittlere quadratische Fehler" bildet den Durchschnitt der quadrierten Fehler; der Mittelwert ist empfindlich, sodass einige wenige katastrophale Vorhersagen ihn dominieren. Melden Sie auch den Median des Fehlers, wenn Sie einen schweren Rand vermuten. Er sagt Ihnen, was ein typisches Beispiel erlebt,…
▶ Maße der zentralen Tendenz
← Zentraler GrenzwertsatzMaße der Streuung →