Inferenz, Schätzung und Entscheidungsfindung aus Daten
Bevor Sie Daten modellieren, müssen Sie sie ehrlich zusammenfassen. Die einfachste Zusammenfassung ist eine einzelne Zahl, die die Frage beantwortet: "Wo liegt das Zentrum der Daten?" Es gibt drei klassische Antworten, und sie stimmen nicht immer überein – genau deshalb müssen Sie alle drei kennen.
Der Mittelwert ist der Gleichgewichtspunkt: Addieren Sie jeden Wert und teilen Sie durch die Anzahl der Werte. Der Median ist der mittlere Wert, nachdem Sie die Werte sortiert haben. Der Modus ist schlicht der häufigste Wert.
Stell dir die Angebotspreise in einer kurzen Straße vor, in Hunderttausenden: 3, 4, 4, 5, 30. Vier gewöhnliche Häuser und eine Villa am Wasser. Der Durchschnittspreis ist 46/5 = 9.2, doch kein einziges gewöhnliches Haus kostet auch nur annähernd so viel. Der Median, der mittlere Wert nach dem Sortieren, ist nur 4 und berichtet den Preis des typischen Hauses ehrlich, weil die einzelne Villa die Mitte der Liste nicht sehr weit ziehen kann.