Konfidenzintervalle

Inferenz, Schätzung und Entscheidungsfindung aus Daten

Eine Punktschätzung wie x̄ = 5,2 ist mit ziemlicher Sicherheit nicht exakt der wahre Mittelwert, also ist eine einzelne Zahl für sich genommen unehrlich. Ein Konfidenzintervall gibt einen Bereich samt Konfidenzniveau an: "Das wahre θ liegt mit 95 % Konfidenz in [L, U]." Es quantifiziert, wie sehr Ihre endliche Stichprobe Ihnen erlaubt, der Schätzung zu vertrauen.

Der häufigste Fall nutzt den zentralen Grenzwertsatz: Der Stichprobenmittelwert ist näherungsweise normalverteilt, also ist das Intervall die Schätzung plus/minus einer Fehlerspanne:

Der Standardfehler σ/√n wird kleiner, je größer n ist: Die vierfache Datenmenge halbiert die Fehlerspanne. Der z-Wert legt das Konfidenzniveau fest: 1,96 für 95 %, 2,576 für 99 %.

Wo das im ML vorkommtSo berichten ehrliche ML-Arbeiten ihre Ergebnisse. Eine Genauigkeit von "91,2 % ± 0,4 %" ist ein Konfidenzintervall; das ± ist der Fehlerbalken. Wenn sich die Intervalle zweier Modelle stark überschneiden, hat der 'Gewinner' womöglich nur Glück bei der Stichprobenziehung gehabt. Ist die Populations-σ unbekannt oder die Verteilung seltsam, verwenden Sie den Bootstrap (Ziehen der Testmenge mit…

▶ Konfidenzintervalle

← Bayessche Schätzung Framework →