Przedziały ufności

Wnioskowanie, estymacja i podejmowanie decyzji z danych

Estymator punktowy, taki jak x̄ = 5.2, prawie na pewno nie jest dokładnie równy prawdziwej średniej, dlatego podawanie wyłącznie jednej liczby bywa mylące. Przedział ufności podaje cały zakres oraz towarzyszący mu poziom ufności: „prawdziwe θ leży w przedziale [L, U] z 95% ufnością”. W ten sposób kwantyfikuje on, na ile skończona próba pozwala ci zaufać otrzymanemu oszacowaniu.

Najpopularniejsze podejście wykorzystuje Centralne Twierdzenie Graniczne: średnia z próby ma w przybliżeniu rozkład normalny, dlatego przedział ufności to po prostu estymator plus-minus margines błędu:

Błąd standardowy σ/√n maleje, gdy rośnie n: zebranie cztery razy większej ilości danych zmniejsza margines błędu o połowę. Z kolei wartość z wyznacza nam poziom ufności: 1.96 dla 95%, a 2.576 dla 99%.

Gdzie to występuje w MLWłaśnie w taki uczciwy sposób raportuje się wyniki w pracach badawczych dotyczących ML. Zapis dokładności jako „91.2% ± 0.4%” to właśnie przedział ufności, gdzie ± oznacza słupek błędu. Gdy przedziały dwóch modeli mocno się na siebie nakładają, ogłoszony „zwycięzca” może być po prostu wynikiem szczęśliwego próbkowania. Kiedy odchylenie standardowe populacji σ jest nieznane lub sam rozkład ma…

▶ Przedziały ufności

← Estymacja bayesowska Schemat →