Доверителни интервали — Статистика

Една точкова оценка като x̄ = 5,2 почти сигурно не е точно истинската средна стойност, така че предоставянето само на едно число не е коректно. Доверителният интервал (confidence interval) предоставя диапазон плюс ниво на увереност: „истинското θ се намира в интервала [L, U] с 95% увереност“. Той количествено определя доколко крайната ви извадка ви позволява да се доверите на оценката.

Най-често срещаният случай използва Централната гранична теорема: разпределението на извадчната средна стойност е приблизително нормално, така че интервалът представлява оценката плюс/минус допустимата грешка (margin of error):

Стандартната грешка σ/√n намалява с нарастването на n: четири пъти повече данни намаляват допустимата грешка наполовина. Z-стойността определя нивото на доверие: 1,96 за 95%, 2,576 за 99%.

Къде се използва това в MLЕто как коректните научни статии в машинното обучение отчитат резултатите си. Точност от „91,2% ± 0,4%“ представлява доверителен интервал; ± обозначава лентата на грешката (error bar). Когато интервалите на два модела се припокриват силно, „победителят“ може просто да е изкарал късмет с извадката. Когато дисперсията σ на популацията е неизвестна или разпределението е нестандартно, методът…