Непараметрические критерии

Вывод, оценивание и принятие решений по данным

t-критерий опирается на предположение: данные примерно нормальны. Когда это не так (малые выборки, явная асимметрия, тяжёлые хвосты, порядковые данные), вступают непараметрические критерии. Они почти не предполагают форму распределения, обычно работая с рангами вместо значений.

Два основных. Знаково-ранговый критерий Уилкоксона — непараметрический аналог парного t-критерия (сопряжённые пары). U-критерий Манна–Уитни — аналог двухвыборочного t-критерия (две независимые группы). Оба спрашивают «имеют ли тенденцию быть больше?» без предположения нормальности.

Представьте, что вы судите забег, когда сломан секундомер. Вы не можете узнать точное время финиша, но вы все еще можете видеть, кто пересек черту первым, вторым и третьим. Этого порядка финиша, этих рангов достаточно, чтобы объявить победителя, и неважно, было ли время между ними 10 секунд или 10 минут. Непараметрические тесты работают так же: они заменяют исходные значения рангами, поэтому несколько безумных выбросов или скошенное распределение не могут исказить вердикт.

Где это встречается в MLСравнивая точности моделей, оценки часто — горстка не-нормальных чисел, идеально для непараметрических критериев. Пермутационные критерии особенно любимы в ML, потому что почти не предполагают и адаптируются к любой статистике, включая странные кастомные метрики. Они надёжны именно там, где t-критерий нервничает.
▶ Непараметрические критерии
← Множественные сравненияПростая линейная регрессия →