非参数检验

从数据中进行推断、估计和决策

t 检验依赖一个假设：数据大致正态。当这个假设失败时（小样本、明显偏斜、厚尾、有序数据），非参数检验就会登场。它们几乎不假设分布形状，通常使用秩而不是原始值。

两个常用工具：Wilcoxon 符号秩检验是配对 t 检验（匹配对）的非参数对应物。Mann–Whitney U 检验是双样本 t 检验（两个独立组）的对应物。二者都在不假设正态性的情况下询问“这些值是否倾向于更大？”

想象一下，在秒表坏了的情况下评判一场赛跑。你无法读出确切的完成时间，但你仍然可以看到谁第一、第二和第三个冲过终点线。那种完成顺序，即名次，就足以宣布获胜者，而且它不在乎时间是相差 10 秒还是 10 分钟。非参数检验以同样的方式工作：它们用秩替换原始值，因此少数疯狂的异常值或不平衡的分布无法扭曲裁决。

在机器学习中的应用比较模型准确率时，分数常常只是少数几个非正态数字，非常适合非参数检验。尤其是置换检验在机器学习中很受欢迎，因为它几乎不做假设，并能适配你关心的任何检验统计量，包括奇怪的自定义指标。它们在 t 检验紧张的地方正好稳健。

▶ 非参数检验

← 多重检验简单线性回归 →