非参数检验

从数据中进行推断、估计和决策

t 检验依赖一个假设:数据大致正态。当这个假设失败时(小样本、明显偏斜、厚尾、有序数据),非参数检验就会登场。它们几乎不假设分布形状,通常使用秩而不是原始值。

两个常用工具:Wilcoxon 符号秩检验是配对 t 检验(匹配对)的非参数对应物。Mann–Whitney U 检验是双样本 t 检验(两个独立组)的对应物。二者都在不假设正态性的情况下询问“这些值是否倾向于更大?”

想象一下,在秒表坏了的情况下评判一场赛跑。你无法读出确切的完成时间,但你仍然可以看到谁第一、第二和第三个冲过终点线。那种完成顺序,即名次,就足以宣布获胜者,而且它不在乎时间是相差 10 秒还是 10 分钟。非参数检验以同样的方式工作:它们用秩替换原始值,因此少数疯狂的异常值或不平衡的分布无法扭曲裁决。

在机器学习中的应用比较模型准确率时,分数常常只是少数几个非正态数字,非常适合非参数检验。尤其是置换检验在机器学习中很受欢迎,因为它几乎不做假设,并能适配你关心的任何检验统计量,包括奇怪的自定义指标。它们在 t 检验紧张的地方正好稳健。
▶ 非参数检验
← 多重检验简单线性回归 →