ノンパラメトリック検定

データからの推論、推定、意思決定

t検定は仮定に依存する:データがほぼ正規。それが失敗するとき(小標本、明らかな歪み、 heavy tail 、順序データ)ノンパラメトリック検定が入る。分布の形についてほとんど仮定しない、通常は生の値の代わりに順位で働く。

2つの定番です。ウィルコクソンの符号付き順位検定は対応ありt検定(マッチしたペア)のノンパラメトリック版です。マン・ホイットニーのU検定は2標本t検定(2つの独立なグループ)の版です。両方とも正規性を仮定せずに「これらはより大きくなる傾向があるか?」を問う。

ストップウォッチが壊れているときの徒競走の審査を想像してください。正確なゴール時間を読み取ることはできませんが、誰が1番、2番、3番に線を越えたかを確認することはできます。そのゴール順位、つまり順位(ランク)があれば勝者を宣言するのに十分であり、時間が10秒離れていようと10分離れていようと関係ありません。ノンパラメトリック検定も同じように機能します。生の値を順位に置き換えるため、いくつかの極端な外れ値や偏った分布によって判定が歪められることはありません。

機械学習における位置づけモデルの精度を比較するとき、スコアはしばしば少数の非正規の数で、ノンパラメトリック検定に最適です。順列検定は特にMLのお気に入りで、ほぼ仮定せず、気にする任意の検定統計量に適応する、奇妙なカスタム指標を含む。t検定が不安定になるまさにその場所でロバストです。
▶ ノンパラメトリック検定
← 多重検定単回帰 →