비모수 검정

데이터로부터의 추론, 추정, 의사결정

t-검정은 데이터가 대략 정규 분포를 따른다는 가정에 기대고 있습니다. 이 가정이 무너지는 경우(표본이 작거나, 왜도가 뚜렷하거나, 꼬리가 무겁거나, 순서형 데이터일 때)에는 비모수 검정이 등장합니다. 비모수 검정은 분포의 형태에 대해 거의 가정을 두지 않으며, 보통 원래 값 대신 순위를 가지고 작업합니다.

대표적인 두 가지가 있습니다. 윌콕슨 부호순위 검정은 대응 t-검정(짝지어진 쌍)에 해당하는 비모수 검정입니다. 만–위트니 U 검정은 두 표본 t-검정(두 독립 그룹)에 해당하는 검정입니다. 두 검정 모두 정규성을 가정하지 않고 «이쪽이 더 큰 경향이 있는가?»를 묻습니다.

초시계가 고장난 상태에서 달리기 경주를 심판한다고 상상해 보세요. 정확한 완주 시간은 읽을 수 없지만, 여전히 누가 결승선을 1위, 2위, 3위로 통과했는지는 볼 수 있습니다. 그 완주 순서, 즉 순위는 승자를 선언하기에 충분하며, 시간 차이가 10초든 10분이든 상관하지 않습니다. 비모수 검정은 같은 방식으로 작동합니다: 그들은 원시 값을 순위로 대체하므로 소수의 심한 이상치나 한쪽으로 치우친 분포가 판결을 왜곡할 수 없습니다.

머신러닝에서의 위치모델 정확도를 비교할 때 점수는 흔히 비정규적인 소수의 숫자에 불과하므로 비모수 검정이 안성맞춤입니다. 특히 순열 검정은 ML에서 즐겨 쓰입니다. 가정을 사실상 두지 않고, 여러분이 관심 있는 어떤 검정 통계량에도, 심지어 이상한 맞춤형 지표에도 적응할 수 있기 때문입니다. t-검정이 불안해하는 바로 그 지점에서 강건합니다.

▶ 비모수 검정

← 다중 검정 단순 선형 회귀 →