Testes Não-Paramétricos

Inferência, estimação e tomada de decisão a partir de dados

O teste t apoia-se numa suposição: a de que os dados são aproximadamente normais. Quando essa suposição falha (amostras pequenas, assimetria evidente, caudas pesadas, dados ordinais), entram em cena os testes não-paramétricos. Praticamente não fazem suposições sobre a forma da distribuição, trabalhando geralmente com ordens (postos) em vez dos valores brutos.

Há dois clássicos. O teste de Wilcoxon dos postos com sinal é o equivalente não-paramétrico do teste t emparelhado (pares correspondentes). O teste U de Mann–Whitney é o equivalente do teste t para duas amostras (dois grupos independentes). Ambos perguntam "estes valores tendem a ser maiores?" sem pressupor normalidade.

Imagine julgar uma corrida a pé quando o cronómetro está avariado. Não consegue ler os tempos exatos de chegada, mas ainda consegue ver quem cortou a meta em primeiro, segundo e terceiro. Essa ordem de chegada, as classificações, é suficiente para declarar um vencedor, e não importa se os tempos estiveram separados por 10 segundos ou 10 minutos. Os testes não paramétricos funcionam da mesma forma: substituem valores brutos por classificações, de modo a que uns quantos valores atípicos extremos ou uma distribuição distorcida não consigam desvirtuar o veredicto.

Onde isto aparece no MLAo comparar a exatidão de modelos, as pontuações são muitas vezes um punhado de números não-normais — terreno perfeito para os testes não-paramétricos. Os testes de permutação, em particular, são uma escolha favorita em ML porque praticamente não fazem suposições e adaptam-se a qualquer estatística de teste que queiras, incluindo métricas personalizadas pouco habituais. São robustos exatamente…

▶ Testes Não-Paramétricos

← Testes Múltiplos Regressão Linear Simples →