Tests Non Paramétriques

Inférence, estimation et prise de décision à partir des données

Le test t s'appuie sur une hypothèse : les données sont à peu près normales. Quand cela échoue (petits échantillons, asymétrie évidente, queues lourdes, données ordinales) les tests non paramétriques entrent en jeu. Ils ne font presque aucune hypothèse sur la forme de la distribution, généralement en travaillant avec les rangs au lieu des valeurs brutes.

Deux incontournables. Le test de Wilcoxon des rangs signés est la contrepartie non paramétrique du test t apparié (paires appariées). Le test U de Mann–Whitney est la contrepartie du test t à deux échantillons (deux groupes indépendants). Tous deux demandent « celles-ci ont-elles tendance à être plus grandes ? » sans supposer la normalité.

Imaginez juger une course à pied quand le chronomètre est cassé. Vous ne pouvez pas lire les temps exacts d'arrivée, mais vous pouvez toujours voir qui a franchi la ligne en premier, deuxième, et troisième. Cet ordre d'arrivée, les rangs, suffit pour déclarer un vainqueur, et peu importe si les temps étaient espacés de 10 secondes ou de 10 minutes. Les tests non paramétriques fonctionnent de la même manière : ils remplacent les valeurs brutes par des rangs, de sorte que quelques valeurs aberrantes extrêmes ou une distribution asymétrique ne peuvent pas fausser le verdict.

Où cela apparaît en MLEn comparant des précisions de modèles, les scores sont souvent une poignée de nombres non normaux, parfaits pour les tests non paramétriques. Les tests de permutation en particulier sont un favori du ML car ils ne font quasiment aucune hypothèse et s'adaptent à toute statistique de test qui vous importe, y compris des métriques personnalisées étranges. Ils sont robustes exactement là où le test…

▶ Tests Non Paramétriques

← Tests Multiples Régression Linéaire Simple →