Mesures de Centre

Inférence, estimation et prise de décision à partir des données

Avant de modéliser les données, il faut les résumer honnêtement. Le résumé le plus basique est un seul nombre qui répond à « où les données sont-elles centrées ? » Il y a trois réponses classiques, et elles ne sont pas toujours d'accord, c'est exactement pourquoi vous devez connaître les trois.

La moyenne est le point d'équilibre : additionnez toutes les valeurs, divisez par leur nombre. La médiane est la valeur du milieu une fois triées. Le mode est simplement la valeur la plus fréquente.

Imaginez les prix de vente dans une petite rue, en centaines de milliers : 3, 4, 4, 5, 30. Quatre maisons ordinaires et un manoir au bord de l'eau. Le prix moyen est de 46/5 = 9.2, pourtant pas une seule maison ordinaire ne coûte près de cela. La médiane, la valeur du milieu une fois triée, est juste de 4 et reflète honnêtement la maison typique, car le manoir isolé ne peut pas tirer le milieu de la liste très loin.

Où cela apparaît en MLChaque métrique de loss que vous rapportez est une mesure de centre sur le jeu de test. L'« erreur quadratique moyenne » moyenne les erreurs au carré ; la moyenne est sensible, donc quelques prédictions catastrophiques la dominent. Rapportez aussi l'erreur médiane quand vous suspectez une queue lourde. Elle vous dit ce qu'un exemple typique subit, pas ce que les pires font à la moyenne.
▶ Mesures de Centre
← Théorème Central LimiteMesures de Dispersion →