Misure di Tendenza Centrale

Inferenza, stima e processo decisionale dai dati

Prima di modellare i dati, devi riassumerli onestamente. Il riassunto più elementare è un singolo numero che risponde alla domanda "dove sono centrati i dati?". Le risposte classiche sono tre, e non sempre concordano: è proprio per questo che devi conoscerle tutte e tre.

La media è il punto di equilibrio: somma tutti i valori e dividi per il loro numero. La mediana è il valore centrale una volta ordinati i dati. La moda è semplicemente il valore più frequente.

Immagina i prezzi di richiesta in una breve strada, in centinaia di migliaia: 3, 4, 4, 5, 30. Quattro case normali e una villa sul lungomare. Il prezzo medio è 46/5 = 9.2, eppure nessuna casa normale costa una cifra simile. La mediana, il valore centrale una volta ordinati, è solo 4 e riporta fedelmente la casa tipica, perché l'unica villa non può trascinare molto il centro della lista.

Dove si trova nel MLOgni metrica di perdita che riporti è una misura di tendenza centrale calcolata sull'insieme di test. L'errore quadratico medio è la media degli errori al quadrato; la media è sensibile, quindi poche previsioni catastrofiche la dominano. Quando sospetti una coda pesante, riporta anche l'errore mediano: ti dice cosa sperimenta un esempio tipico, non l'effetto che i pochi casi peggiori hanno sulla…
▶ Misure di Tendenza Centrale
← Teorema del Limite CentraleMisure di Dispersione →