Inferenza, stima e processo decisionale dai dati
Prima di modellare i dati, devi riassumerli onestamente. Il riassunto più elementare è un singolo numero che risponde alla domanda "dove sono centrati i dati?". Le risposte classiche sono tre, e non sempre concordano: è proprio per questo che devi conoscerle tutte e tre.
La media è il punto di equilibrio: somma tutti i valori e dividi per il loro numero. La mediana è il valore centrale una volta ordinati i dati. La moda è semplicemente il valore più frequente.
Immagina i prezzi di richiesta in una breve strada, in centinaia di migliaia: 3, 4, 4, 5, 30. Quattro case normali e una villa sul lungomare. Il prezzo medio è 46/5 = 9.2, eppure nessuna casa normale costa una cifra simile. La mediana, il valore centrale una volta ordinati, è solo 4 e riporta fedelmente la casa tipica, perché l'unica villa non può trascinare molto il centro della lista.