Inference, estimation, and decision-making from data
Veriyi modellemeden önce onu dürüstçe özetlemen gerekir. En temel özet, "veri nerede merkezlenmiş?" sorusunu yanıtlayan tek bir sayıdır. Üç klasik yanıt vardır ve bunlar her zaman aynı fikirde olmaz; işte tam da bu yüzden üçünü de bilmen gerekir.
Ortalama denge noktasıdır: bütün değerleri topla, kaç tane olduklarına böl. Medyan, değerleri sıraladıktan sonraki ortadaki değerdir. Mod ise basitçe en sık görülen değerdir.
Kısa bir sokaktaki satış fiyatlarını yüz binler cinsinden hayal edin: 3, 4, 4, 5, 30. Dört sıradan ev ve bir sahil yalı. Ortalama fiyat 46/5 = 9.2, ancak tek bir sıradan ev bile bu fiyata yakın değil. Sıralandığında ortadaki değer olan medyan yalnızca 4'tür ve tipik evi dürüstçe bildirir, çünkü tek yalı listenin ortasını çok uzağa sürükleyemez.