Merkez Ölçüleri

Inference, estimation, and decision-making from data

Veriyi modellemeden önce onu dürüstçe özetlemen gerekir. En temel özet, "veri nerede merkezlenmiş?" sorusunu yanıtlayan tek bir sayıdır. Üç klasik yanıt vardır ve bunlar her zaman aynı fikirde olmaz; işte tam da bu yüzden üçünü de bilmen gerekir.

Ortalama denge noktasıdır: bütün değerleri topla, kaç tane olduklarına böl. Medyan, değerleri sıraladıktan sonraki ortadaki değerdir. Mod ise basitçe en sık görülen değerdir.

Kısa bir sokaktaki satış fiyatlarını yüz binler cinsinden hayal edin: 3, 4, 4, 5, 30. Dört sıradan ev ve bir sahil yalı. Ortalama fiyat 46/5 = 9.2, ancak tek bir sıradan ev bile bu fiyata yakın değil. Sıralandığında ortadaki değer olan medyan yalnızca 4'tür ve tipik evi dürüstçe bildirir, çünkü tek yalı listenin ortasını çok uzağa sürükleyemez.

Bunun ML'deki yeriBildirdiğin her kayıp metriği test kümesi üzerinde bir merkez ölçüsüdür. "Ortalama karesel hata" karesel hataların ortalamasını alır; ortalama duyarlıdır, bu yüzden birkaç felaket tahmin ona baskın gelir. Ağır bir kuyruktan şüphelendiğinde medyan hatasını da bildir. O sana en kötü birkaç örneğin ortalamaya ne yaptığını değil, tipik bir örneğin ne yaşadığını söyler.
▶ Merkez Ölçüleri
← Merkezi Limit TeoremiYayılım Ölçüleri →