Ukuran Pusat

Inferensi, estimasi, dan pengambilan keputusan dari data

Sebelum Anda memodelkan data, Anda harus meringkasnya dengan jujur. Ringkasan paling dasar adalah satu angka yang menjawab "di mana data berpusat?" Ada tiga jawaban klasik, dan mereka tidak selalu setuju, persis mengapa Anda perlu tahu ketiganya.

Mean adalah titik keseimbangan: jumlahkan setiap nilai, bagi dengan berapa banyak. Median adalah nilai tengah setelah Anda mengurutkan. Mode sekadar nilai paling umum.

Bayangkan harga yang diminta di salah satu jalan pendek, dalam ratusan ribu: 3, 4, 4, 5, 30. Empat rumah biasa dan satu rumah mewah di tepi laut. Harga rata-rata adalah 46/5 = 9.2, namun tidak satu pun rumah biasa berharga mendekati itu. Median, nilai tengah setelah diurutkan, hanyalah 4 dan melaporkan rumah pada umumnya dengan jujur, karena satu-satunya rumah mewah tidak dapat menarik bagian tengah daftar terlalu jauh.

Di mana ini berlaku dalam MLSetiap metrik loss yang Anda laporkan adalah ukuran pusat atas set tes. "Mean squared error" merata-rata galat kuadrat; mean sensitif, jadi beberapa prediksi katastropik mendominasinya. Laporkan median galat juga saat Anda mencurigai ekor tebal. Itu memberi tahu apa yang dialami contoh tipikal, bukan apa yang dilakukan beberapa terburuk pada rata-rata.
▶ Ukuran Pusat
← Teorema Limit PusatUkuran Penyebaran →