Inferensi, estimasi, dan pengambilan keputusan dari data
Sebelum Anda memodelkan data, Anda harus meringkasnya dengan jujur. Ringkasan paling dasar adalah satu angka yang menjawab "di mana data berpusat?" Ada tiga jawaban klasik, dan mereka tidak selalu setuju, persis mengapa Anda perlu tahu ketiganya.
Mean adalah titik keseimbangan: jumlahkan setiap nilai, bagi dengan berapa banyak. Median adalah nilai tengah setelah Anda mengurutkan. Mode sekadar nilai paling umum.
Bayangkan harga yang diminta di salah satu jalan pendek, dalam ratusan ribu: 3, 4, 4, 5, 30. Empat rumah biasa dan satu rumah mewah di tepi laut. Harga rata-rata adalah 46/5 = 9.2, namun tidak satu pun rumah biasa berharga mendekati itu. Median, nilai tengah setelah diurutkan, hanyalah 4 dan melaporkan rumah pada umumnya dengan jujur, karena satu-satunya rumah mewah tidak dapat menarik bagian tengah daftar terlalu jauh.