केंद्र के माप

डेटा से अनुमान, आकलन और निर्णय निर्माण

मॉडल से पहले, आपको डेटा ईमानदारी से सारांश। सबसे बुनियादी सारांश एक संख्या जो उत्तर दे "डेटा कहाँ केंद्रित?" तीन क्लासिक उत्तर, और वे हमेशा नहीं मिलते, जो कारण आपको तीनों जानना।

माध्य संतुलन बिंदु: हर मान जोड़ें, कितने से भाग। मध्यिका क्रमबद्ध करने पर मध्य मान। बहुलक बस सबसे आम मान।

एक छोटी सड़क पर पूछने वाली कीमतों की कल्पना करें, जो लाखों में हैं: 3, 4, 4, 5, 30. चार साधारण घर और एक समुद्र तट वाली हवेली। माध्य (mean) कीमत 46/5 = 9.2 है, फिर भी एक भी साधारण घर की कीमत इसके आसपास नहीं है। माध्यिका (median), क्रमित होने पर बीच का मान, केवल 4 है और यह विशिष्ट घर को ईमानदारी से दर्शाती है, क्योंकि अकेली हवेली सूची के मध्य को बहुत दूर नहीं खींच सकती।

ML में इसका स्थानहर हानि मेट्रिक जो आप रिपोर्ट परीक्षण समुच्चय पर केंद्र का माप। "माध्य वर्ग त्रुटि" वर्ग त्रुटियाँ औसत; माध्य संवेदनशील, तो कुछ विनाशकारी भविष्यवाणियाँ हावी। जब आपको भारी पूँछ संदिग्ध, मध्यिका त्रुटि भी रिपोर्ट। यह बताती एक विशिष्ट उदाहरण क्या अनुभव, न कि सबसे खराब कुछ औसत पर क्या।
▶ केंद्र के माप
← केंद्रीय सीमा प्रमेयफैलाव के माप →