फैलाव के माप — सांख्यिकी

डेटा से अनुमान, आकलन और निर्णय निर्माण

एक केंद्र बताता डेटा कहाँ; फैलाव बताता उस केंद्र के चारों कितना डोलता। दो डेटा समुच्चय समान माध्य और जंगली अलग: एक कसकर गुच्छित, एक सब जगह। फैलाव अंतर।

कार्यसाधक प्रसरण: माध्य से औसत वर्ग दूरी। इसका वर्गमूल, मानक विचलन, डेटा की इकाइयों में, तो निर्वचन आसान।

दो कक्षाएँ एक ही क्विज़ देती हैं और दोनों का औसत 72 है, इसलिए कागज़ पर वे एक जैसी दिखती हैं। लेकिन कक्षा A ने 70, 72, 74 स्कोर किया (सभी एक साथ गुच्छे में) जबकि कक्षा B ने 50, 72, 94 स्कोर किया (व्यापक रूप से बिखरे हुए)। समान केंद्र, पूरी तरह से अलग कहानियाँ: फैलाव (spread) बिल्कुल वह संख्या है जो उन्हें अलग बताती है।

ML में इसका स्थानफैलाव ML विश्वसनीयता में हर जगह। ग्रेडिएंट प्रसरण एक मिनी-बैच पर नियंत्रित कि प्रत्येक प्रशिक्षण चरण कितना शोरी; उच्च प्रसरण का मतलब एक काँपता अवरोह। और जब आप एक मॉडल की सटीकता रिपोर्ट, यादृच्छिक बीजों पर मानक विचलन बताता क्या एक "+0.3%" सुधार वास्तविक या बस शोर। बिना फैलाव का परिणाम आधा परिणाम।