p-मान — सांख्यिकी · Mathematics for Machine Learning

डेटा से अनुमान, आकलन और निर्णय निर्माण

p-मान "मेरी परीक्षण सांख्यिकी कितनी चरम?" को एक संख्या में। यह आपके कम से कम उतनी चरम डेटा देखने की प्रायिकता, H₀ सच मान। एक छोटा p-मान का मतलब "यह डेटा बहुत आश्चर्यजनक यदि वास्तव में कोई प्रभाव नहीं", जो H₀ के विरुद्ध साक्ष्य।

निर्णय नियम यांत्रिक: पहले एक दहलीज α चुनें (आम 0.05), फिर H₀ अस्वीकार यदि p < α। एक छोटा p H₁ सिद्ध नहीं; यह बस कहता शून्य डेटा खराब समझाता।

p-मान (p-value) एक फ्लूक चेक (fluke check) है: यदि वास्तव में कुछ भी नहीं हो रहा था, तो आपके जैसा परिणाम कितना आश्चर्यजनक होगा? मान लीजिए कि कोई मित्र एक निष्पक्ष (fair) सिक्के का दावा करता है और फिर लगातार नौ बार चित (heads) उछालता है — एक p-मान इस बात पर एक संख्या रखता है कि उबाऊ 'यह निष्पक्ष है' कहानी H₀ के तहत वह सिलसिला कितना दुर्लभ होगा। संख्या जितनी छोटी होगी, परिणाम को किस्मत मानकर टालना उतना ही कठिन होगा।

ML में इसका स्थानML में, एक p-मान बताता कि मॉडल A की बेंचमार्क पर मॉडल B पर जीत संकेत या शोर। लेकिन जाल वास्तविक: एक विशाल परीक्षण समुच्चय के साथ, एक 0.01% सटीकता लाभ 'सार्थक' फिर भी व्यवहार में पूर्णतः निरर्थक। और p-hacking, विन्यास तब तक आज़माना जब तक एक p < 0.05 साफ़, वही कैसे लीडरबोर्ड गैर-प्रतिलिप्य परिणामों से भरते।