p-मान

डेटा से अनुमान, आकलन और निर्णय निर्माण

p-मान "मेरी परीक्षण सांख्यिकी कितनी चरम?" को एक संख्या में। यह आपके कम से कम उतनी चरम डेटा देखने की प्रायिकता, H₀ सच मान। एक छोटा p-मान का मतलब "यह डेटा बहुत आश्चर्यजनक यदि वास्तव में कोई प्रभाव नहीं", जो H₀ के विरुद्ध साक्ष्य।

निर्णय नियम यांत्रिक: पहले एक दहलीज α चुनें (आम 0.05), फिर H₀ अस्वीकार यदि p < α। एक छोटा p H₁ सिद्ध नहीं; यह बस कहता शून्य डेटा खराब समझाता।

p-मान (p-value) एक फ्लूक चेक (fluke check) है: यदि वास्तव में कुछ भी नहीं हो रहा था, तो आपके जैसा परिणाम कितना आश्चर्यजनक होगा? मान लीजिए कि कोई मित्र एक निष्पक्ष (fair) सिक्के का दावा करता है और फिर लगातार नौ बार चित (heads) उछालता है — एक p-मान इस बात पर एक संख्या रखता है कि उबाऊ 'यह निष्पक्ष है' कहानी H₀ के तहत वह सिलसिला कितना दुर्लभ होगा। संख्या जितनी छोटी होगी, परिणाम को किस्मत मानकर टालना उतना ही कठिन होगा।

ML में इसका स्थानML में, एक p-मान बताता कि मॉडल A की बेंचमार्क पर मॉडल B पर जीत संकेत या शोर। लेकिन जाल वास्तविक: एक विशाल परीक्षण समुच्चय के साथ, एक 0.01% सटीकता लाभ 'सार्थक' फिर भी व्यवहार में पूर्णतः निरर्थक। और p-hacking, विन्यास तब तक आज़माना जब तक एक p < 0.05 साफ़, वही कैसे लीडरबोर्ड गैर-प्रतिलिप्य परिणामों से भरते।
▶ p-मान
← ढाँचाt-परीक्षण →