القيم الاحتمالية p — الإحصاء · Mathematics for Machine Learning

الاستدلال والتقدير واتخاذ القرار من البيانات

تحوّل القيمة الاحتمالية p سؤال «ما مدى تطرّف إحصائية اختباري؟» إلى رقم واحد. إنها احتمال مشاهدة بيانات متطرّفة بقدر بياناتك على الأقل، بافتراض أن H₀ صحيحة. القيمة p الصغيرة جداً تعني «ستكون هذه البيانات مدهشة جداً لو لم يكن هناك تأثير حقيقي»، وهذا دليل ضد H₀.

قاعدة القرار آلية: اختر عتبة α مسبقاً (عادةً 0.05)، ثم ارفض H₀ إذا كانت p < α. القيمة p الصغيرة لا تثبت H₁؛ إنها فقط تقول إن الفرضية الصفرية تفسّر البيانات تفسيراً ضعيفاً.

قيمة الاحتمال (p-value) هي فحص للصدفة: إذا لم يكن هناك شيء يحدث حقًا، فما مدى دهشة الحصول على نتيجة مثل نتيجتك؟ افترض أن صديقًا يزعم أن عملته المعدنية عادلة ولكنه يرميها ليحصل على تسعة وجوه متتالية — قيمة الاحتمال (p-value) تضع رقمًا على مدى ندرة تلك السلسلة المتتالية في ظل القصة المملة 'إنها عملة عادلة' H₀. كلما كان الرقم أصغر، كلما كان من الصعب تجاهل النتيجة على أنها مجرد حظ.

أين يظهر هذا في تعلّم الآلةفي ML، تخبرك القيمة p ما إذا كان فوز النموذج A على النموذج B في مقياس معين إشارةً أم ضوضاء. لكن الفخ حقيقي: مع مجموعة اختبار عملاقة، يمكن أن يكون مكسب دقة بنسبة 0.01% «ذا دلالة» لكنه عديم المعنى تماماً عملياً. واستغلال القيمة p (p-hacking)، أي تجربة التهيئات حتى تتجاوز إحداها p < 0.05، هو بالضبط كيف تمتلئ لوحات الصدارة بنتائج غير قابلة لإعادة الإنتاج.