الإطار العام — الإحصاء · Mathematics for Machine Learning

الاستدلال والتقدير واتخاذ القرار من البيانات

اختبار الفرضيات هو طريقة منضبطة للإجابة عن السؤال «هل هذا التأثير حقيقي، أم أنه مجرد ضوضاء؟»، وهو السؤال نفسه «هل النموذج A أفضل فعلاً من النموذج B؟». تبدأ بافتراض أنه لا يحدث شيء، ثم تسأل عن مدى الدهشة التي ستثيرها بياناتك لو كان ذلك الافتراض صحيحاً.

ادعاءان متنافسان. الفرضية الصفرية H₀ هي القيمة الافتراضية المملّة: لا تأثير، لا فرق. أما الفرضية البديلة H₁ فهي ما تشتبه به: يوجد تأثير. تحسب إحصائية اختبار من البيانات وتسأل: لو كانت H₀ صحيحة، فما مدى تطرّف هذه القيمة؟

إذا كانت الإحصائية متطرّفة لدرجة أنها نادراً ما تحدث في ظل H₀، فإنك ترفض H₀. وإلا فإنك تفشل في رفضها (ملاحظة: لا تقل أبداً «تقبلها»، لأن غياب الدليل ليس دليلاً على الغياب).

أين يظهر هذا في تعلّم الآلةكل ادّعاء بـ «+0.5% دقة» هو ضمنياً اختبار فرضيات. H₀: النموذجان متساويان في الجودة؛ والفجوة المرصودة هي ضوضاء معاينة. إذا تخطّيت الاختبار، فستطرح تحسينات تختفي عند تقسيم البيانات التالي، وتلاحق أخطاء النوع الأول. السبب الكامل في أن مقاييس ML تُبلغ عن التباين عبر البذور هو أن يتيح لك أن تسأل بصدق ما إذا كان الفرق يتجاوز عتبة الضوضاء.