الانحدار الخطي المتعدد

الاستدلال والتقدير واتخاذ القرار من البيانات

تستخدم التنبّؤات الواقعية عدّة مُدخلات، لا واحداً. يعمّم الانحدار الخطي المتعدد الخط إلى مستوٍ مسطّح (أو مستوٍ فائق) في أبعاد أعلى: تحصل كل سمة على معاملها الخاص. وبتكديس كل البيانات في مصفوفة X، يصبح النموذج مذهلاً في إيجازه:

هنا X هي مصفوفة التصميم ذات البعد n×d (صفّ واحد لكل مشاهدة، وعمود واحد لكل سمة)، وβ هو متّجه المعاملات، وy هو المُخرجات. لحلّ OLS صيغة مغلقة شهيرة:

تستحقّ الهندسة التصوّر. يجب أن يعيش متّجه التنبّؤات Xβ̂ في فضاء أعمدة X، أي مجموعة كل تركيبات أعمدة سماتك. تختار OLS قيمة β̂ التي يكون تنبّؤها أقرب نقطة في ذلك الفضاء إلى y. هندسياً، ŷ هو الإسقاط المتعامد لـ y على فضاء الأعمدة، والباقي y − ŷ متعامد معه. ذلك التعامد هو بالضبط ما تحسبه (XᵀX)⁻¹Xᵀ.

أين يظهر هذا في تعلّم الآلةأنت تنظر إلى مسألة المربّعات الصغرى من الجبر الخطي، فكرة الإسقاط على فضاء الأعمدة نفسها. صيغة المعادلات الطبيعية هي السلف ذو الصيغة المغلقة لما يقرّبه الانحدار التدرّجي للنماذج الأكبر. عندما تكون XᵀX سيّئة الاشتراط (سمات شبه خطّيّة معاً)، ينفجر المعكوس، وهذه بالضبط هي المشكلة التي يصلحها انحدار الحدّ (ridge) بإضافة λI، وهو موضوع الدرسين القادمين.
▶ الانحدار الخطي المتعدد
← الانحدار الخطي البسيطتشخيص النموذج →