العلاقات بين المتغيرات

الاستدلال والتقدير واتخاذ القرار من البيانات

حتى الآن كان كل متغيّر قائمًا بمفرده. لكن الأسئلة الحقيقية تتضمّن عادةً متغيّرين في آنٍ واحد: هل يرتبط وقت الدراسة بالدرجات؟ هل يرتبط حجم النموذج بالدقّة؟ الأداة الأولى هي مخطط الانتشار (نقطة واحدة لكل ملاحظة، x مقابل y)، الذي يتيح لعينك رصد الاتجاه فورًا.

لوضع رقم على اتجاه خطّي، استخدم معامل ارتباط بيرسون r. يتراوح من −1 إلى +1: +1 خط صاعد مثالي، و−1 خط هابط مثالي، و0 لا علاقة خطّية على الإطلاق.

في الشكل، كلما التصقت النقاط بإحكام أكبر بالخط المُلائَم، اقتربت |r| من 1. وإذا بعثرتها انجرفت r نحو 0.

أين يظهر هذا في تعلّم الآلةتحليل الارتباط أداة يومية في تعلّم الآلة. السمات شديدة الارتباط زائدة عن الحاجة؛ فهي تُضخّم التباين في النماذج الخطّية (التعدّدية الخطّية) وتُهدر السعة. وعند اختيار معيار تقييم، تتحقّق ممّا إذا كان يرتبط بالمقياس الذي يهمّك فعلًا؛ فالمقياس البديل الرخيص مفيد فقط إذا تتبّع المقياس الحقيقي المكلِف.
▶ العلاقات بين المتغيرات
← توزيعات البياناتالمعالم والمقدّرات →