المعالم والمقدّرات

الاستدلال والتقدير واتخاذ القرار من البيانات

لكل سؤال إحصائي تقريبًا الشكل نفسه. هناك رقم حقيقي ما في العالم لا يمكنك رؤيته، وهو المعلَم θ (متوسط حقيقي، احتمال نجاح حقيقي). وكل ما لديك هو عيّنة محدودة من البيانات. ومن تلك البيانات تحسب تخمينًا، هو المقدّر θ̂. التقدير هو فنّ بناء تخمينات جيدة ومعرفة مقدار الثقة بها.

بما أن البيانات عشوائية، فإن θ̂ نفسه كمّية عشوائية: أعِد التجربة، تحصل على θ̂ مختلف. نحكم على المقدّر بأمرين: تحيّزه (هل يصيب θ في المتوسط؟) وتباينه (كم يتأرجح من عيّنة إلى أخرى؟).

لا يمكنك شرب وعاء الحساء بأكمله للحكم على التوابل، لذا فإنك تقلبه جيدًا وتتذوق ملعقة واحدة. الملوحة الحقيقية للوعاء بأكمله هي المعلمة θ التي لا يمكنك رؤيتها مباشرة؛ ملوحة ملعقتك هي المُقَدِّر θ̂. قم بالتقليب جيدًا أولاً وستُقَدِّر ملعقة واحدة الوعاء بالكامل بشكل رائع — هذا التقليب هو ما يجعل العينة تمثيلية.

أين يظهر هذا في تعلّم الآلةنقص التلاؤم مقابل فرط التلاؤم هو المفاضلة نفسها. معالم النموذج هي θ̂، مُلائَمة من بيانات تدريب محدودة. نقص التلاؤم = تحيّز عالٍ: النموذج أبسط من أن يلتقط الحقيقة. فرط التلاؤم = تباين عالٍ: النموذج مرن لدرجة أنه يحفظ عيّنة التدريب بعينها، وعيّنة جديدة ستعطي معالم مختلفة جذريًا. اختيار تعقيد النموذج هو اختيار نقطة على هذه المفاضلة.
▶ المعالم والمقدّرات
← العلاقات بين المتغيراتتقدير الإمكان الأقصى →