توزيعات البيانات

الاستدلال والتقدير واتخاذ القرار من البيانات

المركز الواحد والتشتت الواحد هما مجرد رقمين. أما الشكل الكامل للبيانات (توزيعها) فيحمل أكثر من ذلك بكثير. وأسرع طريقة لرؤيته هي المدرّج التكراري: قسّم المدى إلى فئات وعُدّ كم قيمة تقع في كل فئة. والنسخة المنعّمة منه هي مخطط الكثافة.

بمجرد أن تتمكّن من رؤية الشكل، يهمّ سؤالان: هل هو متماثل أم ملتوٍ، وهل أطرافه ثقيلة أم خفيفة؟

يقيس الالتواء عدم التماثل. التوزيع الملتوي إلى اليمين (الموجب) له طرف طويل يمتدّ نحو اليمين: الدخول، أوقات الانتظار، أحجام الملفات. أما التوزيع الملتوي إلى اليسار فيمتدّ نحو اليسار. في الشكل الملتوي إلى اليمين يقع المتوسط على يمين الوسيط، مسحوبًا بفعل الطرف.

أين يظهر هذا في تعلّم الآلةيقود شكل التوزيع قرارات حقيقية في تعلّم الآلة. يمكن أن تنجرف توزيعات التنشيط داخل الشبكة وتطوّر أطرافًا ثقيلة، ولهذا توجد التسوية على مستوى الدفعة/الطبقة. وتكشف توزيعات الخسارة عبر الدفعات ما إذا كان نموذجك يفشل بشكل منتظم أم يختنق على أقلية ثقيلة الأطراف من الأمثلة الصعبة. والأطراف الثقيلة هي السبب في أن دوال الخسارة القوية (Huber) وقصّ التدرّج ممارسات قياسية.
▶ توزيعات البيانات
← مقاييس التشتتالعلاقات بين المتغيرات →