التوزيعات الهامشية

رياضيات عدم اليقين

بمعلومية توزيع مشترك p(x, y)، لنفترض أنك تهتم فقط بـ X وتريد نسيان Y. عندئذٍ تُهمِّش: تجمع (أو تكامل) التوزيع المشترك على كل قيم المتغير غير المرغوب فيه. ما يتبقى هو التوزيع الهامشي لـ X وحده.

يأتي الاسم من جداول الاحتمال القديمة: كنت تجمع كل صف وتكتب المجموع في الهامش. مجاميع الصفوف تلك هي هامشي أحد المتغيرين، ومجاميع الأعمدة هي هامشي الآخر. التهميش يعني "كامِل لإزالة المتغير الذي لا تريده."

خذ هذا الجدول ثنائي الاتجاه للطول والوزن ولنفترض أنك تهتم فقط بالطول، متجاهلاً الوزن تماماً. أنت ببساطة تجمع كل صف من التوزيع المشترك p(x, y) وتدون الإجمالي في الهامش — إجمالي الصف هذا هو عدد المرات التي يحدث فيها كل طول بغض النظر عن الوزن. إن قراءة مجاميع الهامش تلك فقط يعطي التوزيع الهامشي لـ X، وهو المتغير الواحد عند النظر إليه بمفرده.

أين يظهر هذا في تعلّم الآلةتهميش المتغيرات الكامنة هو الحساب المحوري والصداع المحوري معًا في النمذجة التوليدية. إمكان البيانات هو p(x) = ∫ p(x, z) dz = ∫ p(x | z) p(z) dz، تكامل على كل قيمة كامنة ممكنة z. ذلك التكامل عادةً ما يكون صعب الحل، وهذا بالضبط سبب أن المشفرات التلقائية المتغايرة تحسّن حدًا أدنى قابلًا للحل (ELBO) بدلًا من حساب الهامشي مباشرة.
▶ التوزيعات الهامشية
← التوزيعات المشتركةالتوزيعات الشرطية →