התפלגויות שוליות

המתמטיקה של אי־ודאות

בהינתן התפלגות משותפת p(x, y), נניח שאכפת לך רק מ־X ואתה רוצה לשכוח את Y. אתה מבצע שילוך: סוכם (או מבצע אינטגרל) על ההתפלגות המשותפת לאורך כל ערכי המשתנה הבלתי־רצוי. מה שנשאר הוא ההתפלגות השולית של X לבדה.

השם בא מטבלאות הסתברות ישנות: היו מחברים כל שורה וכותבים את הסכום בשוליים. סכומי השורות הם השוליים של משתנה אחד, וסכומי העמודות הם השוליים של המשתנה האחר. שילוך פירושו "אנטגרל החוצה את המשתנה שאינך מעוניין בו".

קחו את טבלת הגובה–משקל הדו-ממדית ההיא ונניח שאכפת לכם רק מהגובה, תוך התעלמות מוחלטת מהמשקל. אתם פשוט מסכמים כל שורה של ההתפלגות המשותפת p(x, y) ורושמים את הסך הכל בשוליים — סך השורה הזה הוא באיזו תדירות כל גובה מתרחש ללא קשר למשקל. קריאה של סכומי השוליים הללו בלבד נותנת את ההתפלגות השולית של X, המשתנה האחד שנראה בפני עצמו.

איפה זה ב־MLהשלכת משתנים סמויים היא גם החישוב המרכזי וגם הכאב־ראש המרכזי של מידול גנרטיבי. נראות הנתונים היא p(x) = ∫ p(x, z) dz = ∫ p(x | z) p(z) dz, אינטגרל על כל z סמוי אפשרי. אותו אינטגרל בדרך כלל בלתי־פתיר, שזו בדיוק הסיבה ש־VAEs ממטבים חסם תחתון פתיר (ELBO) במקום לחשב את השולי ישירות.
▶ התפלגויות שוליות
← התפלגויות משותפותהתפלגויות מותנות →