אקסיומות הסתברות

המתמטיקה של אי־ודאות

איך מקצים מספר ל"כמה סביר"? אנדריי קולמוגורוב הראה שכל התיאוריה נשענת על שלושה כללים בלבד. כל נוסחה אחרת שתשתמש בה היא תוצאה של אלה.

במילים: הסתברויות לעולם לא שליליות; ההסתברות שמשהו יקרה היא בדיוק 1; ולמאורעות שלא יכולים לחפוף, הסתברויות פשוט מתחברות. זה הכל. הסתברות היא דרך לחלק את המסה הכוללת 1 בין התוצאות.

דמיינו פאי שלם חתוך לפרוסות, פרוסה אחת לכל תוצאה. לאף פרוסה לא יכול להיות גודל שלילי (זהו הכלל P(A) ≥ 0), וכל הפרוסות יחד חייבות למלא את הפאי השלם, לעולם לא יותר ולעולם לא פחות, שזה בדיוק P(Ω) = 1. שאלת ההסתברות למאורע משמעותה פשוט חיבור הפרוסות ששייכות לו.

איפה זה ב־MLשכבת softmax הופכת ציונים גולמיים להתפלגות הסתברות שמצייתת לאקסיומות אלה מבנייתה: כל פלט אי־שלילי (אקסיומה 1) והם מסתכמים ל־1 בין המחלקות (אקסיומה 2). כשמודל מדווח "P(חתול) = 0.7", ה־0.3 הנותר מתחלק בין כל שאר המחלקות, שזה כלל המשלים בפעולה. בכל פעם שמנרמלים ציונים להסתברויות, מאכפים את אקסיומות קולמוגורוב.
▶ אקסיומות הסתברות
← מרחבי מדגם ומאורעותהסתברות מותנית →