רווחי סמך

הסקה, אומדן וקבלת החלטות מנתונים

אומד נקודתי כמו x̄ = 5.2 כמעט בוודאי אינו בדיוק הממוצע האמיתי, ולכן מספר יחיד לבדו אינו כן. רווח סמך מדווח טווח בתוספת רמת סמך: "ה־θ האמיתי נמצא ב־[L, U], ברמת סמך של 95%." הוא מכמת עד כמה המדגם הסופי שלך מאפשר לסמוך על האומד.

המקרה הנפוץ ביותר נשען על משפט הגבול המרכזי: הממוצע המדגמי נורמלי בקירוב, ולכן הרווח הוא האומד ועוד או פחות שולי שגיאה:

השגיאה התקנית σ/√n מתכווצת ככל ש־n גדל: פי ארבעה נתונים מקטין את השוליים בחצי. ערך ה־z קובע את רמת הסמך: 1.96 ל־95%, 2.576 ל־99%.

איפה זה ב־MLכך מאמרי ML כנים מדווחים תוצאות. דיוק של "91.2% ± 0.4%" הוא רווח סמך; ה־± הוא פס השגיאה. כששני רווחים של שני מודלים חופפים במידה רבה, ה"מנצח" אולי פשוט בר־מזל בדגימה. כש־σ של האוכלוסייה אינו ידוע או כשההתפלגות מוזרה, ה־bootstrap (דגימה חוזרת של קבוצת המבחן עם החזרה) בונה את הרווח אמפירית, ללא נוסחה.
▶ רווחי סמך
← אמידה בייסיאניתהמסגרת →