Interval Kepercayaan

Inferensi, estimasi, dan pengambilan keputusan dari data

Estimasi titik seperti x̄ = 5.2 hampir pasti tidak tepat mean sejati, jadi satu angka sendiri tidak jujur. Interval kepercayaan melaporkan rentang plus tingkat kepercayaan: "θ sejati berada di [L, U], dengan kepercayaan 95%." Ia menguantifikasi seberapa banyak sampel terbatas Anda membiarkan Anda mempercayai estimasi.

Kasus paling umum menggunakan Teorema Limit Pusat: mean sampel kira-kira normal, jadi intervalnya estimasi plus-minus margin galat:

Galat standar σ/√n menyusut saat n tumbuh: empat kali data membagi dua margin. Nilai-z menetapkan kepercayaan: 1.96 untuk 95%, 2.576 untuk 99%.

Di mana ini berlaku dalam MLIni cara paper ML jujur melaporkan hasil. Akurasi "91.2% ± 0.4%" adalah interval kepercayaan; ± adalah error bar. Saat interval dua model tumpang tindih berat, "pemenang" mungkin sekadar sampling beruntung. Saat σ populasi tidak diketahui atau distribusi aneh, bootstrap (menyampel ulang set tes dengan penggantian) membangun interval secara empiris, tanpa formula.

▶ Interval Kepercayaan

← Estimasi Bayesian Kerangka →