Inferensi, estimasi, dan pengambilan keputusan dari data
uji-t adalah kuda kerja untuk membandingkan mean. Ia menjawab pertanyaan seperti "apakah mean ini berbeda dari target?" atau "apakah mean dua kelompok ini berbeda?", menggunakan statistik uji yang mengukur celah antara mean dalam unit galat standar.
Untuk kasus satu-sampel (apakah mean μ sama dengan target μ₀?), statistiknya:
Pembilang adalah "seberapa jauh mean sampel dari target?"; penyebut adalah galat standar. |t| besar berarti celah besar relatif terhadap noise, yang adalah bukti melawan H₀.
Di mana ini berlaku dalam MLuji-t berpasangan adalah alat yang tepat untuk "apakah model A signifikan lebih baik dari model B?" saat keduanya dievaluasi pada contoh yang sama. Pemasangan pada setiap instance tes membatalkan variasi kesulitan contoh-ke-contoh, mengisolasi perbedaan model. Hati-hati: fold CV standar tumpang tindih, yang melanggar independensi, dan uji berpasangan terkoreksi ada persis untuk ini (Anda akan…