Prueba t

Inferencia, estimación y toma de decisiones a partir de datos

La prueba t es la herramienta básica para comparar medias. Responde preguntas como “¿esta media es diferente de un objetivo?” o “¿las medias de estos dos grupos son diferentes?”, usando un estadístico de prueba que mide la separación entre medias en unidades de error estándar.

Para el caso de una muestra (¿la media μ es igual a un objetivo μ₀?), el estadístico es:

El numerador es “¿a qué distancia está la media muestral del objetivo?”; el denominador es el error estándar. Un |t| grande significa que la separación es grande en relación con el ruido, lo que es evidencia contra H₀.

Dónde aparece en el MLLa prueba t pareada es la herramienta correcta para “¿el modelo A es significativamente mejor que el modelo B?” cuando ambos se evalúan sobre los mismos ejemplos. Emparejar por cada instancia de prueba cancela la variación de dificultad entre ejemplos, aislando la diferencia entre modelos. Cuidado: los pliegues estándar de CV se solapan, lo que viola la independencia, y existen pruebas pareadas…

▶ Prueba t

← valores p Pruebas Múltiples →