valores p

Inferencia, estimación y toma de decisiones a partir de datos

El valor p convierte la pregunta "¿cuán extrema es mi estadística de prueba?" en un solo número. Es la probabilidad de ver datos al menos tan extremos como los tuyos, asumiendo que H₀ es verdadera. Un valor p pequeño significa "estos datos serían muy sorprendentes si realmente no hubiera efecto", lo cual es evidencia contra H₀.

La regla de decisión es mecánica: elige un umbral α de antemano (comúnmente 0.05), luego rechaza H₀ si p < α. Un pequeño valor p no prueba H₁; simplemente dice que la nula explica mal los datos.

Un valor p (p-value) es una verificación de casualidad: si realmente no pasara nada, ¿qué tan sorprendente sería un resultado como el tuyo? Supón que un amigo afirma que una moneda es justa pero lanza nueve caras seguidas — un valor p le pone un número a cuán rara sería esa racha bajo la aburrida historia de 'es justa' H₀. Cuanto menor sea el número, más difícil será descartar el resultado como suerte.

Dónde aparece en el MLEn ML, un valor p te dice si la victoria de A sobre B en una prueba es señal o ruido. Pero el trampantojo es real: con un conjunto de pruebas gigante, un ganancia del 0.01% en precisión puede ser 'significativa' pero completamente sin importancia en la práctica. Y p-hacking, probando configuraciones hasta que una supera p < 0.05, es exactamente cómo las tablas de clasificación se llenan con…
▶ valores p
← MarcoPrueba t →