Marco

Inferencia, estimación y toma de decisiones a partir de datos

Prueba de hipótesis es una forma disciplinada de responder "¿es este efecto real, o podría ser solo ruido?", que es exactamente la pregunta "¿el modelo A es realmente mejor que el modelo B?" Comienzas asumiendo que no hay nada pasando y preguntas cuán sorprendente sería tu datos si eso fuera cierto.

Dos afirmaciones competidoras. La hipótesis nula H₀ es la opción aburrida por defecto: sin efecto, sin diferencia. La hipótesis alternativa H₁ es lo que sospechas: hay un efecto. Calculas una estadística de prueba a partir de los datos y preguntas: si H₀ fuera cierta, ¿cuán extrema sería este valor?

Si la estadística es tan extrema que rara vez sucedería bajo H₀, rechazas H₀. De lo contrario, no rechasla hipótesis (nota: nunca "aceptar", ya que la ausencia de evidencia no es evidencia de ausencia).

Dónde aparece en el MLCada afirmación como "+0.5% de precisión" implica una prueba de hipótesis. H₀: los dos modelos son igualmente buenos; el margen observado es ruido de muestreo. Si omites la prueba, enviarás mejoras que desaparecen en la siguiente partición de datos, persiguiendo errores tipo I. El motivo por el cual las métricas de aprendizaje automático reportan varianza a través de semillas es para permitirte…
▶ Marco
← Intervalos de Confianzavalores p →