Medidas Centrales

Inferencia, estimación y toma de decisiones a partir de datos

Antes de modelar los datos, tienes que resumirlos honestamente. La resumen más básico es un número que responde a la pregunta "¿dónde está centrado el dato?" Hay tres respuestas clásicas y no siempre están de acuerdo, por eso necesitas conocerlas todas.

La media es el punto de equilibrio: suma cada valor y divide entre cuántos hay. La mediana es el valor central una vez que los ordenas. La moda simplemente es el valor más común.

Imagina los precios de venta en una calle corta, en cientos de miles: 3, 4, 4, 5, 30. Cuatro casas normales y una mansión frente al agua. El precio medio es 46/5 = 9.2, sin embargo, ni una sola casa normal cuesta cerca de eso. La mediana, el valor central una vez ordenado, es solo 4 y reporta la casa típica honestamente, porque la única mansión no puede arrastrar el centro de la lista muy lejos.

Dónde aparece en el MLCada métrica de pérdida que reportas es una medida del centro sobre el conjunto de prueba. "Error cuadrático medio" promedia los errores cuadrados; la media es sensible, por lo que unas pocas predicciones catastróficas dominan. Reporta también el error mediano cuando sospeches una cola pesada. Te dice qué experimenta un ejemplo típico, no lo que las peores hacen al promedio.
▶ Medidas Centrales
← Teorema del Límite CentralMedidas de Dispersión →