Funciones f: Rⁿ → R

Cálculo multivariable desde primeros principios

Una función f: Rⁿ → R toma un vector y devuelve un solo número. El ejemplo que impulsa el aprendizaje automático es la pérdida: ingresa cada peso de la red, obtén un único número que indica cuán mal está funcionando. Todo el entrenamiento es una búsqueda por el punto más bajo de esta función.

Para dos entradas puedes visualizarlo: z = f(x, y) es una superficie, un paisaje de colinas y valles flotando sobre el xy-plano. La altura en cada (x, y) es el valor de la función.

Imagina el aire en una habitación: párate en cualquier punto y un termómetro lee exactamente una temperatura. Eso es una función f: R² → R disfrazada: entra una posición (x, y), y sale un solo número (el calor allí). Toda la habitación se convierte en un paisaje de zonas cálidas y frías, más altas cerca del radiador, más bajas junto a la ventana.

Dónde aparece en el MLCuando ves una curva de pérdida descendiendo durante el entrenamiento, estás viendo un recorrido sobre una de estas superficies. La pérdida L(w₁, …, wₙ) es una función Rⁿ → R sobre el espacio de pesos, con n en millones o billones, y la línea que ves en tu pantalla es solo una sombra en una dimensión de ese recorrido. Las 'picos planos vs agudos' que los investigadores discuten son literalmente…
▶ Funciones f: Rⁿ → R
← Vectores y geometría de RⁿFunciones f: Rⁿ → Rᵐ →