Aplicaciones

Cálculo de una variable desde primeros principios

El verdadero pago de Taylor en el aprendizaje automático es linearización: reemplazar una función no lineal terca con su línea tangente cerca de un punto de interés. En un rango pequeño, la aproximación lineal es casi exacta y las cosas lineales son mucho más fáciles de analizar, calcular y razonar.

La sigmoide σ(x) = 1/(1 + e⁻ˣ)es la no linealidad conocida que comprime. Cerca de x = 0 pasa por ½ con pendiente ¼, por lo que su aproximación lineal es:

Un mapa plano de calles en papel trata la Tierra redonda como un plano cerca de una ciudad. A lo largo de unos pocos kilómetros la curvatura es demasiado diminuta para importar, así que la hoja plana es suficientemente precisa para navegar, aunque el planeta es realmente una esfera. La linealización hace lo mismo con una función: cerca de un punto cambia la curva verdadera por la línea tangente f(x) ≈ f(0) + f′(0)·x, exacta localmente y mucho más fácil de utilizar.

Dónde aparece en el MLLa linealización es una reacción central en aprendizaje automático. Las aproximaciones de ángulo pequeño e input pequeño simplifican el análisis de las activaciones (sigmoide, GELU, softmax) cerca de su punto operativo. Linealizar una red alrededor de sus pesos actuales da la visión del núcleo tangente neuronal y subyace en cómo razonamos sobre los dinámicos de entrenamiento. Y cada optimizador…

▶ Aplicaciones

← Serie de Taylor Clave Vectores en Rⁿ →