Cálculo de una variable desde primeros principios
El verdadero pago de Taylor en el aprendizaje automático es linearización: reemplazar una función no lineal terca con su línea tangente cerca de un punto de interés. En un rango pequeño, la aproximación lineal es casi exacta y las cosas lineales son mucho más fáciles de analizar, calcular y razonar.
La sigmoide σ(x) = 1/(1 + e⁻ˣ)es la no linealidad conocida que comprime. Cerca de x = 0 pasa por ½ con pendiente ¼, por lo que su aproximación lineal es:
Un mapa plano de calles en papel trata la Tierra redonda como un plano cerca de una ciudad. A lo largo de unos pocos kilómetros la curvatura es demasiado diminuta para importar, así que la hoja plana es suficientemente precisa para navegar, aunque el planeta es realmente una esfera. La linealización hace lo mismo con una función: cerca de un punto cambia la curva verdadera por la línea tangente f(x) ≈ f(0) + f′(0)·x, exacta localmente y mucho más fácil de utilizar.