Aproximación Lineal

Cálculo multivariable desde primeros principios

Cerca, toda superficie suave parece plana, como la Tierra que sientes plana bajo tus pies. La aproximación lineal reemplaza la función curva cerca de un punto con el plano tangente que lo toca allí. El gradiente proporciona la inclinación de ese plano.

Lee en palabras: el nuevo valor ≈ el viejo valor, más el producto escalar del gradiente con el paso que tomaste. Ese producto escalar es la derivada direccional por el tamaño del paso, la mejor suposición lineal para cuánto f se movió.

Presiona una pequeña pegatina plana en una pelota de playa y, justo donde se asienta, la pelota curva se ve perfectamente plana. La aproximación lineal es esa pegatina: un plano tangente plano que besa la superficie en un punto y reemplaza a la curva cercana. Si deambulas demasiado por la pelota, la pegatina se despega de la superficie — la predicción se desvía.

Dónde aparece en el MLUn paso de descenso del gradiente es una aproximación lineal en acción. Actualizar w ← w − η∇L supone que el cambio en la pérdida se predice bien por el término lineal ∇L·δ. Cuando el paso es demasiado grande, la curvatura que ignoraste (el ‖δ‖² término) te muerde de vuelta y la pérdida puede sobrepasar o divergir. La tasa de aprendizaje η te mantiene en la región donde tratar la superficie como…
▶ Aproximación Lineal
← Derivada DireccionalEl Jacobiano →