Cálculo multivariable desde primeros principios
Desglosa la retropropagación hasta su matemática y encontrarás este módulo. La regla de la cadena multivariada te dice cómo diferenciar una composición de funciones, que es lo único que realmente hace un motor autograd. Empezamos con la versión escalar: cómo un cambio en una entrada se propaga a través de variables intermedias hasta la salida.
Supongamos que z depende de intermedios y₁, y₂, …, los cuales a su vez dependen de entradas x. Para encontrar cómo z cambia con respecto a una entrada, sumar sobre cada camino desde esa entrada hasta la salida, multiplicando las derivadas en cada camino:
Cada término (∂z/∂yₖ)(∂yₖ/∂xᵢ) es la contribución de un camino; sumas todos los caminos. Si hay solo un camino, se reduce a la conocida regla de la cadena 1-D.