Cálculo de uma variável a partir dos primeiros princípios
A regra da cadeia é a regra sobre a qual o backpropagation é construído. Ela diz como diferenciar uma composição: uma função dentro de outra, como f(g(x)).
Para diferenciar "externa de interna", tome a derivada externa (deixando a interna em paz), depois multiplique pela derivada interna. As taxas de mudança se multiplicam ao longo da cadeia.
Pense nisso como um pipeline: x → g → f. Um empurrão em x é amplificado por g′, depois esse empurrão é amplificado de novo por f′. A amplificação total é o produto dos dois. A figura traça as derivadas se multiplicando ao longo da composição.