Kettingregel: scalaire compositie

Meervariabelecalculus vanuit eerste principes

Strip backpropagation tot zijn wiskunde en je vindt deze module. De multivariate kettingregel vertelt je hoe je een compositie van functies differentieert, wat het enige is dat een autograd-engine echt doet. We beginnen met de scalaire versie: hoe een verandering in één invoer doorwerkt via tussenvariabelen naar de uitvoer.

Stel dat z afhangt van tussenvariabelen y₁, y₂, …, die op hun beurt afhangen van invoeren x. Om te vinden hoe z verandert met één invoer, sommeer je over elk pad van die invoer naar de uitvoer, waarbij je de afgeleiden langs elk pad vermenigvuldigt:

Elke term (∂z/∂yₖ)(∂yₖ/∂xᵢ) is de bijdrage van één route; je telt alle routes op. Als er maar één pad is, valt het terug op de bekende 1-D-kettingregel.

Waar dit voorkomt in MLDeze som-over-paden is precies de achterwaartse pas door één knoop van een netwerk. Elke tussenvariabele yₖ is de activatie van een neuron; ∂z/∂yₖ is de gradiënt die er terugstroomt; ∂yₖ/∂xᵢ is de lokale afgeleide van die bewerking. Vermenigvuldig en sommeer, en je hebt de gradiënt één stap teruggepropageerd. Herhaal die stap over de hele graaf en je hebt het model getraind.
▶ Kettingregel: scalaire compositie
← Hessiaan-meetkundeKettingregel: matrixvorm →