Dérivées partielles

Calcul multivarié depuis les premiers principes

Une seule idée porte l'essentiel du calcul à plusieurs variables : pour différencier une fonction de plusieurs variables, ne faites varier qu'une seule variable à la fois et figez toutes les autres. Maintenez y immobile, faites bouger x, et demandez comment f réagit. Ce taux de variation est la dérivée partielle ∂f/∂x.

Le ∂ bouclé (« partiel ») est la seule notation nouvelle. Tout le reste est de la dérivation du Cours I (règle de la puissance, règle du produit, règle de la chaîne) appliquée comme si les variables figées n'étaient que des constantes.

Tenez-vous sur le flanc d'une colline et la pente que vous ressentez dépend de la direction à laquelle vous faites face. Marchez plein est, en gardant votre position nord-sud fixe, et la raideur sous vos pieds est la dérivée partielle ∂f/∂x. Tournez-vous et marchez plutôt plein nord, en gardant est-ouest fixe, et vous ressentez une pente différente, ∂f/∂y. Chaque dérivée partielle gèle une direction et rapporte la montée ou la descente le long de l'autre.

Où cela apparaît en MLImaginez figer tous les poids d'un réseau sauf un, puis demander comment la perte évolue lorsque vous faites bouger ce seul poids. La réponse est la dérivée partielle ∂L/∂wᵢ : son signe vous indique dans quel sens pousser le poids pour réduire la perte, sa taille vous indique à quel point la perte y est sensible. Rassemblez une partielle par poids et vous obtenez le gradient, que les prochaines…
▶ Dérivées partielles
← Limites et continuité dans RⁿDérivées partielles d'ordre supérieur →