Dérivées partielles d'ordre supérieur

Calcul multivarié depuis les premiers principes

Tout comme une fonction à 1 dimension a une dérivée seconde, une fonction à plusieurs variables a des dérivées partielles d'ordre deux. Vous différenciez deux fois. La nouveauté est que vous pouvez désormais choisir par quelle variable différencier à chaque fois, et quelque chose d'élégant se produit lorsque vous les mélangez.

Les dérivées partielles secondes pures ∂²f/∂x² et ∂²f/∂y² mesurent la courbure le long de chaque axe. La dérivée partielle mixte ∂²f/∂x∂y différencie d'abord par y, puis par x ; elle mesure comment la pente dans une direction change lorsque vous vous déplacez dans l'autre.

Une première dérivée partielle vous indique la raideur de la colline ; une deuxième dérivée partielle vous indique comment cette raideur elle-même change au fur et à mesure que vous vous déplacez, ce qui est la courbure de la pente. En marchant vers l'est, le sol continue-t-il à devenir plus raide ou commence-t-il à s'aplanir ? Cette flexion de la pente vers l'est ∂f/∂x lorsque vous avancez plus à l'est est la deuxième dérivée partielle ∂²f/∂x², la courbure de la colline dans cette direction.

Où cela apparaît en MLCette symétrie est la raison pour laquelle la hessienne, la matrice de toutes les dérivées partielles secondes de la perte, s'avère symétrique : Hᵢⱼ = ∂²L/∂wᵢ∂wⱼ = ∂²L/∂wⱼ∂wᵢ = Hⱼᵢ. Une matrice symétrique a des valeurs propres réelles et des vecteurs propres orthogonaux (d'après l'algèbre linéaire), ce qui nous permet de lire proprement la courbure de la surface de perte comme un bol, un dôme ou…
▶ Dérivées partielles d'ordre supérieur
← Dérivées partiellesLe gradient →