Points critiques dans Rⁿ

Calcul multivarié depuis les premiers principes

L'optimisation en plusieurs dimensions commence exactement là où elle commençait en 1-D : trouver où la pente est nulle. Mais désormais la « pente » est tout le vecteur gradient, donc un point critique est l'endroit où toutes les dérivées partielles s'annulent en même temps, ∇f = 0.

C'est nécessaire mais pas suffisant : un gradient nul marque un minimum, un maximum ou une selle. Pour les distinguer, vous faites intervenir la hessienne et lisez les signes de ses valeurs propres, le test du second ordre de la leçon 13. Le gradient nul localise le candidat ; la hessienne le classifie.

Marchez sur un terrain de golf vallonné et cherchez les endroits de niveau, les endroits où une balle resterait immobile. Le tertre de départ sur une colline, le vert bas dans un creux, et la selle plate le long d'une crête sont tous des endroits où le sol est momentanément plat dans toutes les directions. Cette planéité est ∇f = 0 ; que vous soyez sur un pic, dans un creux ou sur une selle est une question distincte à laquelle le hessien répond.

Où cela apparaît en MLChaque entraînement basé sur le gradient est une recherche de ∇L = 0 : l'optimiseur continue de faire des pas jusqu'à ce que le gradient soit négligeablement petit. À cause de l'histoire des points selles (leçon 13), ce qu'il trouve d'ordinaire n'est pas « le » minimum global mais l'une d'un nombre énorme de régions à faible perte quasi équivalentes. Que la descente de gradient atterrisse de…

▶ Points critiques dans Rⁿ

← Graphes de calcul Convexité →