Applications

Calcul à une variable depuis les premiers principes

Le véritable bénéfice de Taylor en ML est la linéarisation : remplacer une fonction non linéaire récalcitrante par sa tangente près d'un point d'intérêt. Sur une petite plage l'approximation linéaire est quasi exacte, et les objets linéaires sont bien plus faciles à analyser, calculer et raisonner.

La sigmoïde σ(x) = 1/(1 + e⁻ˣ) est la non-linéarité d'écrasement familière. Près de x = 0 elle passe par ½ avec une pente ¼, donc son approximation linéaire est :

Une carte routière plate sur papier traite la Terre ronde comme un plan près d'une ville. Sur quelques kilomètres, la courbure est trop infime pour avoir de l'importance, la feuille plate est donc suffisamment précise pour naviguer, même si la planète est réellement une sphère. La linéarisation fait la même chose à une fonction : près d'un point, elle échange la vraie courbe contre la ligne tangente f(x) ≈ f(0) + f′(0)·x, suffisamment exacte localement et beaucoup plus facile à utiliser.

Où cela apparaît en MLLa linéarisation est un réflexe central en ML. Les approximations des petits angles et des petites entrées simplifient l'analyse des activations (sigmoïde, GELU, softmax) près de leur point de fonctionnement. Linéariser un réseau autour de ses poids actuels donne la vue du noyau tangent neuronal et sous-tend la façon dont on raisonne sur la dynamique d'entraînement. Et tout optimiseur du premier…

▶ Applications

← Séries de Taylor clés Vecteurs dans Rⁿ →