Calcul à une variable depuis les premiers principes
Le véritable bénéfice de Taylor en ML est la linéarisation : remplacer une fonction non linéaire récalcitrante par sa tangente près d'un point d'intérêt. Sur une petite plage l'approximation linéaire est quasi exacte, et les objets linéaires sont bien plus faciles à analyser, calculer et raisonner.
La sigmoïde σ(x) = 1/(1 + e⁻ˣ) est la non-linéarité d'écrasement familière. Près de x = 0 elle passe par ½ avec une pente ¼, donc son approximation linéaire est :
Une carte routière plate sur papier traite la Terre ronde comme un plan près d'une ville. Sur quelques kilomètres, la courbure est trop infime pour avoir de l'importance, la feuille plate est donc suffisamment précise pour naviguer, même si la planète est réellement une sphère. La linéarisation fait la même chose à une fonction : près d'un point, elle échange la vraie courbe contre la ligne tangente f(x) ≈ f(0) + f′(0)·x, suffisamment exacte localement et beaucoup plus facile à utiliser.