Taylor-Polynome

Eindimensionale Analysis aus ersten Prinzipien

Ein Taylor-Polynom approximiert eine komplizierte Funktion in der Nähe eines Punktes durch ein einfaches Polynom, das so gebaut ist, dass es Funktionswert, Steigung, Krümmung und so weiter genau an diesem Punkt nachbildet. Stimmen genügend davon überein, schmiegt sich das Polynom in der Umgebung eng an die Kurve an.

Die Idee ist schichtweise aufgebaut. Ein konstanter Term bildet die Höhe nach. Fügen Sie einen linearen Term hinzu, und Sie bilden zusätzlich die Steigung nach (das ist die Tangente). Fügen Sie einen quadratischen Term hinzu, und Sie bilden die Krümmung nach. Jeder neue Term bringt eine weitere Ableitung zur Übereinstimmung.

Verstellen Sie in der Abbildung die Anzahl der Terme und beobachten Sie, wie sich ein Polynom niedriger Ordnung von der Kurve ablöst, während sich ein Polynom höherer Ordnung über einen größeren Bereich an sie anschmiegt.

Wo das im ML vorkommtDie Taylor-Entwicklung steckt überall in der Optimierung. Der Gradientenabstieg verwendet den linearen Taylor-Term (erster Ordnung) und macht einen Schritt entlang der Steigung. Das Newton-Verfahren verwendet den quadratischen Term, passt eine Parabel an und springt zu deren Minimum. Die ganze Hierarchie der Optimierungsverfahren läuft auf die Frage hinaus: „Wie viele Taylor-Terme behalten wir?“…

▶ Taylor-Polynome

← Partielle Integration (kurz)Wichtige Taylor-Reihen →