Mehrdimensionale Analysis aus ersten Prinzipien
Die lineare Approximation (Lektion 9) nutzte nur den Gradienten und lieferte eine flache Tangentialebene. Fügt man den nächsten Term hinzu – den aus der Hesse-Matrix gebildeten –, erhält man eine quadratische Approximation: ein Paraboloid, das sich an die Fläche schmiegt und ihre Krümmung erfasst, nicht nur ihre Neigung.
Lies die drei Teile: f(x) ist die Höhe, ∇fᵀδ ist die lineare Korrektur (Steigung) und ½δᵀHδ ist die quadratische Korrektur (Krümmung). Dieser letzte Term ist eine quadratische Form im Schritt – genau das Objekt, dessen Vorzeichen die Eigenwerte der Hesse-Matrix steuern.
Eine flache Tangentialebene, die auf einer gekrümmten Oberfläche ruht, ist so, als würde man einen starren Objektträger aus Glas auf sein Auge legen: Er berührt es an einer Stelle, klafft aber überall sonst. Eine Kontaktlinse funktioniert besser, weil sie so gekrümmt ist, dass sie sich der Oberfläche des Auges anpasst, und zwar nicht nur dort, wo das Auge ist, sondern auch, wie es sich biegt. Der Hesse-Term ½δᵀHδ ist diese eingebaute Krümmung: Er lässt die Näherung sich an die Oberfläche schmiegen, anstatt nur auf ihr zu ruhen.