Partielle Ableitungen

Mehrdimensionale Analysis aus ersten Prinzipien

Eine einzige Idee trägt den Großteil der mehrdimensionalen Analysis: Um eine Funktion mit vielen Variablen abzuleiten, änderst du jeweils nur eine Variable und hältst alle anderen fest. Halte y fest, variiere x und frage, wie f darauf reagiert. Diese Änderungsrate ist die partielle Ableitung ∂f/∂x.

Das geschwungene ∂ ("partiell") ist die einzige neue Notation. Alles andere ist die Differentiation aus Kurs I (Potenzregel, Produktregel, Kettenregel), angewendet, als wären die festgehaltenen Variablen einfach Konstanten.

Wenn du auf einem Hang stehst, hängt die Steigung, die du spürst, davon ab, in welche Richtung du blickst. Gehe genau nach Osten und halte deine Nord-Süd-Position fest, dann ist die Steilheit unter den Füßen die partielle Ableitung ∂f/∂x. Drehe dich stattdessen und gehe genau nach Norden, wobei du Ost-West festhältst, und du spürst eine andere Steigung, ∂f/∂y. Jede partielle Ableitung friert eine Richtung ein und berichtet über den Anstieg oder Abfall entlang der anderen.

Wo das im ML vorkommtStell dir vor, du hältst jedes Gewicht in einem Netzwerk fest bis auf ein einziges und fragst dann, wie sich der Verlust ändert, wenn du dieses eine Gewicht ein wenig verschiebst. Die Antwort ist die partielle Ableitung ∂L/∂wᵢ: Ihr Vorzeichen sagt dir, in welche Richtung du das Gewicht verschieben musst, um den Verlust zu senken; ihre Größe gibt an, wie empfindlich der Verlust darauf reagiert.…
▶ Partielle Ableitungen
← Grenzwerte und Stetigkeit in RⁿHöhere partielle Ableitungen →