Pochodne cząstkowe

Analiza wielowymiarowa od pierwszych zasad

Większość rachunku wielowymiarowego opiera się na jednej koncepcji: aby zróżniczkować funkcję wielu zmiennych, zmieniaj tylko jedną zmienną naraz, traktując pozostałe jako stałe. Zamroź wartość y, zmieniaj x i sprawdź, jak wpływa to na f. To tempo zmian nazywamy pochodną cząstkową ∂f/∂x.

Zakrzywione ∂ (czyt. "de") to jedyne nowe oznaczenie. Cała reszta to zasady różniczkowania znane z kursu podstawowego (reguła potęgi, wzór na pochodną iloczynu, reguła łańcuchowa), które stosuje się tak, jakby pozostałe zmienne były zwykłymi stałymi.

Stań na zboczu wzgórza, a nachylenie, które odczuwasz, zależy od tego, w którą stronę jesteś zwrócony. Idź dokładnie na wschód, utrzymując swoją pozycję na osi północ-południe bez zmian, a stromość pod stopami to pochodna cząstkowa ∂f/∂x. Odwróć się i zamiast tego idź dokładnie na północ, zachowując pozycję wschód-zachód, a poczujesz inne nachylenie, ∂f/∂y. Każda pochodna cząstkowa zamraża jeden kierunek i podaje wzniesienie lub spadek wzdłuż drugiego.

Gdzie to występuje w MLWyobraź sobie, że zamrażasz wszystkie wagi w sieci oprócz jednej, a następnie sprawdzasz, jak zmienia się wartość funkcji straty, gdy modyfikujesz tylko tę jedną wagę. Odpowiedzią jest pochodna cząstkowa ∂L/∂wᵢ: jej znak podpowiada, w którą stronę zmodyfikować wagę, aby zminimalizować stratę, natomiast jej wartość bezwzględna informuje, jak bardzo strata jest na tę wagę czuła. Wyznaczając…

▶ Pochodne cząstkowe

← Ograniczenia i ciągłość w Rⁿ Pochodne cząstkowe wyższych rzędów →