Punkty krytyczne

Analiza jednowymiarowa od pierwszych zasad

Aby znaleźć szczyty i doliny funkcji (jej maksima i minima), należy szukać miejsc, w których wykres jest płaski. Na szczycie wzgórza lub na dnie doliny styczna jest pozioma, więc nachylenie wynosi zero. Punkty te nazywamy punktami krytycznymi.

Przyrównanie pochodnej do zera (f′(x) = 0) i rozwiązanie równania pozwala wyznaczyć kandydatów na lokalizacje ekstremów. Jest to warunek konieczny istnienia gładkiego szczytu lub doliny, ale nie jest on warunkiem wystarczającym, ponieważ w płaskim miejscu funkcja może mieć jedynie chwilowy przystanek (punkt przegięcia, tzw. punkt siodłowy). Aby sprawdzić, z jakim rodzajem punktu mamy do czynienia, musimy wykonać odpowiedni test.

Wyobraź sobie wędrówkę przez falujące wzgórza. Kiedy wspinasz się na szczyt wzgórza, ziemia pod twoimi butami podnosi się; kiedy schodzisz w dolinę, przechyla się w drugą stronę. Na samym szczycie wzgórza lub w najniższym punkcie dna doliny ziemia jest na moment płaska, nachylenie wynosi zero. Te płaskie miejsca to dokładnie te punkty krytyczne, na które polujesz.

Gdzie to występuje w MLTrenowanie modelu polega na minimalizacji funkcji straty, a minimum znajduje się tam, gdzie gradient wynosi zero: jest to dokładnie warunek punktu krytycznego, tylko uogólniony na wiele zmiennych (∇L = 0). Metoda spadku wzdłuż gradientu (gradient descent) to numeryczne poszukiwanie takiego płaskiego miejsca. W przestrzeniach o wielu wymiarach większość punktów krytycznych to punkty siodłowe, a…

▶ Punkty krytyczne

← Pochodne wyższych rzędów Test drugiej pochodnej →