Pontos Críticos

Cálculo de uma variável a partir dos primeiros princípios

Para encontrar os picos e vales de uma função (os seus máximos e mínimos) caças os pontos planos. No topo de uma colina ou no fundo de um vale, a reta tangente é horizontal, portanto o declive é zero. Esses são os pontos críticos.

Igualar f′(x) = 0 e resolver dá as localizações candidatas. Esta é uma condição necessária para um pico ou vale suave, mas não totalmente suficiente, já que um ponto plano também pode ser uma pausa momentânea (uma inflexão do tipo sela). Confirmas que tipo é com um teste.

Imagine uma caminhada por colinas ondulantes. À medida que sobe para o topo de uma colina a inclinação do solo sobe debaixo das suas botas; à medida que desce para um vale, inclina-se para o outro lado. Precisamente no topo de uma colina, ou no ponto mais baixo de um vale, o solo fica momentaneamente plano, o declive é zero. Esses pontos planos são exatamente os pontos críticos de que anda à procura.

Onde isto aparece no MLTreinar um modelo é minimizar uma loss, e o mínimo está onde o gradiente é zero: exatamente a condição de ponto crítico, generalizada para muitas variáveis (∇L = 0). Gradiente descendente é uma caça numérica por aquele ponto plano. Em altas dimensões, a maioria dos pontos críticos são pontos de sela em vez de verdadeiros mínimos, e é por isso que a otimização em deep learning é subtil: a condição…
▶ Pontos Críticos
← Derivadas de Ordem SuperiorTeste da Segunda Derivada →