Pontos Críticos

Cálculo de uma variável a partir dos primeiros princípios

Para encontrar os picos e vales de uma função (seus máximos e mínimos) você caça os pontos planos. No topo de uma colina ou no fundo de um vale, a reta tangente é horizontal, então a inclinação é zero. Esses são os pontos críticos.

Igualar f′(x) = 0 e resolver dá as localizações candidatas. Esta é uma condição necessária para um pico ou vale suave, mas não totalmente suficiente, já que um ponto plano também pode ser uma pausa momentânea (uma inflexão do tipo sela). Você confirma que tipo é com um teste.

Imagine uma caminhada por colinas onduladas. Conforme você sobe em direção ao topo de uma colina, o chão se inclina para cima sob suas botas; conforme você desce em um vale, ele se inclina para o outro lado. Bem no topo de uma colina, ou no ponto mais baixo do fundo de um vale, o solo é momentaneamente plano, a inclinação é zero. Esses pontos planos são exatamente os pontos críticos que você caça.

Onde isso aparece no MLTreinar um modelo é minimizar uma loss, e o mínimo está onde o gradiente é zero: exatamente a condição de ponto crítico, generalizada para muitas variáveis (∇L = 0). Gradiente descendente é uma caça numérica por aquele ponto plano. Em altas dimensões, a maioria dos pontos críticos são pontos de sela em vez de verdadeiros mínimos, e é por isso que otimização em deep learning é sutil: a condição de…
▶ Pontos Críticos
← Derivadas de Ordem SuperiorTeste da Segunda Derivada →