Puntos Críticos en Rⁿ

Cálculo multivariable desde primeros principios

La optimización en varias dimensiones comienza exactamente donde lo hizo en 1-D: encontrar dónde la pendiente es cero. Pero ahora 'pendiente' es todo el vector gradiente, por lo que un punto crítico es donde cada derivada parcial se anula al mismo tiempo, ∇f = 0.

Esto es necesario pero no suficiente: una pendiente nula marca un mínimo, un máximo o un punto silla. Para distinguirlos introduces la matriz hessiana y lees los signos de sus autovalores, la prueba de segundo orden del Lección 13. Una pendiente nula localiza el candidato; la matriz hessiana lo clasifica.

Camina por un campo de golf montañoso y busca los lugares nivelados, los lugares donde una pelota se quedaría quieta. El tee en la cima de una colina, el green bajo en una hondonada y la silla plana a lo largo de una cresta son puntos donde el suelo es momentáneamente plano en todas las direcciones. Esa planitud es ∇f = 0; si estás en un pico, en una hondonada o en una silla de montar es una pregunta separada que responde el hessiano.

Dónde aparece en el MLCada ejecución de entrenamiento basada en gradiente es una búsqueda para ∇L = 0: el optimizador sigue dando pasos hasta que el gradiente es despreciablemente pequeño. Debido a la historia del punto silla (Lección 13), lo que usualmente encuentra no es 'el' mínimo global sino uno de un enorme número de regiones de bajo error equivalente. Que el descenso por gradiente caiga en una buena suficiente…
▶ Puntos Críticos en Rⁿ
← Gráficas de CálculoConvexidad →