Optimalisatie met Randvoorwaarden

Meervariabelecalculus vanuit eerste principes

Vaak wil je niet het laagste punt overal; je wilt het laagste punt onder een randvoorwaarde. Minimaliseer het verlies terwijl je de norm van de gewichten begrensd houdt; maximaliseer de marge terwijl punten correct geclassificeerd blijven. Lagrange-multiplicatoren zijn het standaardgereedschap om langs een randvoorwaardenkromme te optimaliseren.

De meetkunde om vast te houden: in het beperkte optimum zijn de niveaukrommen van f raaklijnig aan de randvoorwaarde g(x) = 0. Als ze elkaar zouden kruisen in plaats van raken, dan zou je langs de randvoorwaarde naar een betere waarde kunnen schuiven. Raken betekent dat de twee gradiënten langs dezelfde lijn wijzen, dus zijn ze parallel:

De scalair λ (de Lagrange-multiplicator) is de evenredigheidsfactor. Het verpakken van beide voorwaarden in één object geeft de Lagrangiaan L = f − λg; door ∇L = 0 te stellen krijg je precies de bovenstaande vergelijkingen terug.

Waar dit voorkomt in MLOptimalisatie met randvoorwaarden komt overal voor in ML. Support-vectormachines maximaliseren een marge onder classificatie-randvoorwaarden, en hun duale probleem is opgebouwd uit Lagrange-multiplicatoren (via de KKT-voorwaarden, de uitbreiding die ongelijkheden behandelt). Begrensde gewichtsnormen, trust regions in RL, en geprojecteerde-gradiëntmethoden zijn allemaal terug te voeren op '∇f…

▶ Optimalisatie met Randvoorwaarden

← Convexiteit Multivariate Taylor →