Неявное дифференцирование

Одномерный анализ с первых принципов

Иногда y не дан как аккуратный y = f(x). Вместо этого он вплетён в уравнение, как окружность x² + y² = 25. Наклон dy/dx всё равно можно найти без распутывания, используя неявное дифференцирование.

Весь приём держится на одном допущении: считайте y (скрытой) функцией от x. Затем дифференцируйте обе стороны уравнения по x. Каждый раз, дифференцируя член с y, цепное правило добавляет множитель dy/dx, потому что y зависит от x.

Представьте себе лестницу, прислоненную к стене и начинающую скользить. По мере того как основание отъезжает наружу, верхушка скользит вниз: горизонтальное положение x и вертикальное положение y изменяются вместе, жестко связанные фиксированной длиной лестницы. Вы никогда не выражаете одно через другое, но всё же можете связать скорости их изменения. Неявное дифференцирование делает именно это: дифференцирует уравнение, связывающее x и y, так и не пытаясь выразить y в явном виде.

Где это встречается в MLНеявное дифференцирование — врата к частным производным (следующий курс): фиксируете одни переменные и дифференцируете по одной. Оно также питает неявные слои и equilibrium-модели в современном ML, где выход определён уравнением, а не явной формулой, и вы дифференцируете через это уравнение для градиентов.
▶ Неявное дифференцирование
← Цепное правилоПроизводные высших порядков →