Выпуклость — Математический анализ I

Выпуклость — форма, делающая оптимизацию лёгкой. Выпуклая функция чашей вверх везде, как миска, и одно это свойство делает её лёгкой для минимизации: есть ровно одна низшая точка, и любой путь под гору ведёт прямо к ней.

Есть три эквивалентных способа видеть выпуклость. Первый, вторая производная неотрицательна везде: f″(x) ≥ 0. Второй, кривая чашей вверх и никогда не изгибается вниз. Третий, определяющая картинка, хорда между любыми двумя точками лежит выше кривой.

Представьте себе гладкую долину или внутренность чаши, и бросьте шарик в любом её месте. Независимо от того, откуда он начнет движение, шарик всегда скатится в единственную самую низкую точку и останется там. Это именно то, что дает вам выпуклость вниз (строгая вогнутость): одна долина, никаких ложных углублений, поэтому любой путь вниз ведет к единственному истинному минимуму.

Где это встречается в MLВыпуклость — разделительная линия в ML. Линейная/логистическая регрессия и SVM имеют выпуклые потери: один глобальный минимум, обучение надёжно и воспроизводимо. Глубокие сети имеют дикие невыпуклые потери с бесчисленными локальными минимумами и сёдлами, поэтому разные случайные инициализации попадают в разные решения, почему скорость обучения так важна и почему нет единственного «того» оптимума.…