凸性

第一原理からの多変数微分積分

ある最適化問題は易しく、ある問題は難しい、その境界を引く1つの性質:凸性。凸関数は偽の底のない単一のボウル形を持ち、勾配がゼロの場所を見つければその大域的最小値を見つけたことになる。サドルも局所的な罠もない。

定義の絵:関数が凸とは、グラフ上の任意の2点間の直線の弦がグラフ自体の上(または上)にあること。関数は自分自身の近道より上に膨らまない。

滑らかなサラダボウルとでこぼこした卵パックを比較してください。ボウルには真の底が1つあります。どこからビー玉を転がしても、常に同じ低い点に落ち着きます。卵パックは小さな罠でいっぱいで、それぞれが最も低いところに届く前にビー玉を捕らえる偽の底です。凸関数はサラダボウルであり、その単一の保証された最小値が最適化を容易にする理由です。

機械学習における位置づけ凸/非凸の分裂はMLの多くを説明する。線形回帰とロジスティック回帰は凸で、勾配降下法は証明可能に大域最適に到達し、2回の実行は一致する。深層ネットは激しく非凸で、臨界点が溢れ、結果は初期化とランダム性で変わる。その差が古典MLが信頼でき深層学習が気難しく感じる理由。イェンセンの不等式はVAEを訓練するELBOの要石。
▶ 凸性
← Rⁿの臨界点制約付き最適化 →