Pratinjau Gradient Descent

Kalkulus satu variabel dari prinsip pertama

Misalkan kamu ingin titik terendah sebuah kurva tetapi hanya bisa melihat tanah tepat di bawah kakimu — kamu bisa merasakan kemiringan, tidak lebih. Apa yang kamu lakukan? Sederhana: melangkah ke arah menurun, lalu rasakan lagi, lalu melangkah lagi. Ulangi. Itulah gradient descent, algoritma yang melatih pada dasarnya setiap model AI modern.

Bayangkan berjalan menuruni bukit di kabut tebal yang sangat padat sehingga Anda tidak bisa melihat selangkah ke depan. Anda tidak dapat melihat dasar lembah, tetapi Anda masih bisa merasakan dengan kaki Anda ke arah mana tanah miring ke bawah, dan mengambil langkah ke arah itu. Rasakan, langkahkan, rasakan, langkahkan. Penurunan gradien (gradient descent) adalah persis gerak seret buta dan sabar ini menuju daratan terendah.

Ditulis sebagai aturan yang memperbarui posisimu di setiap langkah:

Di mana ini berlaku dalam MLSatu baris ini adalah jantung setiap optimizer dalam deep learning. Pembaruan bobot memiliki semangat yang identik: w ← w − η∇L, dengan ∇L hanyalah turunan multidimensi (gradien) dari kursus berikutnya. SGD, Adam, RMSProp, dan lainnya semuanya adalah penyempurnaan dari kerangka ini — ukuran langkah yang lebih cerdas, momentum, laju per-parameter — tetapi tulangnya persis aturan di atas.…
▶ Pratinjau Gradient Descent
← KonveksitasProtokol Sketsa Sistematis →