Üstel Fonksiyon ve Logaritma

Single-variable calculus from first principles

Makine öğrenmesinde oyunun tamamını iki fonksiyon yürütür: üstel fonksiyon eˣ ve onun tersi olan doğal logaritma ln(x). Olasılıklarda, kayıp fonksiyonlarında, büyüme ve azalmada karşına çıkarlar. Şimdi onlara alışmak, ileride her yerde işine yarar.

eˣ fonksiyonunun tanımlayıcı özelliği şudur: büyüme hızı mevcut değerine eşittir — ne kadar büyükse, o kadar hızlı yükselir. "Üstel büyüme" gerçekten bunu ifade eder: yalnızca "hızlı" olmak değil, kendi büyüklüğüyle orantılı büyümek. Özel sayı e ≈ 2.718, bunun tam olarak doğru olduğu tabandır.

Logaritma ln(x), eˣ işlemini basitçe geri alır: "e hangi kuvvete yükseltilirse x verir?" sorusunu cevaplar. Bu yüzden ln(eˣ) = x ve e^{ln x} = x. Birbirlerinin tersi oldukları için grafikleri y = x doğrusu boyunca ayna görüntüleridir — şekildeki noktayı sürükle ve yansımasının diğer eğriyi çizmesini izle.

Bunun ML'deki yeriSınıflandırmanın temel işçisi olan çapraz entropi kaybı, modelin doğru sınıfa atadığı olasılık p iken −ln(p) üzerine kuruludur. Logaritmanın orada olmasının nedeni tam olarak çarpımdan toplama kuralıdır: tüm veri kümesinin olasılığı dev bir çarpımdır ve ln almak bunu, optimizasyon algoritmasının terim terim türevleyebileceği bir toplama dönüştürür. "Log-olabilirlik" tam olarak bu numaradır.
▶ Üstel Fonksiyon ve Logaritma
← Doğrular ve PolinomlarTrigonometrik Fonksiyonlar →