Üretici ve Ayırt Edici

Inference, estimation, and decision-making from data

Bir sınıflandırıcı kurmanın temelden farklı iki yolu vardır ve bu ayrım tüm makine öğrenmesinin içinden geçer. Bir ayırt edici model, sınıflar arasındaki sınırı doğrudan öğrenir. Bir üretici model, her sınıfın verisini nasıl ürettiğini öğrenir ve sınırı bir yan ürün olarak türetir.

Biçimsel olarak: bir ayırt edici model, koşullu p(y|x)'i doğrudan kestirir ve "bu öznitelikler verildiğinde, hangi etiket?" sorusunu yanıtlar. Bir üretici model, bileşik p(x, y)'yi (çoğu zaman p(x|y) ve p(y) aracılığıyla) kestirir, sonra p(y|x)'i elde etmek için Bayes kuralını kullanır.

İki sanat öğrencisini düşünün. Biri sıfırdan bir kedi çizmeyi öğrenir; kürkün, bıyıkların ve kulakların nasıl bir araya geldiğine hakim olur: bu üretici bir modeldir, her sınıfın verilerini nasıl ürettiğini öğrenir. Diğeri hiçbir zaman bir şey çizmez, ancak herhangi bir fotoğraftaki bir köpeğe karşı bir kediyi tespit etmede mükemmel hale gelir: bu ayırt edici bir modeldir, yalnızca sınıflar arasındaki sınırı öğrenir. Ressam yeni kediler yaratabilir; tespitçi sadece çizgiyi çeker ve çoğu zaman bunda daha keskindir.

Bunun ML'deki yeriBu ikilik, ML'in geniş kesimlerini düzenler. Bir sınıflandırıcı (lojistik regresyon, çoğu sinir ağı) ayırt edicidir: p(y|x) ve fazlası değil. Bir VAE ya da difüzyon modeli üreticidir: yeni görüntüler sentezleyecek kadar iyi p(x) öğrenir, ki bir ayırt edici bunu yapamaz. Naive Bayes'e karşı lojistik regresyon klasik ders kitabı çiftidir; VAE'ye karşı sınıflandırıcı ise onun çağdaş derin öğrenme…

▶ Üretici ve Ayırt Edici

← ML için İstatistiksel Test Expectation-Maximization (EM) →