Modele generatywne vs dyskryminatywne

Wnioskowanie, estymacja i podejmowanie decyzji z danych

Istnieją dwa fundamentalnie odmienne podejścia do budowania klasyfikatora, a podział ten przenika przez całą dziedzinę uczenia maszynowego. Model dyskryminatywny uczy się bezpośrednio wyznaczania granicy decyzyjnej między poszczególnymi klasami. Z kolei model generatywny uczy się wpierw tego, w jaki sposób każda klasa generuje przypisywane jej dane, i wyprowadza wspomnianą granicę dopiero jako swoisty produkt uboczny.

Mówiąc formalnie: model dyskryminatywny estymuje prawdopodobieństwo warunkowe p(y|x) wprost i bezpośrednio, odpowiadając na pytanie: „mając dane te konkretnie cechy, która z etykiet jest najbardziej prawdopodobna?”. Model generatywny natomiast najpierw estymuje prawdopodobieństwo łączne p(x, y) (zazwyczaj poprzez p(x|y) oraz p(y)), a dopiero potem z użyciem klasycznej reguły Bayesa wylicza szukane ostatecznie p(y|x).

Pomyśl o dwojgu studentach kierunków artystycznych. Jeden uczy się malować kota od zera, opanowując sposób, w jaki łączą się ze sobą futro, wąsy i uszy: to model generatywny, uczący się tego, jak każda klasa tworzy swoje dane. Drugi nigdy nic nie maluje, ale staje się genialny w wyszukiwaniu różnic pomiędzy kotem a psem na dowolnym zdjęciu: to model dyskryminatywny, uczący się jedynie granicy między klasami. Malarz potrafi stworzyć nowe koty; ten, który je rozpoznaje, po prostu wyznacza granicę i często jest w tym bystrzejszy.

Gdzie to występuje w MLThis dichotomy organizes huge swaths of ML. A classifier (logistic regression, most neural nets) is discriminative: p(y|x) and nothing more. A VAE or diffusion model is generative: it learns p(x) well enough to synthesize new images, which a discriminator can't do. Naive Bayes vs logistic regression is the classic textbook pair; VAE vs classifier is its modern deep-learning echo.

▶ Modele generatywne vs dyskryminatywne

← Testowanie statystyczne dla ML Oczekiwanie-Maksymalizacja (EM) →