Генеративные и дискриминативные модели — Статистика

Вывод, оценивание и принятие решений по данным

Есть два фундаментально разных способа построить классификатор, и раскол проходит через весь ML. Дискриминативная модель учит границу между классами напрямую. Генеративная модель учит, как каждый класс порождает данные, и выводит границу как побочный продукт.

Формально: дискриминативная модель оценивает условное p(y|x) напрямую, отвечая «при данных признаках, какая метка?» Генеративная модель оценивает совместное p(x, y) (часто через p(x|y) и p(y)), затем по правилу Байеса получает p(y|x).

Подумайте о двух студентах-искусствоведах. Один учится рисовать кошку с нуля, осваивая, как соединяются шерсть, усы и уши: это генеративная модель, изучающая, как каждый класс производит свои данные. Другой никогда ничего не рисует, но становится блестящим в распознавании кошки по сравнению с собакой на любой фотографии: это дискриминативная модель, изучающая только границу между классами. Художник может создавать новых кошек; распознаватель просто проводит черту и часто делает это более четко.

Где это встречается в MLЭта дихотомия организует огромные пласты ML. Классификатор (логистическая регрессия, большинство нейросетей) — дискриминативный: p(y|x) и ничего более. VAE или диффузионная модель — генеративная: учит p(x) достаточно хорошо, чтобы синтезировать новые изображения, что дискриминатор не может. Наивный Байес vs логистическая регрессия — классическая пара из учебника; VAE vs классификатор — её…