Вывод, оценивание и принятие решений по данным
Есть два фундаментально разных способа построить классификатор, и раскол проходит через весь ML. Дискриминативная модель учит границу между классами напрямую. Генеративная модель учит, как каждый класс порождает данные, и выводит границу как побочный продукт.
Формально: дискриминативная модель оценивает условное p(y|x) напрямую, отвечая «при данных признаках, какая метка?» Генеративная модель оценивает совместное p(x, y) (часто через p(x|y) и p(y)), затем по правилу Байеса получает p(y|x).
Подумайте о двух студентах-искусствоведах. Один учится рисовать кошку с нуля, осваивая, как соединяются шерсть, усы и уши: это генеративная модель, изучающая, как каждый класс производит свои данные. Другой никогда ничего не рисует, но становится блестящим в распознавании кошки по сравнению с собакой на любой фотографии: это дискриминативная модель, изучающая только границу между классами. Художник может создавать новых кошек; распознаватель просто проводит черту и часто делает это более четко.