Генеративни срещу дискриминативни модели — Статистика

Има два фундаментално различни подхода за изграждане на класификатор и това разделение преминава през цялото машинно обучение. Дискриминативният модел научава директно границата между класовете. Генеративният модел научава как всеки клас генерира своите данни и извежда границата като страничен продукт.

Формално: дискриминативен модел оценява директно условната вероятност p(y|x), отговаряйки на въпроса „предвид тези характеристики (x), кой е етикетът (y)?“ Генеративен модел оценява съвместната вероятност p(x, y) (често чрез p(x|y) и p(y)), след което използва правилото на Бейс, за да изчисли p(y|x).

Помислете за двама студенти по изкуство. Единият се научава да рисува котка от нулата, овладявайки как козината, мустаците и ушите се събират: това е генеративен модел, който научава как всеки клас произвежда своите данни. Другият никога не рисува нищо, но става брилянтен в разпознаването на котка спрямо куче на всяка снимка: това е дискриминативен модел, който научава само границата между класовете. Художникът може да създава нови котки; разпознаващият просто тегли чертата и често е по-остър в това.

Къде се използва това в MLТази дихотомия организира огромни части от машинното обучение. Стандартният класификатор (логистична регресия, повечето невронни мрежи) е дискриминативен: моделира p(y|x) и нищо повече. VAE или дифузионен модел (diffusion model) е генеративен: той научава p(x) достатъчно добре, за да синтезира нови изображения, което дискриминативният модел не може да направи. Наивен Бейс спрямо логистична…