Байесово оценяване — Статистика

MLE пита „кое едно-единствено θ обяснява най-добре данните?“. Байесовото оценяване (Bayesian estimation) задава по-богат въпрос: „предвид данните, какво е моето пълно убеждение относно θ?“. Вместо едно число, получавате цяло разпределение и можете да включите това, което сте знаели предварително (априорното ви знание).

Има три съставки. Априорното разпределение (prior) p(θ) е вашето убеждение, преди да видите данните. Правдоподобността (likelihood) p(x|θ) е колко добре всяко θ обяснява данните (същият обект като при MLE). Теоремата (правилото) на Байес ги комбинира в апостериорно разпределение (posterior) p(θ|x):

Чете се така: апостериорно убеждение = колко добре θ обяснява данните, претеглено според това колко правдоподобно е било θ в началото. Повечето данни карат правдоподобността да доминира и така „отмиват“ (намаляват ефекта на) априорното разпределение.

Къде се използва това в MLРегуларизацията е именно тази идея в ежедневна употреба. Добавянето на L2 наказание (L2 penalty) λ‖β‖² към функцията на загуба е точно MAP оценка с Гаусово априорно разпределение върху теглата. Априорното допускане казва, че „тегла близо до нула са по-правдоподобни“. Добавянето на L1 наказание съответства на априорно разпределение на Лаплас, което предпочита разредени (sparse) тегла. Намаляването…