일반 분포의 MLE — 통계학 · Mathematics for Machine Learning

MLE의 절차는 언제나 같습니다. 로그 가능도를 쓰고, 모수에 대해 미분하고, 0으로 놓은 뒤 풀면 됩니다. 가장 자주 만나게 될 두 분포에서는 그 답이 놀랍도록 단순합니다. 바로 표본 평균이지요.

정규 분포에서 뽑은 데이터에 대해 로그 가능도를 최대화하면, 가장 직관적인 추정량이 그대로 나옵니다.

휘어진 동전이 얼마나 편향되었는지 추측하기 위해 여러 번 던지는 것을 상상해 보세요. 최대우도법은 이에 대해 고민하지 않습니다: 앞면이 나올 확률에 대한 단 하나의 가장 좋은 추측은 단지 여러분이 실제로 본 앞면의 비율일 뿐입니다. 추정치 p̂는 진행 중인 집계를 평균으로 바꾼 것, 즉 모습을 바꾼 평범한 표본 평균 x̄에 불과합니다.

머신러닝에서의 위치이러한 닫힌 형태의 해가 있기에 가장 단순한 모델들은 적합이 그토록 빠릅니다. 선형 회귀는 가우시안 잡음을 가정한 MLE이며, 한 번에 구해지는 닫힌 형태의 해를 가집니다. 로지스틱 회귀는 베르누이/범주형 레이블에 대한 MLE로, 닫힌 형태의 해는 없지만 똑같은 원리가 그래디언트 단계를 이끕니다. «로그 가능도 → 미분 → 0»이라는 절차가 모든 적합 과정의 뼈대입니다.