불확실성의 수학
이름이 붙은 몇 가지 분포만으로도 ML에서 마주치는 이산 상황의 대부분을 다룰 수 있습니다. 각 분포는 평균과 분산이 이미 알려진, 곧바로 쓸 수 있는 PMF를 갖추고 있어, 매번 처음부터 유도하는 대신 알맞은 것을 골라 쓰면 됩니다.
Bernoulli(p)는 결과가 두 가지뿐인 한 번의 시행을 나타냅니다. 확률 p로 성공(1), 확률 1−p로 실패(0)입니다. 다른 모든 이산 분포가 여기서 만들어지는 기본 구성 요소입니다.
매일 일어나는 두 가지 집계는 대표적인 분포를 보여줍니다. 동전을 10번 던져 앞면을 세어 보세요. 이 집계는 독립적인 10번의 예/아니오 시도의 합인 이항 분포입니다. 이제 헬프 데스크가 한 시간 동안 받는 전화 통화 횟수를 세어 보세요. 이 집계는 시간에 걸쳐 뿌려진 드문 사건의 법칙인 푸아송 분포로, 단일 발생률 λ가 평균과 분산 모두의 역할을 합니다.