Probabilidade Condicional

A matemática da incerteza

Uma nova informação muda as hipóteses. Assim que descobres que "o dado deu par", a hipótese de ser 2 deixa de ser 1/6, porque já eliminaste as faces ímpares. A probabilidade condicional é o mecanismo para atualizar uma probabilidade quando sabes que algum evento B já ocorreu.

Lê P(A | B) como "a probabilidade de A dado B." Geometricamente, é um aproximar e renormalizar: descarta tudo o que está fora de B, trata B como o novo mundo inteiro e pergunta que fração desse mundo também está em A. Dividir por P(B) reescala tudo para que o mundo encolhido ainda tenha probabilidade total 1.

Imagine um teste de rastreio que acabou de dar positivo. Essa pista não muda a realidade, mas reduz as possibilidades: pode descartar todos os que tiveram um teste negativo e olhar apenas para o grupo positivo B. A pergunta "tenho realmente a doença?" torna-se P(A | B), a fração desse grupo reduzido que está verdadeiramente doente.

Onde isto aparece no MLUm classificador calcula uma probabilidade condicional. Todo o seu trabalho é P(class | input), a probabilidade de cada rótulo dados os pixels ou tokens que vê. O vetor softmax é literalmente P(y | x). Condicionar na entrada é o que transforma um prior sobre as classes numa predição.
▶ Probabilidade Condicional
← Axiomas de ProbabilidadeTeorema de Bayes →