Probabilidade Condicional

A matemática da incerteza

Uma nova informação muda as chances. Assim que você descobre que "o dado deu par", a chance de ser 2 deixa de ser 1/6, porque você já eliminou as faces ímpares. A probabilidade condicional é o mecanismo para atualizar uma probabilidade quando você sabe que algum evento B já ocorreu.

Leia P(A | B) como "a probabilidade de A dado B." Geometricamente, é um dar zoom e renormalizar: descarte tudo o que está fora de B, trate B como o novo mundo inteiro e pergunte que fração desse mundo também está em A. Dividir por P(B) reescala tudo para que o mundo encolhido ainda tenha probabilidade total 1.

Imagine um teste de triagem que acabou de dar positivo. Essa pista não muda a realidade, mas estreita as possibilidades: você pode descartar todos cujo teste deu negativo e olhar apenas para o grupo positivo B. A pergunta "eu realmente tenho a doença?" se torna P(A | B), a fração daquele grupo reduzido que está verdadeiramente doente.

Onde isso aparece no MLUm classificador calcula uma probabilidade condicional. Todo o seu trabalho é P(class | input), a probabilidade de cada rótulo dados os pixels ou tokens que ele vê. O vetor softmax é literalmente P(y | x). Condicionar na entrada é o que transforma um prior sobre as classes numa predição.

▶ Probabilidade Condicional

← Axiomas de Probabilidade Teorema de Bayes →