Variáveis Aleatórias

A matemática da incerteza

Resultados como "cara" ou "a terceira carta vermelha" são pouco práticos para fazer contas. Uma variável aleatória resolve isso: é uma regra que associa um número a cada resultado. Formalmente, X: Ω → ℝ. Lance três moedas e deixe X contar as caras. Agora cada resultado é mapeado para 0, 1, 2 ou 3, e podemos tirar médias, elevar ao quadrado e somar.

Uma roda de parque de diversões para em fatias coloridas, e cada cor paga uma quantia diferente: um número colado em cada resultado. Esse número é uma variável aleatória X, o dinheiro que você ganha em um giro. Listar a frequência com que cada pagamento ocorre, p(x) = P(X = x), informa a você toda a distribuição do seu prêmio.

Para uma variável aleatória discreta, a função massa de probabilidade p(x) = P(X = x) lista a probabilidade de cada valor. Ela deve ser não-negativa e somar 1 ao longo do suporte, o que nada mais é do que os axiomas reescritos em termos de números.

Onde isso aparece no MLUm rótulo Y é uma variável aleatória, e a predição de um modelo também é. O argmax de um softmax, a classe predita, é uma variável aleatória que mapeia a distribuição de saída do modelo para um único índice. Amostrar de um modelo de linguagem é extrair uma variável aleatória (o próximo token) da sua PMF sobre o vocabulário.
▶ Variáveis Aleatórias
← IndependênciaExpectativa →