Variáveis Aleatórias

A matemática da incerteza

Resultados como "cara" ou "a terceira carta vermelha" são pouco práticos para fazer contas. Uma variável aleatória resolve isto: é uma regra que associa um número a cada resultado. Formalmente, X: Ω → ℝ. Lança três moedas e deixa X contar as caras. Agora cada resultado é mapeado para 0, 1, 2 ou 3, e podemos tirar médias, elevar ao quadrado e somar.

Uma roda de feira aterra em fatias coloridas, e cada cor paga uma quantia diferente: um número colado a cada resultado. Esse número é uma variável aleatória X, o dinheiro que ganha numa rodada. Listar com que frequência cada pagamento sai, p(x) = P(X = x), diz-lhe toda a distribuição do seu prémio.

Para uma variável aleatória discreta, a função massa de probabilidade p(x) = P(X = x) lista a probabilidade de cada valor. Tem de ser não-negativa e somar 1 ao longo do suporte, o que não passa dos axiomas reescritos em termos de números.

Onde isto aparece no MLUm rótulo Y é uma variável aleatória, e a predição de um modelo também é. O argmax de um softmax, a classe predita, é uma variável aleatória que mapeia a distribuição de saída do modelo para um único índice. Amostrar de um modelo de linguagem é extrair uma variável aleatória (o próximo token) da sua PMF sobre o vocabulário.
▶ Variáveis Aleatórias
← IndependênciaExpectativa →