Entropia

La matematica dell'incertezza

L'entropia misura l'incertezza: quanto ti aspetti di essere sorpreso da un esito casuale. Una moneta equa è massimamente incerta; una moneta con due teste non ha alcuna sorpresa. Claude Shannon ha trasformato questo in un numero, la sorpresa attesa, dove la sorpresa di un evento raro è −log p(x) (più raro, più sorprendente).

Usando log₂ si misura l'entropia in bit, il numero medio di domande sì/no necessarie per fissare l'esito. L'entropia è massima quando la distribuzione è uniforme (ogni esito ugualmente probabile, massima confusione) e zero quando un esito è certo (nessuna sorpresa possibile).

La figura mostra l'entropia di una singola moneta truccata, H(p) = −p log₂ p − (1−p) log₂(1−p). Trascina p: l'entropia picca a p = 0.5 (1 bit intero, un vero lancio di moneta) e scende a 0 alle estremità certe.

Dove si trova nel MLL'entropia è la radice di quasi ogni loss di classificazione. Fissa il limite per la compressione senza perdita ed è alla base della cross-entropia (prossima lezione), la loss di addestramento standard. Nel RL e nell'esplorazione, all'obiettivo si aggiunge un bonus di entropia per evitare che una policy collassi troppo presto: massimizzare l'entropia significa "resta incerto, continua a…
▶ Entropia
← Covarianza e CorrelazioneCross-Entropia →