Decomposizione Bias-Varianza

Inferenza, stima e processo decisionale dai dati

Perché un modello che si adatta perfettamente ai dati di addestramento spesso fallisce su dati nuovi? La decomposizione bias-varianza ne dà la risposta esatta e quantitativa. Scompone l'errore di predizione atteso di un modello in tre componenti, due delle quali tirano in direzioni opposte.

Il Bias² è l'errore dovuto ad assunzioni sbagliate: un modello troppo semplice per cogliere la verità (underfitting). La Varianza è l'errore dovuto alla sensibilità al particolare campione di addestramento: un modello così flessibile da memorizzare il rumore (overfitting). Il Rumore è irriducibile: la casualità nei dati che nessun modello potrà mai rimuovere.

Fai scorrere la complessità nella figura. Man mano che il modello diventa più complesso, il bias² (verde) diminuisce mentre la varianza (corallo) aumenta. L'errore totale sul test (nero) è la loro somma più il rumore di fondo: una forma a U il cui fondo corrisponde alla complessità ottimale.

Dove si trova nel MLQuesta decomposizione è la teoria dell'underfitting contro l'overfitting, ed è il modo in cui si legge una curva di apprendimento. Errore di addestramento e di test entrambi alti = alto bias = underfitting (usa un modello più grande). Errore di addestramento basso ma di test alto = alta varianza = overfitting (regolarizza, raccogli più dati o semplifica). Selezionare la complessità del modello…
▶ Decomposizione Bias-Varianza
← Regressione RegolarizzataCross-Validation →