Inferenza, stima e processo decisionale dai dati
Finora la statistica ha riguardato per lo più medie e comportamenti asintotici. Le disuguaglianze di concentrazione pongono una domanda più incisiva e a campione finito: quanto è probabile che una quantità casuale cada lontano dalla sua media? Le loro risposte sono la spina dorsale matematica che spiega perché il machine learning può offrire delle garanzie.
La più elementare, che richiede solo una variabile non negativa e la sua media, è la disuguaglianza di Markov:
Afferma che una variabile non negativa non può, di frequente, valere molte volte la sua media. Se la media è piccola, i valori grandi devono essere rari. È una stima grossolana, ma non richiede quasi nulla.