Enkelvoudige Lineaire Regressie

Inferentie, schatting en besluitvorming uit data

Enkelvoudige lineaire regressie is de brug van statistiek naar machinaal leren: het is het eenvoudigste model dat voorspelt. Je neemt aan dat de relatie tussen een invoer x en een uitvoer y een lijn plus willekeurige ruis is, en je zoekt de best passende lijn.

β₀ is het snijpunt, β₁ de helling, en ε de ruis. "Best passend" betekent de lijn die de totale gekwadrateerde residuen minimaliseert (de verticale kloven tussen punten en lijn), de methode van de kleinste kwadraten (OLS).

Sleep de helling en het snijpunt in de figuur en kijk hoe de som van gekwadrateerde fouten (SSE) verandert. De OLS-lijn is de unieke lijn die de totale gekwadrateerde lengte van de koraalkleurige residustaafjes naar haar minimum drijft.

Waar dit voorkomt in MLLineaire regressie is de basislijn die elk ML-project zou moeten verslaan voordat het naar iets ingewikkelders grijpt. Haar gekwadrateerde-foutdoel is het regressieverlies (MSE) dat je keer op keer minimaliseert, en (zoals je zag bij MLE) is het precies maximale aannemelijkheid onder Gaussische ruis. Begrijp deze lijn en je begrijpt het skelet van elk gesuperviseerd model.

▶ Enkelvoudige Lineaire Regressie

← Niet-parametrische Toetsen Meervoudige Lineaire Regressie →