Вывод, оценивание и принятие решений по данным
Простая линейная регрессия — мост от статистики к машинному обучению: простейшая модель, которая предсказывает. Предполагаете, что связь входа x и выхода y — линия плюс случайный шум, и находите линию наилучшего прилегания.
β₀ — пересечение, β₁ — наклон, ε — шум. «Наилучшее прилегание» значит линия, минимизирующая сумму квадратов остатков (вертикальных разрывов между точками и линией), метод обычных наименьших квадратов (OLS).
Двигайте наклон и пересечение на фигуре и смотрите, как меняется сумма квадратов ошибок (SSE). Линия OLS — единственная, доводящая суммарную квадрат длину коралловых остатков до минимума.