Değişkenler Arası İlişkiler

Inference, estimation, and decision-making from data

Şimdiye dek her değişken tek başına durdu. Gerçek sorular genellikle aynı anda iki değişkeni içerir: çalışma süresi notlarla ilişkili mi? model boyutu doğrulukla ilişkili mi? İlk araç bir serpme grafiğidir (her gözlem için bir nokta, x'e karşı y), gözünün bir eğilimi anında yakalamasını sağlar.

Doğrusal bir eğilime bir sayı koymak için Pearson korelasyon katsayısı r'yi kullan. −1'den +1'e gider: +1 kusursuz bir yukarı yönlü doğru, −1 kusursuz bir aşağı yönlü doğru, 0 ise hiçbir doğrusal ilişki yok demektir.

Şekilde, noktalar uydurulmuş doğruya ne kadar sıkı sokulursa, |r| 1'e o kadar yakındır. Onları dağıt, r 0'a doğru kayar.

Bunun ML'deki yeriKorelasyon analizi günlük bir ML aracıdır. Yüksek korelasyonlu öznitelikler gereksizdir; doğrusal modellerde varyansı şişirir (çoklu doğrusallık) ve kapasiteyi boşa harcar. Ve bir değerlendirme ölçütü seçerken, onun gerçekten önemsediğin metrikle korelasyon gösterip göstermediğini denetlersin; ucuz bir vekil metrik yalnızca pahalı gerçek metriği izlerse faydalıdır.
▶ Değişkenler Arası İlişkiler
← Verinin DağılımlarıParametreler ve Tahminciler →