Inferência, estimação e tomada de decisão a partir de dados
Até agora cada variável estava isolada. As perguntas reais costumam envolver duas variáveis ao mesmo tempo: o tempo de estudo relaciona-se com as notas? o tamanho do modelo relaciona-se com a exatidão? A primeira ferramenta é um gráfico de dispersão (um ponto por observação, x contra y), que permite ao teu olho detetar uma tendência instantaneamente.
Para atribuir um número a uma tendência linear, usa o coeficiente de correlação de Pearson r. Varia de −1 a +1: +1 é uma reta ascendente perfeita, −1 uma reta descendente perfeita e 0 indica a ausência de qualquer relação linear.
Na figura, quanto mais de perto os pontos acompanham a reta ajustada, mais próximo de 1 está |r|. Espalha-os e r aproxima-se de 0.