Regressão linear

Um pesquisador investiga o efeito de diferentes quantidades de fertilizante na produção de grama em solo calcário. Dez áreas de 1 m$^2$ foram escolhidos ao acaso, e diferentes quantidades do fertilizante foram aplicados em cada área.

Dois meses depois, as seguintes produções de grama foram obtidas:

\fbox{\begin{tabular}{lcccccccccc}
Massa de fertilizante (g$/$m$^2$) & 25 & 50 &...
...$m$^2$) & 84 & 80 & 90 & 154 & 148 & 169 & 206 & 244 & 212 & 248
\end{tabular}}
O gráfico de dispersão dos dados, com uma linha de melhor ajuste é mostrado abaixo.



\begin{figure}\centerline{\psfig{figure=figuras/fert1.ps,height=3in}}
\end{figure}

Diferentemente dos dados de peso ao nascer vistos anteriormente, aqui se observa uma forte relação que segue claramente uma linha reta.

As questões que tínhamos acerca de predição para dados de peso ao nascer também são relevantes aqui.

Note que sempre colocamos a variável resposta, também chamada de variável dependente, aquilo que desejamos predizer, no eixo vertical.

A variável explanatória ou variável independente vai no eixo horizontal.

Está claro que a linha ajusta-se bem, mas como ela foi escolhida?

A idéia básica é escolher a reta $y=a+bx$ que minimiza a soma de quadrados de desvios verticais dos pontos até a reta.

Denote os valores de fertilizante por $x_1$, $x_2$, ..., $x_n$ com $n=10$, e os valores de produção de $y_1$, $y_2$, ..., $y_n$. Se $a$ e $b$ são candidatos à intercepto e inclinação da reta, então $\hat{y}_i = a+b x_i$ é o valor ajustado para $y_i$ dado por esta linha.

Queremos escolher $a$ e $b$ tais que $\hat{y}_i$ é próximo de $y_i$ para todo $i$, assim minimizamos a soma dos quadrados dos desvios:

\begin{displaymath}\sum_i (y_i-\hat{y}_i)^2.\end{displaymath}

Existem fórmulas simples para as estimativas de mínimos quadrados de $a$ e $b$ que podem ser usadas para calculá-los manualmente, mas podemos obter os valores de programas estatísticos.

As estimativas do intercepto $a$ e inclinação $b$ da reta estão na tabela de Coeficientes. Neste caso encontramos que $\hat{a}=51.93$ e $\hat{b}=0.811$.

Informalmente podemos escrever:

\begin{displaymath}\mbox{\tt produção} = 51.93 + 0.811 \times \mbox{\tt fert} \end{displaymath}



Subsecções
shimakur 2016-02-29