Modelo de regressão linear simples

Este é o modelo mais simples para descrever a relação entre uma variável explanatória $x$ e uma variável resposta $y$. O modelo faz a seguintes suposições, em ordem decrescente de importância:

  1. o valor médio da variável resposta é uma funçãi linear de $x$,
  2. a variância da variável resposta é constante (ou seja, a mesma para todos os valores de $x$),
  3. a variação aleatória da variável resposta para qualquer valor fixo de $x$ segue uma distribuição Normal, e estes termos de erro são independentes.

Em termos algébricos, seja $(x_i,y_i)$ para $i = 1, \dots, n$ os valores observados da variável explanatória $x$ e da variável resposta $y$ para os $n$ sujeitos.

O modelo de regressão linear é

\begin{displaymath}y_i = \alpha + \beta x_i +
\varepsilon_i\end{displaymath}

onde $\varepsilon_i$ representa desvios independentes aleatórios da relação linear entre $y$ e $x$ e (para satisfazer nossas três suposições acima)

\begin{displaymath}\varepsilon_i \sim \mbox{Normal}(0,\sigma^2).\end{displaymath}

Note que $\alpha$ e $\beta$ são parâmetros da população, e eles são frequentemente conhecidos como coeficientes. Em particular, $\beta$ é denominado coeficiente, ou efeito, de $x$.





Os dados abaixo parecem satisfazer todas as três suposições:

\includegraphics[width=3.4in]{pics/transform.ps}

Um exemplo construído de dados que não satisfazem nenhuma das suposições é mostrado abaixo:

\includegraphics[width=3.4in]{pics/assump.ps}

Silvia E Shimakura 2006-08-30