Modelo de regressão linear simples

Este é o modelo mais simples para descrever a relação entre uma variável explanatória $ x$ e uma variável resposta $ y$. O modelo faz a seguintes suposições, em ordem decrescente de importância:

  1. o valor médio da variável resposta é uma funçãi linear de $ x$,
  2. a variância da variável resposta é constante (ou seja, a mesma para todos os valores de $ x$),
  3. a variação aleatória da variável resposta para qualquer valor fixo de $ x$ segue uma distribuição Normal, e estes termos de erro são independentes.

Em termos algébricos, seja $ (x_i,y_i)$ para $ i = 1, \dots, n$ os valores observados da variável explanatória $ x$ e da variável resposta $ y$ para os $ n$ sujeitos.

O modelo de regressão linear é

$\displaystyle y_i = \alpha + \beta x_i +
\varepsilon_i$

onde $ \varepsilon_i$ representa desvios independentes aleatórios da relação linear entre $ y$ e $ x$ e (para satisfazer nossas três suposições acima)

$\displaystyle \varepsilon_i \sim$   Normal$\displaystyle (0,\sigma^2).$

Note que $ \alpha$ e $ \beta$ são parâmetros da população, e eles são frequentemente conhecidos como coeficientes. Em particular, $ \beta$ é denominado coeficiente, ou efeito, de $ x$.





Os dados abaixo parecem satisfazer todas as três suposições:

\begin{figure}\centerline{\psfig{figure=figuras/transform.ps,width=3.4in}}
\end{figure}

Um exemplo construído de dados que não satisfazem nenhuma das suposições é mostrado abaixo:

\begin{figure}\centerline{\psfig{figure=figuras/assump.ps,width=3.4in}}
\end{figure}

Silvia Shimakura 2011-04-04