Modelo de regressão linear simples

Este é o modelo mais simples para descrever a relação entre uma variável explanatória e uma variável resposta . O modelo faz a seguintes suposições, em ordem decrescente de importância:

o valor médio da variável resposta é uma funçãi linear de ,
a variância da variável resposta é constante (ou seja, a mesma para todos os valores de ),
a variação aleatória da variável resposta para qualquer valor fixo de segue uma distribuição Normal, e estes termos de erro são independentes.

Em termos algébricos, seja para $i = 1, \dots, n$ os valores observados da variável explanatória e da variável resposta para os sujeitos.

O modelo de regressão linear é

$\begin{displaymath}y_i = \alpha + \beta x_i + \varepsilon_i\end{displaymath}$

onde $\varepsilon_i$ representa desvios independentes aleatórios da relação linear entre

e (para satisfazer nossas três suposições acima)

$\begin{displaymath}\varepsilon_i \sim \mbox{Normal}(0,\sigma^2).\end{displaymath}$

Note que $\alpha$ e $\beta$ são parâmetros da população, e eles são frequentemente conhecidos como coeficientes. Em particular, $\beta$ é denominado coeficiente, ou efeito, de

Os dados abaixo parecem satisfazer todas as três suposições:

$\includegraphics[width=3.4in]{pics/transform.ps}$

Um exemplo construído de dados que não satisfazem nenhuma das suposições é mostrado abaixo:

$\includegraphics[width=3.4in]{pics/assump.ps}$

Silvia E Shimakura 2006-08-30