Definições

Seja $x_1, x_2, \ldots, x_n$ o conjunto das medidas de uma das variáveis (período das ondas), e seja $y_1,y_2,\ldots,y_n$ as medidas da outra variável (diâmetro médio de sedimentos). Seja $\bar{x}$, $\bar{y}$, $s_x$ e $s_y$ as médias e desvios padrão amostrais dos dois conjuntos de dados.

Para obter uma medida do grau de associação da relação linear entre duas variáveis, usamos o coeficiente de correlação, definido como:

\begin{displaymath}r = \frac{s_{xy}}{s_x s_y}.\end{displaymath}

onde

\begin{displaymath}s_{xy} = \frac{ \sum (x_i - \bar{x})(y_i - \bar{y})}{n-1} =
\frac{ \sum x_i y_i - n \bar{x} \bar{y}}{n-1} .\end{displaymath}

Para os dados do exemplo acima, temos $n=18$, $\bar{x}=0.48$, $\bar{y}=1.58$, $s_x=0.18$, $s_y=0.54$, $\sum x_i y_i = 12.44$ a partir dos quais podemos calcular que $r=-0.079$.

Assim como para médias e desvios padrão, existe uma letra Grega especial que utlizamos para o coeficiante de correlação populacional: $\rho$. Podemos considerar $r$ como sendo uma estimativa de $\rho$, exatamente como $\bar{x}$ é uma estimativa da média populacional $\mu$.

Abaixo estão exemplos de dados com seus coeficientes de correlação correspondentes.

\includegraphics[width=4.9in]{pics/cors.ps}


Silvia E Shimakura 2006-08-30