Amostras independentes

Quando temos amostras independentes de cada uma de duas populações, podemos sumarizá-las pelas suas médias, desvios padrão e tamanhos amostrais.

Denote estas medidas por $\bar{x}_1$, $s_1$, $n_1$ para a amostra 1 e $\bar{x}_2$, $s_2$, $n_2$ para a amostra 2.

Denote as correspondentes médias populacionais e desvios padrão $\mu_1$, $\mu_2$, $\sigma_1$ e $\sigma_2$ respectivamente.

Para os dados de alturas dos estudantes da UFPR, vamos comparar a altura média dos estudantes do sexo masculino com as dos sexo feminino.

Seja o grupo dos homens a amostra 1, e o grupo das mulheres a amostra 2.

As alturas foram medidas em centímetros e as medidas sumárias foram como segue:

$\bar{x}_1=178.85$,   $s_1=7.734$,   $n_1=20$,
$\bar{x}_2=164.09$,   $s_2=9.750$,   $n_2=17$.

Agora claramente uma estimativa natural da diferença entre médias na população, $\mu_1-\mu_2$, é dada pela diferença nas médias amostrais:

\begin{displaymath}
\bar{x}_1 - \bar{x}_2,
\end{displaymath}

e para nossos dados esta é $178.85-164.09 = 14.76$.

Agora o que precisamos é um erro padrão para esta estimativa para que possamos construir um intervalo de confiança ou realizar um teste da hipótese nula H$_0$: $\mu_1 - \mu_2 = 0$ versus H$_1$: $\mu_1-\mu_2 \neq 0$.

O cálculo do erro padrão de $\bar{X}_1 - \bar{X}_2$ depende da suposição feita a respeito dos desvios padrão de cada grupo de comparação.

Uma regra prática é assumir que os desvios padrão populacionais $\sigma_1$ e $\sigma_2$ são iguais se a razão do maior desvio padrão amostral para o menor for menor do que 2 ou 3.

Além disso a suposição de variâncias iguais pode ser grosseiramente avaliada através de histogramas dos dados.

Testes formais estão disponíveis se necessário. Um deles é o teste F para igualdade de variâncias de Levene cuja hipótese nula é a de que $\sigma_1=\sigma_2$.



Subsecções
Silvia Shimakura 2005-11-08