Teste t

O teste t para duas amostras é adequado para situações em que as respostas aos dois tratamentos são variáveis quantitativas com distribuição gaussiana com parâmetros $ (\mu_1, \sigma)$ e $ (\mu_2, \sigma)$.

Suposição do teste: as variáves estudadas têm distribuições gaussianas com o mesmo desvio-padrão.

Note que $ \mu_1$, $ \mu_2$ e $\sigma$ são parâmetros populacionais e, portanto constantes desconhecidas.

Para testar a hipótese acima,

  1. coletamos uma amostra de tamanho $ n_1$ no grupo 1 e uma amostra de tamanho $ n_2$ no grupo 2.
  2. A partir desses dados, calculamos as médias ($ \bar{x}_1$ e $ \bar{x}_2$) e os desvio-padrão ($ s_1$ e $ s_2$) dos dois grupos.
  3. O critério de decisão para se testar a hipótese nula acima consiste em rejeitar $ H_0$ se

    $\displaystyle T=\frac{\bar{X}_1-\bar{X}_2}{DP(\bar{X}_1-\bar{X}_2)}$

    é "grande", em que $ DP(\bar{X}_1-\bar{X}_2)$ é o desvio-padrão da diferença entre $ \bar{X}_1$ e $ \bar{X}_2$.

A decisão baseada nesta estatística de teste é intuitiva, pois

Em outras palavras, com a estatística $ T$ estamos medindo a diferença entre as médias em termos de desvios-padrão (lembra da interpretação do escore padronizado? É semelhante...).

Devemos rejeitar $ H_0$ se $ T$ for "grande" em valor absoluto.

Para tomarmos esta decisão, usamos a distribuição t de Student (Student, 1908):

Para efetuarmos os cálculos necessários ao teste, precisamos conhecer a expressão para o desvio-padrão de $ \bar{X}_1-\bar{X}_2$.

$\displaystyle DP(\bar{X}_1-\bar{X}_2)=\sqrt{\frac{\sigma^2}{n_1}+\frac{\sigma^2}{n_2}}=\sigma \times \sqrt{\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}$

Precisamos encontrar uma estimativa de $\sigma$ para obter uma estimativa do desvio-padrão de $ (\bar{X}_1-\bar{X}_2)$.

Como a suposição é que as variâncias dos dois grupos são iguais, podemos estimar $\sigma$ como uma média ponderada, com pesos proporcionais aos tamanhos dos grupos,

$\displaystyle s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}$

O teste t para comparação de duas amostras consiste em se rejeitar $ H_0$ em favor de $ H_1$ ao nível de $ \alpha$ de significância, se

$\displaystyle \frac{\bar{x}_1-\bar{x}_2}{s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\vert>t_{n_1+n_2-2;1-\frac{\alpha}{2}}$

em que $ t_{n_1+n_2-2;1-\frac{\alpha}{2}}$ é o percentil de ordem $ 1-\alpha/2$ da distribuição t com $ n_1+n_2-2$ graus de liberdade.

Alternativamente, pode-se obter o valor-p da estatística de teste resultante dos dados e tomar a decisão com base neste p-valor.

silvia 2012-09-20