Testes de Hipóteses

Em geral, intervalos de confiança são a forma mais informativa de apresentar os achados pricipais de um estudo.

Contudo, algumas vezes existe um particular interesse em decidir sobre a verdade ou não de uma hipótese específica (se dois grupos têm a mesma média ou não, ou se o parâmetro populacional tem um valor em particular ou não).

Os Testes de hipóteses fornecem-nos uma estrutura para que façamos isto. Veremos que intervalos de confiança e testes de hipóteses estão intimamente relacionados.

Exemplo:
Um pesquisador deseja responder a seguinte pergunta:
Os pássaros migratórios engordam antes de migrar?

Considere os dados coletados por um ornitologista sobre o uso de um determinado lugar para engorda por pássaros de uma certa espécie.

Pode-se perguntar se em média estes pássaros engordam entre Agosto e Setembro.

Somente 10 pássaros foram capturados e seu peso médio nas duas ocasiões foram 11.47 e 12.35 então o peso médio aumentou para esta amostra em particular. (Note que o mesmo conjunto de pássaros foram medidos ambas as vezes.)

Podemos generalizar para o resto dos pássaros que não foram capturados? Será que esta diferença poderia ser devida simplesmente ao acaso?

Em termos estatísticos queremos testar a hipótese nula ou de nulidade (H$_0$) de que, em média, não existe mudança no peso dos pássaros.

Assumiremos que os 10 pássaros foram uma amostra aleatória de todos os pássaros migradores daquela espécie e usaremos primeiramente o que aprendemos sobre intervalos de confiança para responder nossas perguntas.

Primeiro vamos calcular as mudanças de peso (Setembro-Agosto):


\begin{displaymath}1.9    0.7    2.2   -0.1    2.0    1.0   -0.8   -0.2
    1.8    0.3\end{displaymath}

Seja $\mu$ a mudança média de peso na população. Então nossa hipótese nula H$_0$ e a hipótese alternativa H$_1$ podem ser escritas como segue:


\begin{displaymath}{\rm H}_0:  \mu = 0, \quad \quad {\rm H}_1:  \mu \neq 0. \end{displaymath}

Um procedimento útil é calcular um intervalo de confiança para a média populacional $\mu$, e verificar se o intervalo inclui 0 como um valor plausível.

Alternativamente, pode-se proceder da seguinte forma:

Denotando por $x$ as diferenças de peso e $n=10$ tem-se que $\bar{x}=0.88$ e $s=1.065$, então o erro padrão da diferença de peso média é


\begin{displaymath}{\rm SE} = s/\sqrt{n} = 1.065/\sqrt{10} = 0.337,\end{displaymath}

e um valor-$t$ de 2.262 é obtido da coluna $P=0.05$ e linha $r=n-1=9$.

Um intervalo de confiança de 95% para $\mu$ é portanto


\begin{displaymath}(0.88 - 2.262 \times 0.337,  0.88 + 2.262 \times 0.337)  = 
(0.12, 1.64).\end{displaymath}

O intervalo não contem o valor 0, fornecendo evidências contra a hipótese nula.

Podemos dizer que existem evidências significativas ($P<0.05$) de que, em média, os pássaros da espécie estudada mudam de peso de Agosto para Setembro; ou que estamos 95% confiantes de que em média os pesos aumentam por um montante entre 0.12 e 1.64 gramas.

Mas e o intervalo de 99%? Será que ele conteria o valor 0? Este intervalo seria mais amplo e então é mais provável que ele contenha 0. Se ele não incluir 0, isto indicaria uma evidência ainda mais forte contra $H_0$.

Calculando o intervalo de confiança exatamente da mesma forma, exceto que desta vez precisamos olhar na coluna $P=0.01$ para obter $t=3.250$:

\begin{displaymath}(0.88 - 3.250 \times 0.337,  0.88 + 3.250 \times 0.337)  = 
(-0.21, 1.97).\end{displaymath}

Como esperado, este é mais amplo, e agora inclui o valor 0.

Podemos agora dizer: ``não existem evidências significativas ao nível de 1% de que, em média, os pássaros da espécie estudada mudam de peso de Agosto para Setembro.''

O que nós acabamos de fazer foi conduzir um teste perfeitamente válido para a hipótese nula usando intervalos de confiança. Podemos fazer o teste mais rapidamente e obter exatamente as mesmas conclusões pelo seguinte procedimento:

O valor de $p$ é interpretado como a probabilidade de observar um valor de $t$ mais extremo do que o observado quando $\mu=0$. É uma medida análoga à proporção de pessoas sadias que são erroneamente diagnosticadas como doentes num exame de laboratório, ou seja, uma medida de falsos positivos.



Subsecções
shimakur 2016-02-29