Testes de Hipóteses

Em geral, intervalos de confiança são a forma mais informativa de apresentar os achados pricipais de um estudo.

Contudo, algumas vezes existe um particular interesse em decidir sobre a verdade ou não de uma hipótese específica (se dois grupos têm a mesma média ou não, ou se o parâmetro populacional tem um valor em particular ou não).

Os Testes de hipóteses fornecem-nos uma estrutura para que façamos isto. Veremos que intervalos de confiança e testes de hipóteses estão intimamente relacionados.

Exemplo:
Um pesquisador deseja responder a seguinte pergunta:
Os pássaros migratórios engordam antes de migrar?

Considere os dados coletados por um ornitologista sobre o uso de um determinado lugar para engorda por pássaros de uma certa espécie.

Pode-se perguntar se em média estes pássaros engordam entre Agosto e Setembro.

Somente 10 pássaros foram capturados e seu peso médio nas duas ocasiões foram 11.47 e 12.35 então o peso médio aumentou para esta amostra em particular. (Note que o mesmo conjunto de pássaros foram medidos ambas as vezes.)

Podemos generalizar para o resto dos pássaros que não foram capturados? Será que esta diferença poderia ser devida simplesmente ao acaso?

Em termos estatísticos queremos testar a hipótese nula ou de nulidade (H) de que, em média, não existe mudança no peso dos pássaros.

Assumiremos que os 10 pássaros foram uma amostra aleatória de todos os pássaros migradores daquela espécie e usaremos primeiramente o que aprendemos sobre intervalos de confiança para responder nossas perguntas.

Primeiro vamos calcular as mudanças de peso (Setembro-Agosto):

$\begin{displaymath}1.9 0.7 2.2 -0.1 2.0 1.0 -0.8 -0.2 1.8 0.3\end{displaymath}$

Seja $\mu$ a mudança média de peso na população. Então nossa hipótese nula H e a hipótese alternativa H podem ser escritas como segue:

$\begin{displaymath}{\rm H}_0: \mu = 0, \quad \quad {\rm H}_1: \mu \neq 0. \end{displaymath}$

Um procedimento útil é calcular um intervalo de confiança para a média populacional $\mu$ , e verificar se o intervalo inclui 0 como um valor plausível.

Alternativamente, pode-se proceder da seguinte forma:

Denotando por as diferenças de peso e tem-se que $\bar{x}=0.88$ e , então o erro padrão da diferença de peso média é

$\begin{displaymath}{\rm SE} = s/\sqrt{n} = 1.065/\sqrt{10} = 0.337,\end{displaymath}$

e um valor- de 2.262 é obtido da coluna e linha .

Um intervalo de confiança de 95% para $\mu$ é portanto

$\begin{displaymath} (0.88 - 2.262 \times 0.337, 0.88 + 2.262 \times 0.337) = (0.12, 1.64).\end{displaymath}$

O intervalo não contem o valor 0, fornecendo evidências contra a hipótese nula.

Podemos dizer que existem evidências significativas () de que, em média, os pássaros da espécie estudada mudam de peso de Agosto para Setembro; ou que estamos 95% confiantes de que em média os pesos aumentam por um montante entre 0.12 e 1.64 gramas.

Mas e o intervalo de 99%? Será que ele conteria o valor 0? Este intervalo seria mais amplo e então é mais provável que ele contenha 0. Se ele não incluir 0, isto indicaria uma evidência ainda mais forte contra .

Calculando o intervalo de confiança exatamente da mesma forma, exceto que desta vez precisamos olhar na coluna para obter :

$\begin{displaymath}(0.88 - 3.250 \times 0.337, 0.88 + 3.250 \times 0.337) = (-0.21, 1.97).\end{displaymath}$

Como esperado, este é mais amplo, e agora inclui o valor 0.

Podemos agora dizer: ``não existem evidências significativas ao nível de 1% de que, em média, os pássaros da espécie estudada mudam de peso de Agosto para Setembro.''

O que nós acabamos de fazer foi conduzir um teste perfeitamente válido para a hipótese nula usando intervalos de confiança. Podemos fazer o teste mais rapidamente e obter exatamente as mesmas conclusões pelo seguinte procedimento:

Calcule $t=(\bar{x}-0)/SE = 0.88/0.337 = 2.61$ (o número de erros padrão que $\bar{x}$ dista de 0).
Compare este valor de com aqueles na linha da tabela.
Para este exemplo, está entre os valores nas colunas e . Então nosso valor deve corresponder a um entre estes e portanto devemos ter .

O valor de é interpretado como a probabilidade de observar um valor de mais extremo do que o observado quando $\mu=0$ . É uma medida análoga à proporção de pessoas sadias que são erroneamente diagnosticadas como doentes num exame de laboratório, ou seja, uma medida de falsos positivos.

Subsecções

Silvia Shimakura 2005-11-08