Dados categóricos

Para verificar a significância estatística da aparente associação numa tabela de raça contra fumo, podemos conduzir o chamado teste de associação de qui-quadrado ($\chi^2$).

A hipótese nula é de que não existe associação entre raça e fumo.

Quanta evidência existe contra esta hipótese em favor da alternativa de que existe uma associação?

Sabemos que o percentual total de fumantes é 39,2%.

Assumindo que a hipótese nula é correta então esperaríamos que o número de fumantes brancas seria 39,2% de 96, ou seja, 37,6.

Da mesma forma, podemos obter os números esperados para o resto da tabela:

\fbox{\begin{tabular}{ll\vert cc\vert c}
\multicolumn{2}{c\vert}{Esperado} & \mu...
...a   & Negra & 15.8 & 10.2 & 26 \\
  & Outra & 40.8 & 26.2 & 67
\end{tabular}}
A discrepância entre as contagens observadas e esperadas podem ser medidas com:

\begin{displaymath}X^2 = \sum_k \frac{(O_k - E_k)^2}{E_k},\end{displaymath}

em que $O_k$ é a contagem observada na casela $k$ e $E_k$ é a contagem esperada na casela $k$.

A soma é sobre todas as caselas na tabela. Valores grandes desta soma correspondem a maiores discrepâncias entre os valores observados e esperados, e portanto mais evidência contra a hipótese nula de não associação.

Para obter um $p$-valor, $X^2$ deveria ser comparada com a distribuição $\chi^2$ com df graus de liberdade em que df $=(r-1)\times(c-1)$ com $r$ o número de linhas na tabela, $c$ o número de colunas na tabela. (Aqui df$=2$.)

Neste caso, o $p$-valor é 0 com 3 casas decimais.

Concluímos que existe evidência estatística muito forte ($p<0,001$) de uma associação entre raça e fumo.

A principal observação é que mulheres na categoria de raça Outra parecem ser muito menos prováveis de fumar durante a gravidez do que mães brancas ou negras.

Também parece que a proporção de mães brancas fumantes é maior do que a de mães negras.



Subsecções
shimakur 2016-02-29