Intervalos de confiança mais exatos

Para amostras pequenas, onde $s$ é uma estimativa menos confiável de $\sigma$, devemos construir nosso intervalo de confiança de uma forma ligeiramente diferente.

Ao invés de usar o valor 1.96, usamos um valor ligeiramente maior para refletir nossa redução na confiança. Obtemos o valor requerido da tabela de distribuição $t$. Tomamos o valor correspondente à linha $r=n-1$ graus de liberdade. Note que quanto menor $n$, maiores os valores de $t$.

Então um intervalo de confiança exato é

\begin{displaymath}(\bar{x}- t_{(n-1,0.05)} \times \frac{s}{\sqrt{n}}   ,  
\bar{x}+t_{(n-1,0.05)} \times \frac{s}{\sqrt{n}}).\end{displaymath}

Note ainda que à medida que $n$ cresce, o valor de $t$ torna-se próximo a 1.96.

Repare que se a distribuição da variável original é muito distante de uma normalmente distribuída, e o tamanho amostral é excessivamente pequeno, então as médias amostrais não terão uma distribuição aproximadamente normal e portanto este tipo de intervalo de confiança não deveria ser utilizado.

A distribuição $t$

Valores de $t$ para que $P(\mid T \mid > t)=p$, onde $T$ tem um distribuição $T$ de Student com $r$ graus de liberdade.

    $p$
    0.20 0.10 0.05 0.01 0.001
  1 3.078 6.314 12.706 63.657 636.619
  2 1.886 2.920 4.303 9.925 31.599
  3 1.638 2.353 3.182 5.841 12.924
  4 1.533 2.132 2.776 4.604 8.610
  5 1.476 2.015 2.571 4.032 6.869
  6 1.440 1.943 2.447 3.707 5.959
  7 1.415 1.895 2.365 3.499 5.408
  8 1.397 1.860 2.306 3.355 5.041
  9 1.383 1.833 2.262 3.250 4.781
  10 1.372 1.812 2.228 3.169 4.587
  11 1.363 1.796 2.201 3.106 4.437
  12 1.356 1.782 2.179 3.055 4.318
  13 1.350 1.771 2.160 3.012 4.221
  14 1.345 1.761 2.145 2.977 4.140
  15 1.341 1.753 2.131 2.947 4.073
  16 1.337 1.746 2.120 2.921 4.015
$r$ 17 1.333 1.740 2.110 2.898 3.965
  18 1.330 1.734 2.101 2.878 3.922
  19 1.328 1.729 2.093 2.861 3.883
  20 1.325 1.725 2.086 2.845 3.850
  21 1.323 1.721 2.080 2.831 3.819
  22 1.321 1.717 2.074 2.819 3.792
  23 1.319 1.714 2.069 2.807 3.768
  24 1.318 1.711 2.064 2.797 3.745
  25 1.316 1.708 2.060 2.787 3.725
  26 1.315 1.706 2.056 2.779 3.707
  27 1.314 1.703 2.052 2.771 3.690
  28 1.313 1.701 2.048 2.763 3.674
  29 1.311 1.699 2.045 2.756 3.659
  30 1.310 1.697 2.042 2.750 3.646
  40 1.303 1.684 2.021 2.704 3.551
  50 1.299 1.676 2.009 2.678 3.496
  60 1.296 1.671 2.000 2.660 3.460
  70 1.294 1.667 1.994 2.648 3.435
  80 1.292 1.664 1.990 2.639 3.416
  90 1.291 1.662 1.987 2.632 3.402
  100 1.290 1.660 1.984 2.626 3.390
  $\infty$ 1.282 1.645 1.960 2.576 3.291

Exemplos


Identificação de bactérias em hemoculturas

Um método padrão para identificação de bactérias em hemoculturas vem sendo utilizado há muito tempo, e seu tempo médio de execução (desde a etapa de preparo das amostras até a identificação do gênero e espécie) é de 40,5 horas. Um microbiologista propôs uma nova técnica afirmando que o tempo de execução deste novo processo é menor que o do método padrão.

Os dados abaixo (em horas) são resultantes da aplicação desta nova técnica.

41 38 38 42 39 40 40 38 36 35 43 40 40 41 40,5 40 39 39

n=18, $\bar{x}$=39,42 horas e $s$=1,96 horas

Vamos construir o intervalo de confiança de 95% para o verdadeiro tempo médio de execução deste novo processo.

O erro padrão é portanto:

\begin{displaymath}{\rm SE} =\frac{s}{\sqrt{n}} = \frac{1,96}{\sqrt{18}}=0,462.\end{displaymath}

Temos uma amostra de tamanho $n=18$, então da tabela da distribuição $t$ com 18-1=17 gl e $p$=0,05, temos que $t=2,110$.

Então o intervalo de confiança de 95% para a média populacional é

\begin{displaymath}\bar{x} \pm t \times {\rm SE}=39,42 \pm 2,110 \times 0,462=(38,44;40,39)\end{displaymath}





Portanto estamos 95% confiantes de que o tempo médio de execução do novo processo está entre 38,44 e 40,39 horas e concluímos que existem evidências amostrais de que o novo método para identificação de bactérias tem tempo médio de execução menor que o método padrão.

Exercícios:

  1. Os pulsos em repouso de 920 pessoas sadias foram tomados, e uma média de 72.9 batidas por minuto (bpm) e um desvio padrão de 11.0 bpm foram obtidos. Construa um intervalo de confiança de 95% para a pulsação média em repouso de pessoas sadias com base nesses dados.

  2. Os QIs de 20 meninos com idades entre 6-7 anos de Curitiba foram medidos. O QI médio foi 108.08, e o desvio padrão foi 14.38.

Silvia Shimakura 2005-11-08