A distribuição Normal

A distribuição Normal é a mais familiar das distribuições de probabilidade e também uma das mais importantes em estatística. Esta distribuição tem uma forma de sino.

\includegraphics[width=5in]{pics/normal.ps}

A equação da curva Normal é especificada usando 2 parâmetros: a média populacional $\mu$, e o desvio padrão populacional $\sigma$, ou equivalentemente a variância populacional $\sigma^2$. Denotamos N($\mu, \sigma^2$) à curva Normal com média $\mu$ e variância $\sigma^2$. A média refere-se ao centro da distribuição e o desvio padrão ao espalhamento de curva. A distribuição normal é simétrica em torno da média o que implica que e média, a mediana e a moda são todas coincidentes. Para referência, a equação da curva é

\begin{displaymath}
f(x) = \frac{1}{\sqrt{(2\pi\sigma^2)}}\exp\left\{-\frac{(x-\mu)^2}
{2\sigma^2}\right\}.
\end{displaymath} (1)

Felizmente, você não tem que memorizar esta equação. O importante é que você entenda como a curva é afetada pelos valores numéricos de $\mu$ e $\sigma$. isto é mostrado no diagrama abaixo.

\includegraphics[width=4in]{pics/normstu.ps}

A área sob a curva normal (na verdade abaixo de qualquer função de densidade de probabilidade) é 1. Então, para quaisquer dois valores específicos podemos determinar a proporção de área sob a curva entre esses dois valores. Para a distribuição Normal, a proporção de valores caindo dentro de um, dois, ou três desvios padrão da média são:

Range      Proportion
$\mu \pm 1\sigma$      68.3%  
$\mu \pm 2\sigma$      95.5%  
$\mu \pm 3\sigma$      99.7%  

Este resultado é usado da seguinte maneira. Suponha que os comprimentos de um particular tipo de peixe podem ser descritos por uma distribuição normal, com média 140mm e desvio padrão 15mm. Podemos calcular a proporção dos peixes que têm comprimentos entre 110 e 170mm, por exemplo, como a proporção da área sob a curva entre 110 e 170mm.

Então em nosso exemplo, cerca de 95% dos peixes tem comprimentos entre 110mm e 170mm.

Na prática desejamos calcular probabilidades para diferentes valores de $\mu$ e $\sigma$. Para isso, a variável $X$ cuja distribuição é $N(\mu,\sigma^2)$ é transformada numa forma padronizada $Z$ com distribuição $N(0,1)$ (distribuição normal padrão) pois tal distribuição é tabelada. A quantidade $Z$ é dada por

\begin{displaymath}
Z=\frac{X-\mu}{\sigma}
\end{displaymath} (2)

Exemplo: A concentração de um poluente em água liberada por uma fábrica tem distribuição N(8,1.5). Qual a chance, de que num dado dia, a concentração do poluente exceda o limite regulatório de 10 ppm?

A solução do problema resume-se em determinar a proporção da distribuição que está acima de 10 ppm, ie $P(X>10)$. Usando a estatística z temos:

\begin{displaymath}
P(X>10)=P(Z>\frac{10-8}{1.5})=P(Z>1.33)=1-P(Z \leq 1.33)=0.09
\end{displaymath} (3)

Portanto, espera-se que a água liberada pela fábrica exceda os limites regulatórios cerca de 9% do tempo.

Exercício: A concentração de cadmio em cinzas de um certo lixo radioativo tem distribuição N(1,0.72). Quais são as chances de que uma amostra aleatória das cinzas tenha uma concentração de cadmio entre 0.5 e 1.75 ppm?

Silvia E Shimakura 2006-08-30