A mediana e a amplitude inter-quartis

Uma outra forma de sumarizar dados é em termos dos quantis ou percentis. Essas medidas são particularmente úteis para dados não simétricos.

A mediana (ou percentil 50) é definida como o valor que divide os dados ordenados ao meio, i.e. metade dos dados têm valores maiores do que a mediana, a outra metade tem valores menores do que a mediana.

Adicionalmente, os quartis inferior e superior, Q1 e Q3, são definidos como os valores abaixo dos quais estão um quarto e três quartos, respectivamente, dos dados.

Estes três valores são frequentemente usados para resumir os dados juntamente com o mínimo e o máximo.

Eles são obtidos ordenando os dados do menor para o maior, e então conta-se o número apropriado de observações: ou seja é $\frac{n+1}{4}$, $\frac{n+1}{2}$ e $\frac{3(n+1)}{4}$ para o quartil inferior, mediana e quartil superior, respectivamente.

Para um número par de observações, a mediana é a média dos valores do meio (e analogamente para os quartis inferior e superior).

A medidade de dispersão é a amplitude inter-quartis, IQR $=$ Q3 $-$ Q1, i.e. é a diferença entre o quartil superior e o inferior.

Exemplo. O número de crianças em 19 famílias foi

0, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 10

A mediana é o (19+1) / 2 = $10^{o}$ valor, i.e. 3 crianças.

O quartil inferior e superior são os valores $5^{o}$ e $15^{o}$, i.e. 2 e 6 crianças, portanto amplitude inter-quartil é de 4 crianças. Note que 50% dos dados estão entre os quartis inferior e superior.


Box-and-Whisker Plots

Box-and-Whisker plots ou simplesmente box-plots são simples representações diagramáticas dos cinco números sumários: (mínimo, quartil inferior, mediana, quartil superior, máximo).

Um box-plot para os dados geoquímicos fica como mostrado a seguir (Figura 30).

Figura 30: Representação dos 5 números sumários num box-plot
\begin{figure}\centerline{\psfig{figure=figuras/fig4.ps,height=5in}}
\end{figure}

Silvia Shimakura 2005-11-08