Uma outra forma de sumarizar dados é em termos dos quantis ou percentis. Essas medidas são particularmente úteis para dados não simétricos.
A mediana (ou percentil 50) é definida como o valor que divide os dados ordenados ao meio, i.e. metade dos dados têm valores maiores do que a mediana, a outra metade tem valores menores do que a mediana.
Adicionalmente, os quartis inferior e superior, Q1 e Q3, são definidos como os valores abaixo dos quais estão um quarto e três quartos, respectivamente, dos dados.
Estes três valores são frequentemente usados para resumir os dados juntamente com o mínimo e o máximo.
Eles são obtidos ordenando os dados do menor para o maior, e então
conta-se o número apropriado de observações: ou seja é
,
e
para o quartil inferior, mediana
e quartil superior, respectivamente.
Para um número par de observações, a mediana é a média dos valores do meio (e analogamente para os quartis inferior e superior).
A medidade de dispersão é a amplitude inter-quartis, IQR Q3
Q1, i.e. é a diferença entre o quartil superior e o inferior.
Exemplo. O número de crianças em 19 famílias foi
A mediana é o (19+1) / 2 = valor, i.e. 3 crianças.
O quartil inferior e superior são os valores e
, i.e. 2 e 6 crianças,
portanto amplitude inter-quartil é de 4 crianças. Note que 50%
dos dados estão entre os quartis inferior e superior.
Box-and-Whisker Plots
Box-and-Whisker plots ou simplesmente box-plots são simples representações diagramáticas dos cinco números sumários: (mínimo, quartil inferior, mediana, quartil superior, máximo).
Um box-plot para os dados acima fica como mostrado a seguir (Figura 31).
shimakur 2016-02-18