Variáveis Quantitativas Discretas

Quando estamos trabalhando com uma variável discreta que assume poucos valores, podemos dar a ela o mesmo tratamento dado às variáveis qualitativas ordinais, assumindo que cada valor é uma classe e que existe uma ordem natural nessas classes.

A Tabela 3 apresenta a distribuição de freqüências do número de filhos por família em uma localidade, que, nesse caso, assumiu apenas seis valores distintos.


Tabela 3: Distribuição de freqüências do número de filhos por família em uma localidade (25 lares).
Número de Freqüência Freqüência Frequência
filhos Absoluta Relativa (%) Relativa Acumulada (%)
0 1 4,0 4,0
1 4 16,0 20,0
2 10 40,0 60,0
3 6 24,0 84,0
4 2 8,0 92,0
5 2 8,0 100,0
Total 25 100 ---
     

Analisando a Tabela 3, podemos perceber que as famílias mais freqüentes são as de dois filhos (40%), seguida pelas famílias de três filhos. Apenas 16% das famílias têm mais de três filhos, mas são ainda mais comuns do que famílias sem filhos.

A Figura 8 mostra a representação gráfica da Tabela 3 no gráfico à esquerda e a distribuição de freqüências do número de filhos por família na localidade B no gráfico à direita. Como o número de famílias estudadas em cada localidade é diferente, a freqüência utilizada em ambos os gráficos foi a relativa (em porcentagem), tornando os dois gráficos comparáveis. Comparando os dois gráficos, notamos que a localidade B tende a ter famílias menos numerosas do que a localidade A. A maior parte das famílias da localidade B (cerca de 70%) têm um ou nenhum filho.

Figura 8: Distribuição de freqüências do número de filhos por família na localidade A (25 lares) e B (36 lares).
\begin{figure}\mbox{\centerline{\psfig{figure=figuras/fam1.ps,height=1.8in}
\psfig{figure=figuras/fam2.ps,height=1.8in}}}\\
\end{figure}

Importante: Na comparação da distribuição de freqüências de uma variável entre dois ou mais grupos de tamanhos (número de observações) diferentes, devemos usar as freqüências relativas na construção do histograma. Deve-se, também usar a mesma escala em todos os histogramas, tanto na escala vertical quanto na horizontal.

Quando trabalhamos com uma variável discreta que pode assumir um grande número de valores distintos como, por exemplo, o número de ovos que um inseto põe durante sua vida, a construção da tabela de freqüências e de gráficos considerando cada valor como uma categoria fica inviável. A solução é agrupar os valores em classes ao montar a tabela, como mostra a Tabela 4.


Tabela 4: Distribuição de freqüências do número de ovos postos por 250 insetos.
  Freqüências Simples Freqüências Acumuladas
Número Freqüência Freqüência Freq.Abs. Freq.Rel.
de ovos Absoluta Relativa (%) Acumulada Acumulada(%)
10 a 14 4 1,6 4 1,6
15 a 19 30 12,0 34 13,6
20 a 24 97 38,8 131 52,4
25 a 29 77 30,8 208 83,2
30 a 34 33 13,2 241 96,4
35 a 39 7 2,8 248 99,2
40 a 44 2 0,8 250 100,0
Total 250 100 -- --
       

A Figura 9 mostra o gráfico da distribuição de freqüências do número de ovos postos por 250 insetos ao longo de suas vidas. Podemos perceber que o número de ovos está concentrado em torno de 20 a 24 ovos com um ligeiro deslocamento para os valores maiores.

Figura 9: Distribuição de freqüências do número de ovos postos por 250 insetos.
\begin{figure}\centerline{\psfig{figure=figuras/ovos.ps,height=2.7in}}
\end{figure}

A escolha do número de classes e do tamanho das classes depende da amplitude dos valores a serem representados (no exemplo, de 10 a 44) e da quantidade de observações no conjunto de dados.

Classes muito grandes resumem demais a informação contida nos dados, pois forçam a construção de poucas classes. No exemplo dos insetos, seria como, por exemplo, construir classes de tamanho 10, o que reduziria para quatro o número de classes (Figura 10).

Figura 10: Distribuição de freqüências do número de ovos postos por 250 insetos.(classes de tamanho 10)
\begin{figure}\centerline{\psfig{figure=figuras/quatro.ps,height=2.7in}}
\end{figure}

Por outro lado, classes muito pequenas nos levaria a construir muitas classes, o que poderia não resumir a informação como gostaríamos. Além disso, para conjuntos de dados pequenos, pode ocorrer classes com muito poucas observações ou mesmo sem observações. Na Figura 11, há classes sem observações, mesmo o conjunto de dados sendo grande.

Figura 11: Distribuição de freqüências do número de ovos postos por 250 insetos.(classes de tamanho 2)
\begin{figure}\centerline{\psfig{figure=figuras/dois.ps,height=2.7in}}
\end{figure}

Alguns autores recomendam que tabelas de freqüências (e gráficos) possuam de 5 a 15 classes, dependendo do tamanho do conjunto de dados e levando-se em consideração o que foi exposto anteriormente.

Os limites inferiores e superiores de cada classe dependem do tamanho (amplitude) de classe escolhido, que deve ser, na medida do possível, igual para todas as classes. Isso facilita a interpretação da distribuição de freqüências da variável em estudo.

Com o uso do computador na análise estatística de dados, a tarefa de construção de tabelas e gráficos ficou menos trabalhosa e menos dependente de regras rígidas. Se determinado agrupamento de classes não nos pareceu muito bom, podemos construir vários outros quase que instantaneamente e a escolha da melhor representação para a distribuição de freqüências para aquela variável fica muito mais tranqüila.

silvia 2012-09-20