Coleta e Armazenamento de Dados

Exemplo Inicial: Ursos Marrons
Pesquisadores do Instituto Amigos do Urso têm estudado o desenvolvimento dos ursos marrons selvagens que vivem em uma certa floresta do Canadá. O objetivo do projeto é estudar algumas características dos ursos, tais como seu peso e altura, ao longo da vida desses animais.

A ficha de coleta de dados, representada na Figura1, mostra as características que serão estudadas na primeira fase do projeto. Na primeira parte do estudo, 97 ursos foram identificados (por nome), pesados e medidos. Os dados foram coletados através do preenchimento da ficha de coleta.

Figura 1: Ficha de coleta de dados dos ursos marrons.
\begin{figure}\centerline{\psfig{figure=figuras/ursos1.ps,height=5.5in}}
\end{figure}

Para que os ursos possam ser identificados, medidos e avaliados, os pesquisadores precisam anestesiá-los. Mesmo assim, medidas como a do peso são difíceis de serem feitas (qual será o tamanho de uma balança para pesar ursos ?). Desse modo, os pesquisadores gostariam também de encontrar uma maneira de estimar o peso do urso através de uma outra medida mais fácil de se obter, como uma medida de comprimento, por exemplo (altura, circunferência do tórax, etc.). Nesse caso, só seria necessária uma grande fita métrica, o que facilitaria muito a coleta de dados das próximas fases do projeto.

Geralmente, as coletas de dados são feitas através do preenchimento de fichas pelo pesquisador e/ou através de resposta a questionários (o que não foi o caso dos ursos é claro!). Alguns dados são coletados através de medições (altura, peso, pressão sangüínea, etc.), enquanto outros são coletados através de avaliações (sexo, cor, raça, espécie, etc.).

Depois de coletados, os dados devem ser armazenados e sistematizados numa planilha de dados, como mostra a Figura 2. Hoje em dia, essas planilhas são digitais e essa é a maneira de realizar a entrada dos dados num programa de computador.

Figura 2: Representação parcial da planilha de dados do exemplo dos ursos.
\begin{figure}\centerline{\psfig{figure=figuras/planilha.ps,height=3.5in}}
\end{figure}

A planilha de dados é composta por linhas e colunas. Cada linha contém os dados de uma unidade experimental (urso), ou seja de uma ficha de coleta. As características (variáveis) são dispostas em colunas. Assim, a planilha de dados contém um número de linhas igual a número de participantes do estudo e um número de colunas igual ao número de variáveis sendo estudadas.

A planilha de dados dos ursos tem 97 linhas e 10 colunas. Alguns ursos não tiveram sua idade determinada. Esses dados são chamados dados faltantes e é comum representá-los por asteriscos (na verdade, cada software tem sua convenção para representar missing data).

Silvia Shimakura 2005-11-08