Em R (?), é possível ler um arquivo do Excel diretamente, utilizando o pacote gdata (?) ou RODBC (?). Também é comum salvar o arquivo como texto separado por vírgulas, com extensão .csv. O arquivo .csv pode ser lido sem pacote adicional, utilizando a função read.csv() ou read.csv2().
Um exemplo de dados com uma única avaliação, são dados de Pinta Preta dos Citrus (ppc) em um talhão no município de Itajobi (MG). Os dados foram dispostos em planilha e salvos em arquivo Excel. Uma cópia deste arquivo está disponível em http://leg.ufpr.br/~elias/Rcitrus/citrusData/Itajobi.xls
A função read.csv2() será usada para ler o arquivo Itajobi.csv, pois neste arquivo as
colunas são separadas por “;” e os números decimais usam “.” como separador decimal.
Esse arquivo não possui cabelho com nome das colunas, então usamos o argumento
header=FALSE.
Lendo o arquivo:
O objeto ita, que contem os dados no ambiente R, é da classe data.frame.
Nesse talhão há 62 linhas de plantas e 58 plantas na linha com o maior número de plantas.
Esta é uma representação espacial simplista, em linhas e colunas, das plantas de um talhão.
Pode-se visualizar as 5 primeiras linhas e 25 primeiras plantas nestas linhas, fazendo:
O código 0 (zero) corresponde a plantas sadias e o código 1 (um) corresponde às plantas doentes. No caso de falha ou irregularidade no talhão, as posições sem plantas são identificadas com NA. Nesse talhão a primeira linha tem apenas 5 plantas e desta forma ao colocar os dados em formato data.frame usa-se o código NA a partir da sexta linha.
Alguns conjuntos de dados contém mais de uma avaliação do estágio da doença, feitas em diferentes momentos do tempo. Assim, é necessário incorporar a estrutura temporal, além da espacial. Nesse caso, os dados de cada avaliação são armazenados um abaixo do outro, na mesma planilha de dados. Um exemplo é o conjunto de dados da incidência de msc no talhão 303, localizado no município de Comendador Gomes, estado de Minas Gerais. Uma cópia desses dados está disponível em http://leg.ufpr.br/~elias/Rcitrus/citrusData/original303.xls. Para simplificar, esse arquivo foi salvo em arquivo texto com extensão .csv.
Lendo esse arquivo com a função read.csv2() e usando a opção header=FALSE.
Inspencionando o arquivo:
Inspecionando as primeiras linhas e colunas dos dados:
Nesse data.frame, observa-se que as 13 primeiras linhas, contém atributos do talhão: Proprietário, Talhão, Variedade, etc. Na 15a linha observa-se a data da avaliação. Na linhs 16, está a numeração das colunas. Os dados da 1a avaliação iniciam na linha 17, sendo a primeira coluna, a numeração da linha. Os dados dessa avaliação terminam na linha 36. Na linha 39 está a data da 2a avaliação e a seguir inicia o dados dessa avaliação dispostos da mesma forma que os dados da primeira avaliação.