#========================================================================================== # Estatística Computacional I www.leg.ufpr.br/ce083 # Curso de Estatística - 2013/1 # Prof. Walmes Zeviani # LEG - DEST - UFPR # # Aula 10 (21/05/2013) # * Leitura de dados disponíveis na web no formato texto corrido, fwf e csv; # * Parâmetros gráficos: rotação dos eixos, uso de cores; #========================================================================================== #------------------------------------------------------------------------------------------ # Disponível em: http://vestibular.ufrgs.br/listao/letra_A.html list.files() da <- readLines("letraA.txt") str(da) length(da)/4 tail(da) #------------------------------------------------------------------------------------------ M <- matrix(da, ncol=4, byrow=TRUE) da <- as.data.frame(M, stringsAsFactors=FALSE) str(da) names(da) <- c("cod","cand","sem","cur") str(da) #------------------------------------------------------------------------------------------ tb <- table(da$cur) cbind(sort(tb, decreasing=TRUE)) #------------------------------------------------------------------------------------------ # Tem como ler direto da web. Tem como fazer para todas as letras A-Z. # Para ler direto da web tem que usar funções do pacote XML. Veremos no futuro. # todos os links paste("http://vestibular.ufrgs.br/listao/letra_", LETTERS, ".html", sep="") #------------------------------------------------------------------------------------------ # Disponível em: http://www.comvest.unicamp.br/vest2013/F2/aprova2/chamada4/chamada4.html help(read.fwf, help_type="html") ##--------------------------------------------------------------------------------------- ## 3 1214 52 86 ## | | | | | ## (131002066) Adriana Batista de Souza Tec. em Controle Ambiental (N) ## (131422844) Adriano Ramos Marthi Geografia (I) ## (131197296) Adriano Reis Cominato de Lima Com. Social-Hab.Midialogia (I) ## (131405155) Airton Leonardo Ramos Fis./Mat./Mat.Aplic. E Comp. (I) ##--------------------------------------------------------------------------------------- diff(c(86,52,14,12,3,1)) ch <- read.fwf("chamada4.txt", widths=c(-2,9,-2,38,34), stringsAsFactors=FALSE) str(ch) head(ch) ch <- ch[complete.cases(ch),] names(ch) <- c("id","nome","curso") ch$curso <- factor(ch$curso) head(ch) #------------------------------------------------------------------------------------------ cbind(sort(table(ch$curso))) #------------------------------------------------------------------------------------------ # Disponível em: http://www.ipeadata.gov.br/ # Social > # tema: eduação > # tabela: anos de estudo - média - pessoas 25 anos e mais. # - nível geográfico: municípios # - abrangência: brasil; anos <- read.table("anosestud.csv", header=TRUE, sep=";", dec=",", skip=1, quote="", colClasses=c("factor","integer","character", "numeric","numeric","NULL")) str(anos) levels(anos$Sigla) names(anos) <- c("sig","cod","mun","a1","a2") #------------------------------------------------------------------------------------------ plot(a1~a2, data=anos) abline(a=0, b=1, col=2) plot(a1~a2, data=anos, asp=1) # grid regular abline(v=0:10, h=0:10, col="gray", lty=3) abline(a=0, b=1, col=2) identify(anos$a2, anos$a1, labels=anos$mun) #------------------------------------------------------------------------------------------ par(las=2) # rotaciona rótulos dos eixos # cores com nomes boxplot(a2~sig, data=anos, col="gray", xlab="Estados", ylab="Anos de estudo") # nomes de cores válidas no R colors() boxplot(a2~sig, data=anos, col="royalblue2", xlab="Estados", ylab="Anos de estudo") boxplot(a2~sig, data=anos, col="darkorange2", xlab="Estados", ylab="Anos de estudo") # cores em notação html: http://www.ufpa.br/dicas/htm/htm-cor2.htm boxplot(a2~sig, data=anos, col="#990303", xlab="Estados", ylab="Anos de estudo") # cores em composição RGB, tons entre 0 e 1 boxplot(a2~sig, data=anos, col=rgb(0.8,0.6,0.9), xlab="Estados", ylab="Anos de estudo") #------------------------------------------------------------------------------------------