Não foi possível enviar o arquivo. Será algum problema com as permissões?

Essa é uma revisão anterior do documento!


CE-223: Estatística Computacional

CE-223: Estatística Computacional

Detalhes da oferta da disciplina

  1. Período: primeiro semestre de 2011
  2. Horários e Locais:
    • As aulas estão programadas para a sala PC-04 entretanto serão ministradas no LABEST (sala C). Quando não o forem, será dado aviso previamente.
    • Horários:
      • Terça, 17:30 - 19:00h.
      • Sexta, 20:45 - 22:15h.
    • Data importantes:
      • 28/08/2011 - Início das aulas.
      • 26/06/2011 - Último dia letivo do 2o semestre.
      • 04/07 a 09/07/2011 - Período de exames finais.
      • Calendário completo: Resolução 71/10 do CEPE que estabelece o calendário para ano de 2011 (formato PDF).
  3. Avaliação: método de avaliação, conteúdo e datas à definir.
  4. Horários de atendimento do professor : Segundas e quartas, 16:30 - 17:30, LEG (Laboratório de Estatística e Geoinformação), prédio anexo ao prédio da administração do centro politécnico, andar superior (espaço do antigo salão de provas).

Programa da Disciplina

O objetivo desta disciplina é capacitar os alunos para o uso de recursos computacionais para computação estatística. O curso dará ênfase e capacitará os participantes no uso do (ambiente R de computação estatística). Será assumido conhecimento:

EMENTA da disciplina

Referências Bibliográficas

[2010, book]
Bussab, W. O., & Morettin, P. A. (2010). Estatística Básica (6 ed.) Saraiva.
[200?, book]
Magalhães, M. N., & Lima, A. C. P. (200?). Noções de Probabilidade e Estatística (1 ed.) Edusp.
[2009, techreport | www]
Ribeiro Júnior, P. J. (2009). Introdução ao Ambiente Estatístico R.
[2002, book | www]
Venables, W. N., & Ripley, B. D. (2002). Modern applied statistics with S Birkhäuser.
[2009, book | www]
Everitt, B. S., & Hothorn, T. (2009). A Handbook of Statistical Analyses Using R, Second Edition (2 ed.) Chapman \& Hall.
[2008, book | www]
Dalgaard, P. (2008). Introductory Statistics with R (2nd ed.) Springer.
[2008, book | www]
Sarkar, D. (2008). Lattice: Multivariate Data Visualization with R (1 ed.) Springer.
[2005, book | www]
Murrell, P. (2005). R Graphics (1 ed.) Chapman and {Hall/CRC}.

Histórico das Aulas do Curso

Abaixo o histórico de atividades realizadas em classe e atividades extra classe sugeridas.

Data Classe Extra
ter 01/Mar Sobre o R, definição de objeto, criação, acesso e modificação de vetores, matrizes, data.frame e listas. Visitar página da disciplina, instalar o R no computador pessoal, ver o toṕico 6 do material de apoio e rodar o arquivo aula1.R.
sex 04/Mar Instalação e introdução ao RStudio, geração de sequências/repetições, entrada de dados no R via uso das funções scan(), textConnection(), edit(), read.table(). Fazer uma cópia impressa do Cartão de referência do R, instalar o RStudio, ver o tópico tópico 8 do material de apoio e rodar o arquivo aula2.R.
ter 08/Mar Recesso de Carnaval Navegar/explorar o conteúdo dos links: Quick-R, R Graph Gallery e R Graphical Manual.
sex 11/Mar Apresentação da lista nacional R_STAT, dos gerenciadores de listas internacionais markmail e nabble, importação de dados a partir de arquivos externos, arquivos *.txt, *.csv, *.xls, uso da função read.table() e gdata::read.xls(), uso de medidas descritivas de posição e dispersão de dados. Praticar a importação com os arquivos usados em sala (ana.txt, ipeadata[11-03-2011-09-24].csv, ana.xls) e aplicar as medidas de posição e dispersão. Conferir o que foi feito em sala rodando o arquivo aula3.R.
ter 15/Mar Estatística descritiva, cálculos das e uso de funções para medidas de posição e dispersão, gráficos exploratórios, medidas descritivas para subconjuntos dos dados. Associar-se a lista de discussão Brasileira de R, a R-br, instruções em R-br. Entrar nos sites de arquivamento das mensagens mail-archive e nabble. Rodar o arquivo aula4.R.
sex 18/Mar Informações sobre a [R-br] , introdução sobre o editor Emacs, aplicação de funções para subconjuntos dos dados, tratando valores não disponíveis (NA), separando por categoria, por valores, por ocorrência de padrões textuais, verificando os valores únicos e duplicados. Inscrever-se na [R-br] , procurar o Valdeci e criar conta nas máquinas do LAB-C, ler no R Reference Card os tópicos Slicing and extracting data e Advanced data processing, rodar o arquivo aula5.R
ter 22/Mar Aplicação de funções para colunas e linhas do data.frame (médias por ano, medias por município), tratamento dos valores não disponíveis (NA), como obter o registro de maior e menor valor, como fazer gráficos para colunas. Ler no R Reference Card o tópico Distributions, baixar o arquivo analfabetos15anos.xls e importar esses dados a partir de um arquivo *.txt, rodar o arquivo aula6.R.
sex 25/Mar Foi preparado o arquivo aula7.R com exercícios para serem resolvidos em sala de aula, com a presença do professor. Preencher o arquivo aula7.R com os comandos para responder o que se pede. Salvar o script e enviar para o e-mail walmes@ufpr.br (não enviar no corpo da mensagem do e-mail e nem em arquivo *.doc). Usar no título do e-mail "[ce223] - trabalho 1". Identificar-se no texto do e-mail e no cabeçalho do script com nome completo e GRR. Sinalizar dúvidas com comentários dentro do script. Enviar os arquivos de dados que usar. Serão considerados scripts enviados até às 15:30h de terça (29/03). A solução será dada na aula de 29/03.
ter 29/Mar Foi dada a solução para os exercícios da passados na aula anterior, disponível no arquivo aula8.R. Primeira prova foi marcada para 26/04/11. Conteúdo: todos os tópicos apresentados até a aula 8. Rodar o arquivo aula8.R e levantar dúvidas.
sex 01/Abr Não houve aula devido a falta de energia elétrica no campus. :-D
ter 05/Abr Revisão de distribuição de probabilidades, uso das funções {d}{p}{q}{r}distribution() para obter densidades, probabilidades, quantis e números aleatórios de distribuições discretas e contínuas, confecção de gráficos, adição de curvas, pontos, linhas, texto, cores, legenda, obtenção de histograma, medidas de resumo, gráfico de distribuição acumulada empírica. Rodar arquivo aula9.R e baixar o arquivo cria-caixa.R.
sex 08/Abr Criação de uma função de densidade {d}, obtenção de densidades, probabilidades, esperança matemática e variância por integração numérica, criação da função de distribuição acumulada {p} e cálculo de probabilidades, criação da inversa da função de distribuição acumulada {q} e obtenção dos quantis, geração de números aleatórios dessa distribuição {r} pelo método da transformada inversa, cálculo da média, variância amostral e gráficos de distribuição de frequência. Rodar o arquivo aula10.R e ler o documento gervaral.pdf sobre métodos de geração de variáveis aleatórias.
ter 12/Abr Importação de aquivos *.xls, justaposição de bases de dados (merge()), gráficos de duas variáveis contínuas, destaque de pontos para categorias de interesse, atribuição de rótulos à pontos, gráficos de dispersão separados por categoria, gráficos do pacote lattice (xyplot(), histogram(), densityplot(), bwplot()), criação de categorias a partir de variáveis contínuas (com mesma amplitude de classe e com mesmo número de elementos por classe), obtenção de correlações separado por categorias. Entrar na página http://www.leg.ufpr.br/doku.php/temp, clicar na aba editar essa página e preencher o seu endereço de e-mail, que será usado para divulgações de horários, trabalhos, notas e informações em geral. Navegar pela página do pacote de gráficos lattice. Rodar o arquivo aula11.R.
sex 15/Abr Foi preparado o script aula12.R para ser resolvido (iniciado) em sala de aula e entregue em forma de trabalho. As instruções então dentro do próprio arquivo. Resolver o que se pede no próprio script; enviar arquivo de soluções com extensão .R e não em .doc, .txt, ou outros!; enviar para o e-mail ; usar a palavra "ce223" no título da mensagem, ex "ce223 trabalho 2"; não usar CE223, nem ce 223, nem ce-233, você receber uma notificação de recebimento; enviar o trabalho até dia 29/04/11 às 22:00 horas; sinalizar as suas dúvidas com comentários dentro do script.
ter 19/Abr Aula de revisão do conteúdo previsto para a primeira avaliação. Estudar para a prova.
sex 22/Abr Não haverá aula devido ao feriado. Instruções para a prova: a prova é individual; pode-se consultar a internet e o cartão de referência do R; não se pode consultar o caderno e fazer trocas de informação/material com colegas; a prova será no multiterminal de 17:30 às 19:15 e será aplicada pelo Professor Paulo Justiniano; as questões devem ser respondidas na folha de prova com transcrição dos códigos R usados para obter os resultados; você tem que devolver o a folha de questões junto com as folhas de prova com sua identificação em ambos; é recomendável que você faça a prova no computador do laboratório; caso faça a prova no seu computador pessoal, a total e correta importação dos dados é de sua responsabilidade.
ter 26/Abr Primeira avaliação. Conteúdo: todos os tópicos apresentados até a aula 8. Caprichar na resolução da lista de exercícios do conteúdo referente à segunda avaliação para recuperar a nota tirada na primeira avaliação.
sex 29/Abr Não haverá aula. Gabarito da primeira avaliação.
ter 03/Mai Foi discuto o gabarito da primeira avaliação e o gabarito do segundo trabalho, solução disponível no arquivo aula13.R. Estudar o gabarito da prova.
sex 06/Mai Intervalo de confiança e teste de hipótese para média de dados normais, ilustração com construção dessas funções. Rodar o arquivo aula14.R. Ler o conteúdo do tópico 16 - Intervalos de confiança - I do Paulo Justiniano - Embrapa. Resultado do desempenho na primeira avaliação disponível.
ter 10/Mai Teste de hipótese e intervalo de confiança para a diferença de duas médias, ilustração com construção dessas funções e combinação de funções para aplicação do teste t após o teste de igualdade de variâncias. Rodar o arquivo aula15.R. Ler o conteúdo do tópico 22 - Intervalos de confiança e testes de hipótese do Paulo Justiniano - Embrapa.
sex 13/Mai Aprimoramento da função para intervalo de confiança e teste de hipótese de uma média normal com a inclusão de opções para teste bilateral e unilateral, uso das funções dentro de lapply() e sapply(). Rodar arquivo aula16.R. Ler a documentação das funções apresentadas.
ter 17/Mai Aplicando estatísticas descritivas usando lapply(), do.call() e exportando resultados write.table(). Rodar o arquivo aula17.R. Ler a documentação das funções apresentadas.
sex 20/Mai Construção de funções de verossimilhança e estimação de parâmetros usando a optim(). Rodar o arquivo aula18.R. Ler o tópico 17 - funções de verossimilhança do Paulo Justiniano - Embrapa.
ter 24/Mai Estimação de parâmetros por máxima verossimilhança e mínimos quadrados de um modelo de regressão usando a optim(). Rodar o arquivo aula19.R.
sex 27/Mai Expressões regulares: definição, metacaracteres, uso da função grep() para busca e gsub() para substuições. Rodar o arquivo aula20.R.
ter 31/Mai Segunda avaliação. Conteúdo: todos os tópicos apresentados da aula 9 à 16. Instruções para a prova: a prova é individual; pode-se consultar a internet e o cartão de referência do R; não se pode consultar o caderno e fazer trocas de informação/material com colegas; a prova será no LAB C do Labest de 17:30 às 19:15; as questões devem ser respondidas na folha de prova com transcrição dos códigos R usados para obter os resultados; você tem que devolver o a folha de questões junto com as folhas de prova com sua identificação em ambos; é recomendável que você faça a prova no computador do laboratório; caso faça a prova no seu computador pessoal, a total e correta importação dos dados é de sua responsabilidade.
sex 03/Jun Expressões regulares: alternância, quantificação. Partir strings (strsplit()), concatenar strings (paste()) e formatar strings (formatC()). Rodar o arquivo aula21.R.
ter 07/Jun Operações com datas: conversão de strings e números para datas, uso das funções as.Date(), ISOdate(), as.POSIXct(), formatação de string de datas com format(), confecção de gráficos dados orientados no tempo, uso da função axis.POSIXct(). Rodar o arquivo aula22.R.
sex 10/Jun Confecção de documentos em Sweave. Preâmbulo e corpo do documento. Classes de documentos e pacotes do Latex. Como compilar arquivos Sweave (*Rnw) e Latex (*tex). Rodar o arquivo aula23.Rnw.
ter 14/Jun Confecção de documentos em Sweave. Inserção de equações, tabelas e figuras. Uso de referência cruzada em equações, tabelas e figuras. Rodar arquivo aula24.Rnw.
sex 17/Jun Confecção de documentos em Sweave. Usando as opções do chunk. Rodar arquivo aula25.Rnw.
ter 21/Jun Terceira avaliação. Conteúdo: todos os tópicos apresentados da aula 17 à 22. Instruções para a prova: a prova é individual; pode-se consultar a internet e o cartão de referência do R; não se pode consultar o caderno e fazer trocas de informação/material com colegas; a prova será no LAB C do Labest de 17:30 às 19:15; as questões devem ser respondidas na folha de prova com transcrição dos códigos R usados para obter os resultados; você tem que devolver o a folha de questões junto com as folhas de prova com sua identificação em ambos; é recomendável que você faça a prova no computador do laboratório; caso faça a prova no seu computador pessoal, a total e correta importação dos dados é de sua responsabilidade.
sex 24/Jun ? ?
ter 28/Jun ? ?
sex 01/Jul ? ?
ter 05/Jul Exame final. Conteúdo: toda à disciplina, tópico da aula 1 à 22. ?
sex 08/Jul ? ?
ter 12/Jul ? ?
sex 15/Jul ? ?

#------------------------------------------------------------------------------------------
# como fiz a tabela acima usando o R?
 
datas <- c(seq(as.Date("2011/3/1"), as.Date("2011/7/31"), by="week"),
           seq(as.Date("2011/3/4"), as.Date("2011/7/31"), by="week"))
datas <- sort(datas)
write.table(data.frame(x=paste("| ", c("ter","sex"), format(datas, "%d/%b"), "| ? | ? |")),
            file="datas.txt", quote=FALSE, row.names=FALSE)
 
#------------------------------------------------------------------------------------------

Avaliações

Data Conteúdo Prova Gabarito Notas
(26/04/2011) Importação, manipulação e descrição de dados. prova-1.pdf gabarito-1.pdf notas.pdf
(31/05/2011) Probabilidades, variáveis aleatórias e inferência estatística. prova-2.pdf gabarito-2.pdf notas.pdf
(21/06/2011) Otimização, expressão regular e operação com datas. prova-3.pdf gabarito-3.pdf notas.pdf
(05/07/2011) Todo o conteúdo da disciplina, da aula 1 à 22.

Programas computacionais

  • Programa básico do curso
  • Recursos auxiliares
    1. Recursos sobre o R
      1. [R-br] é uma lista de discussão em português sobre o uso do R.
      2. Uma página interessante com um introdução ao R
      3. Rseek é uma página de procura de recursos do R
    2. Alguns materiais sobre o uso o Graph
      1. Editor de texto Graph: O MiKTeX disponibiliza arquivos de instalação para ambiente Windows
      2. Tex-BR uma excelente página em portugês brasileiro sobre o Graph
      3. Diversos outros links neste material
      4. O TeXniccenter é um editor para ambiente windows que facilita a edição de documentos do Graph
      5. About Latex no site Art of problem solving
      6. Versão WIKI e atualizada do link acima
    3. O Tinn-R é um GUI/Editor para o ambiente R sob Windows que facilita muito o uso do R neste ambiente operacional e também pode ser usaado apra edição em Graph
    4. O Xemacs é uma outra opção de editor que facilita a edição de arquivos do Graph e R e disponível para plataformas Linux e Windows.
    5. A página de Fernando Ferraz tem uma série de recursos de interesse para estatísticos

QR Code
QR Code disciplinas:ce223-2011-01 (generated for current page)