====== CE083: Estatística Computacional I ====== **ATENÇÃO**: * Notas finais disponíveis, incluindo EXAME * Gabarito do [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/gabaritos/ce083_Exame_2015-02_GABARITO.html | exame]] * Notas [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_2015-02_notas-final_EXAME.pdf | finais]] ===== Detalhes da oferta da disciplina ===== - **Curso:** Estatística - **Período:** segundo semestre de 2015 - **Professor Responsável:** [[http://www.leg.ufpr.br/~fernandomayer|Fernando de Pol Mayer]], ([[http://www.leg.ufpr.br|LEG: Laboratório de Estatística e Geoinformação]]) - **Horários e Locais:** * Terça, 19:00 - 20:30h, Lab. C - LABEST. * Sexta, 20:40 - 22:00h, Lab. C - LABEST. - **Horários de atendimento do professor:** * Quartas e sextas, 14:00-17:30. Outros horários podem ser agendados previamente por email. - **Datas importantes:** De acordo com a [[http://www.exatas.ufpr.br/portal/wp-content/uploads/2014/09/cepe5714.pdf|Resolução 57/14 - CEPE]], alterada pela [[http://www.ufpr.br/soc/descarregar_arquivo.php?cod=1057 | Resolução 43/15 - CEPE]]: ^ Data ^ Evento ^ | 03/08 | Início do semestre letivo | | 11/08-16/09 | Período de greve | | 24/12 | Final do semestre letivo | | 05/01/16 | Exame final | ===== Programa/objetivos da disciplina ===== O objetivo desta disciplina é capacitar os alunos em uma linguagem de programação para estatística, onde terão a capacidade de desenvolver suas análises em qualquer disciplina. Neste curso usaremos a linguagem R que é livre, de código aberto, e já se tornou a linguagem "padrão" para análises estatísticas. O objetivo também é ensinar os alunos sobre o conceito de ciência reproduzível, e como utilizar o R para gerar documentos dinâmicos, misturando código e texto, facilitando e tornando clara a difusão do conhecimento. O curso compreende os seguintes tópicos: * Filosofia e conceitos iniciais sobre software livre e R * Uma primeira sessão com o R * R: essencial * Instalação, interfaces gráficas * Funções e argumentos * Objetos e suas classes * Valores perdidos e especiais * Manipulação de dados: indexação e seleção condicional * R: dados * Importação e exportação de dados * Lendo dados de uma URL * R: análise exploratória de dados * Funções para resumo de dados * Gráficos exploratórios * Sistemas gráficos * Gráficos básicos * Sistemas de cores * Gráficos com o pacote Lattice * Gráficos com o pacote ggplot2 * R: estatística * Geração de números aleatórios * Distribuições de probabilidade * Intervalos de confiança e teste de hipótese * Regressão linear e ANOVA * R: programação * Estruturas de controle e repetição * Criando funções * A família de funções *apply() * Linguagens de marcação * LaTeX * Markdown (Rmarkdown) * Documentos dinâmicos com knitr e rmarkdown ===== Materias do curso ===== Aqui serão disponibilizados todo material que for utilizado em sala de aula, além de materias adicionais. {{url>http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ 800px, 300px center}} * Matéria sobre instalação do R no Linux no [[http://blog.leg.ufpr.br/archives/230 | Blog do LEG]]. ===== Histórico das Aulas do Curso ====== Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas. - **04/08**: Apresentação da disciplina - **06/08**: Conceitos de programação, software livre e instalação do R * Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083-2015-02-aula01.html | aula 01]] * Ver o [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083-2015-02-instalacao-R.html | guia de instalação do R]] * Ler o artigo [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/leituras/Chambers_2000.pdf | Users, programmers, and statistical software]] (Chambers, 2000) - **11/08**: Utilização básica do R e RStudio. Configurando o diretório de trabalho. Entrando com comandos, salvando scripts e //workspace//. * Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083-2015-02-aula01.html | aula 01]] * Script construído em aula: [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/scripts_aula/script_aula_2015-08-11.R | script_aula_2015-08-11.R]] - **22/09**: Funções e argumentos. Mecanismos de ajuda. Criando uma função. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula2_2015-02.html | aula 02]] - **24/09**: Objetos. Programação orientada a objetos. Gerenciamento da área de trabalho. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula2_2015-02.html | aula 02]] - **29/09**: Classes de objetos e regra da reciclagem. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula2_2015-02.html | aula 02]] - **01/10**: Valores perdidos e especiais. Classes especiais: matriz, lista e data frame. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula2_2015-02.html | aula 02]] - **06/10**: Recesso na UFPR devido ao SIEPE. - **08/10**: Aula especial com o convidado Prof. [[http://www.leg.ufpr.br/~paulojus | Paulo Justiniano Ribeiro Jr.]] - **13/10**: Exercícios sobre matriz, lista e data frame. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula2_2015-02.html | aula 02]] - **15/10**: Primeira sabatina - **20/10**: Indexação de vetores e matrizes. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula3_2015-02.html | aula 03]] - **22/10**: Indexação de listas e data frames. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula3_2015-02.html | aula 03]] - **27/10**: Indexação através de seleção condicional. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula3_2015-02.html | aula 03]] - **29/10**: Segunda sabatina - **03/11**: Entrada de dados: via teclado e leitura de arquivos de texto. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula4_2015-02.html | aula 04]] - **05/11**: Saída de dados em arquivos de texto. Carregando dados de pacotes do R. Dados no fomato textual e binário. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula4_2015-02.html | aula 04]] - **10/11**: Estatística descritiva: medidas de centro e dispersão. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/scripts_aula/ce083_script02_2015-02.R | script 02]] - **12/11**: Análise exploratória de dados. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/scripts_aula/ce083_script03_2015-02.R | script 03]] e [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula5_2015-02.html | aula 05]] - **17/11**: Análise exploratória de dados uni e bivariada. Tabelas e gráficos. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula5_2015-02.html | aula 05]] - **19/11**: Terceira sabatina - **24/11**: Entrega e correção da segunda sabatina. Correção e comentários sobre a terceira sabatina. - **26/11**: Gráficos no R: funções gerais, sistemas gráficos, dispositivos de saída, customização de gráficos. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula6_2015-02.html | aula 06]] e [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/scripts_aula/ce083_script04_2015-02.R | script 04]]. - **01/12**: Gráficos no R: modificando gráficos e adicionando elementos. Pacotes lattice e ggplo2. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula6_2015-02.html | aula 06]], [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/scripts_aula/ce083_script04_2015-02.R | script 04]], e [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/scripts_aula/ce083_script05_2015-02.R | script 05]]. - **03/12**: Introdução às distribuições de probabilidade no R. Distribuição normal. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula7_2015-02.html | aula 07]] - **08/12**: Outras distribuições de probabilidade: binomial, Poisson, uniforme. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula7_2015-02.html | aula 07]] - **10/12**: Quarta sabatina - **15/12**: R markdown. Intervalos de confiança e testes de hipótese. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula8_2015-02.html | aula 08]] - **17/12**: R markdown. Regressão linear. Material referente a [[http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula9_2015-02.html | aula 09]] ===== Referências Bibliográficas ===== - Referências básicas * Dalgaard, P. [[http://www.springer.com/us/book/9780387790534 | Introductory statistics with R]]. New York: Springer, 2008. * Murrell, P. [[https://www.crcpress.com/Introduction-to-Data-Technologies/Murrell/9781420065176| Introduction to data technologies]]. Boca Raton: Chapman & Hall/CRC, 2009. Disponível em [[https://www.stat.auckland.ac.nz/~paul/ItDT/HTML | HTML]] e [[https://www.stat.auckland.ac.nz/~paul/ItDT/itdt-2013-03-26.pdf | PDF]]. * Peng, RD. [[https://leanpub.com/rprogramming | R programming for data science]]. Leanpub, 2015. (Gratuito) * Peng, RD. [[https://leanpub.com/exdata | Exploratory data analysis with R]]. Leanpub, 2015. (Gratuito) * Ribeiro Jr., PJ. [[[[sofware:material-r | Introdução ao ambiente estatístico R]]. (//on-line//) - Referências complementares * Adler, J. [[http://shop.oreilly.com/product/0636920022008.do | R in a nutshell]]. O'Reilly, 2010. * Leek, J. [[https://leanpub.com/datastyle | The elements of data analytic style]]. Leanpub, 2015. (Gratuito) * Matloff, N. [[https://www.nostarch.com/artofr.htm | The art of R programming: A tour of statistical software design]]. No Starch Press, 2011. * Mello, MP; Peternelli, LA. [[http://www.dsr.inpe.br/~mello/Conhecendo_o_R.html | Conhecendo o R: uma visão mais que Estatística]]. Viçosa: Editora UFV, 2013. * Peng, RD. [[https://leanpub.com/reportwriting | Report writing for data science in R]]. Leanpub, 2015. (Gratuito) * Rizzo, ML. [[https://www.crcpress.com/Statistical-Computing-with-R/Rizzo/9781584885450 | Statistical computing with R]]. Boca Raton: Chapman & Hall/CRC, 2008. * Teetor, P. [[http://shop.oreilly.com/product/9780596809164.do | R cookbook]]. O'Reilly, 2011. * Venables, WB; Ripley, BD. [[http://www.springer.com/us/book/9780387954578 | Modern applied statistics with S]]. New York: Springer, 2002. - Referências //on-line// * Horton, NJ; Pruim, R; Kaplan, DT. [[http://cran-r.c3sl.ufpr.br/doc/contrib/Horton+Pruim+Kaplan_MOSAIC-StudentGuide.pdf | A student's guide to R]]. 2015. * Jonge, E; Loo, M. [[http://cran-r.c3sl.ufpr.br/doc/contrib/de_Jonge+van_der_Loo-Introduction_to_data_cleaning_with_R.pdf | An introduction to data cleaning with R]]. 2013. * Maindonald, JH. [[http://cran-r.c3sl.ufpr.br/doc/contrib/usingR.pdf | Using R for data analysis and graphics]]. 2008. * Paradis, E. [[http://cran-r.c3sl.ufpr.br/doc/contrib/Paradis-rdebuts_en.pdf | R for beginners]]. 2005. * Torgo, L. [[http://cran-r.c3sl.ufpr.br/doc/contrib/Torgo-ProgrammingIntro.pdf | Introdução à programação em R]]. 2006. ===== Recursos computacionais ===== - [[http://www.r-project.org|The R project for Statistical Computing]]: página do programa **R** - [[sofware:material-r|Curso sobre o uso do R]] no LEG - [[http://git.leg.ufpr.br/fernandomayer/R-rautu | R-rautu]] uma introdução ao uso do R - [[http://www.rstudio.org|R-Studio]] um ambiente para facilitar uso do R - [[software:rbr|R-br]] é a lista de discussão em português sobre o uso do R