====== CE-083: Estatística Computacional I ====== {{ http://www.visualreporting.dk/en/images/r-project-consultant.png?480|}} ===== Detalhes da oferta da disciplina ===== * Professor: [[http://www.leg.ufpr.br/~walmes|Walmes Marques Zeviani]], ([[http://www.leg.ufpr.br|LEG: Laboratório de Estatística e Geoinformação]]) * Curso: Estatística. * Período: 2013/2. * Local: LABEST, LAB A. * Horário: Terça, 19:00-20:30h e Quinta, 20h45-22:00h. * Atendimento: Quinta, 19:00-20:30h. * Cartão de referência: {{http://www.leg.ufpr.br/~walmes/cursoR/guia_rapido_R.pdf|Guia rápido do usuário R}} - tradução por Conrado Oliveira (ex-aluno). * Ementa: {{http://www.leg.ufpr.br/~walmes/ensino/CE083-fichas-2013-05-03.pdf}} ===== Scripts, notas e documentos ====== Quando não estiver disponível os arquivos baixe os mesmos por [[http://dl.dropboxusercontent.com/u/48140237/ce083.zip|aqui]]. Apostilas e textos úteis: [[http://dl.dropboxusercontent.com/u/48140237/ce083_livros.zip|ce083_livros.zip (84 MB)]] {{url>http://www.leg.ufpr.br/~walmes/ensino/ce083-2013-02/ 800px, 600px center}} ===== Histórico das Aulas do Curso ====== Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas. - 27/08: * Introdução à Estatística Computacional I; * Download, instalação e fundamentos iniciais do aplicativo R; * Mecanismos de busca e consulta à documentação; * Atribuição de escalares à objetos; * Operações fundamentais com escalares. - 29/08: * Criação e operações com vetores; * Regra da reciclagem; * Seleção por posição em vetores; * Sequências regulares. - 03/09 (Paulo Justiniano): * Distribuições de probabilidade; * Cálculo de probabilidades de forma explicita; * Cálculo de probabilidades usando funções próprias. - 05/09: * Sabatina 01; * Gráficos de distribuições de probabilidades. - 10/09: * Seleção em vetores pelo nome e regras de lógica; * Regras de lógica, operações e aplicações; * Criação e seleção de tabelas de dados (data.frame). - 12/09: * Criação, seleção e ordenação de tabelas (data.frame); * Criação de novas variáveis; * Operações com fatores (renomeação e reordenação). - 17/09: * Ordenação, filtragem, tranformações, e tarefas por grupo para dados em tabelas (data.frame). - 19/09: * Operações com fatores, ordenação e nomeação dos níveis; * Agrupamento de valores em classes; * Gráficos de barras para estatísticas por estrato/grupo. - 24/09: * Importação de dados no formato texto; * Manipulação dos dados, reordenação de níveis de fator; * Gráficos de caixas, histogramas, desidade empírica e acumulada. - 24/09: * Importação de dados no formato texto; * Análise exploratória de dados; * Análises marginais e condicionais para variáveis quali e quantitativas. - 01/10: * Tarefas por grupo e por margem; * Função para obter esatísticas para uma amostra; * Objetos do tipo lista, criação e atributos; * Aplicar funções para elementos de uma lista; * Exportar tabelas no formato texto; * Salvar gráficos; * Salvar a imagem da sessão. - 03/10: * Matrizes e arranjos, criação, seleção e operações fundamentais; * Estatísticas/tarefas por margem em matrizes; * Gráficos de mosaico; * Listas, criação, seleção; * Estatísticas/tarefas por elementos em listas; * Introdução às expressões regulares; * Estatísticas/tarefas por grupo em data.frames. - 08/10: * Importados de dados em arquivos com comprimento fixo de campo (fwf); * Funções para manipular strings; * Introdução às expressões regulares; - 10/10: * Junção de tabelas de dados por identificador comum (merge); * Verificação de registros duplicados; * Criação de idendificador comum; * Mais sobre legenda e anotações no gráfico. - 15/10: * Criação de funções; * Formas de passar argumentos, argumentos default; * Mensagens de erro, aviso e notificação; - 17/10: * Formas de passar os argumentos para uma função; * Formas de retornar o resultado de uma função; * Funções genéricas, classes e métodos. - 22/10: * Visualizando distribuições de probabilidade. - 24/10: * Implementando funções de probabilidade e de densidade de probabilidade; * As funções d*, p*, q*, e r*. - 29/10: * Cálculo de probabilidades; * Esperança matemática e variância; * Gerando números aleatórios; * Distribuição amostral da média. - 01/11: * Geração automática de relatórios de análises de dados; * Integrando o R ao editor de textos do Open Office (Writer). - 05/11: * Mais detalhes sobre geração automática de relatórios usando OpenOffice e R, OdfWeave; * Sorteio dos exercícios aos grupos de alunos. ===== Trabalhos ====== === Trabalho 1 === - Pegar dados na web para fazer um relatório de análise de dados. Alguns sites recomendados: * http://www.lib.ncsu.edu/data/socialscienceandhumsets.html * http://www.thejanuarist.com/9-fascinating-datasets-available-online-for-free/ * http://rdatamining.wordpress.com/2011/09/16/datasets-to-practice-your-data-mining/ * http://www.statsci.org/datasets.html * http://www.rdatamining.com/resources/data * http://www.datawrangling.com/some-datasets-available-on-the-web * http://www.economicsnetwork.ac.uk/links/data_free * http://www.stata.com/links/examples-and-datasets/ * http://people.stern.nyu.edu/adamodar/New_Home_Page/data.html * http://mathforum.org/library/topics/data_sets/ * http://lemire.me/blog/archives/2012/03/27/publicly-available-large-data-sets-for-database-research/ * http://www.20kmparis.com/web/resultats_precedents.asp - Encontrar dados que tenham pelo menos uma v.a. qualitativa e uma quantitativa com número de registros superior à 30. Fazer o download dos dados e importar para o R; - Fazer a análise exploratória dos dados com o R. Considerar: * tabelas com medidas de frequência, posição, dispersão; * gráficos de frequência, tendência, dispersão; - Escrever um relatório sobre os dados. Considerar: * origem (endereço) e significado de cada variável; * inserir as tabelas/gráficos com comentários e interpretação sobre o que eles indicam; * concluir sobre as impressões que as análise deram à respeito dos dados; - O documento deve conter: * figuras/tabelas com legendas, Ex: Figura 1. histograma da variável x. * figuras com dimensão apropriada, com texto legível, de tamanho e tipo de fonte compatível com o texto e próprio para leitura. * adotar um padrão de cores para os gráficos (P&B, tons cinza, tons azuis); * todo elemento informativo (gráfico/tabela) deve ser comentado no texto. - deve ser entregue: * o relatório de análise impresso (para avaliação); * o script (.R) e a imagem da sessão (.RData) (para disponibilizar na página da disciplina); * o script deve conter o nome dos membros do grupo e ser salvo com o GRR de um destes. Ex: //grr20139999.R//, para a imagem da sessão também, //grr20139999.RData//. * o script deve estar devidamente comentado pois será disponibilizado para outros alunos, inclusive das próximas turmas. - Prazo para entrega e envio do trabalho é o dia 10/10/2013. O relatório impresso deve ser entregue na aula e os arquivos digitais enviados para walmesufpr.br. O título da mensagem (subject do email) deve ser //ce083 2013 trabalho 1//; - O trabalho pode ser feito em grupos de no máximo 3 pessoas. - Não são aceitos trabalhos entregues após o prazo. - O trabalho vale 2.0 pontos; === Trabalho 2 === - No arquivo [[http://www.leg.ufpr.br/~walmes/ensino/ce083-2013-02/ce083-2013-02-aula21.R|ce083-2013-02-aula21.R]] estão os grr e os respectivos grupos de exercícios; - No arquivo [[http://www.leg.ufpr.br/~walmes/ensino/ce083-2013-02/ce083-2013-02-aula21-exerc.odt|ce083-2013-02-aula21-exerc.odt]] estão os livros e os exercícios correspondentes; - No arquivo [[http://www.leg.ufpr.br/~walmes/ensino/ce083-2013-02/ce083-2013-02-aula21-guia.odt|ce083-2013-02-aula21-guia.odt]] estão instruções de formatação do documento; - O trabalho vale 3.0 pontos; - Os arquivos odt de input e output devem ser enviados com o seguinte nome "grr20002000-input.odt" e "grr20002000-output.odt". Use o grr de um representante o grupo ao invés de 20002000; - Usuários de LaTex não precisam fazer o trabalho em OdfWeave caso queiram usar o LaTex com Sweave ou knitr. Nesse caso enviar o *.Rnw e o *.pdf com prefixo sendo o grr. - Entrega no dia 28/11;