====== CE-083: Estatística Computacional I ======
//"The purpose of computing is insight, not numbers."// (Richard Hamming)
EXAME FINAL no dia 17/07, 17h30 no LABEST.
Todo o conteúdo da disciplina.
O aluno pode usar computador próprio.
Toda prova será baseada no conjunto de dados de
{{http://www.leg.ufpr.br/~walmes/data/euro_football_players.txt|jogadores de futebol da liga européia}}.
{{ http://www.visualreporting.dk/en/images/r-project-consultant.png?480|}}
==== Detalhes da oferta da disciplina ====
  * Professor: [[http://www.leg.ufpr.br/~walmes|Walmes Marques Zeviani]], ([[http://www.leg.ufpr.br|LEG: Laboratório de Estatística e Geoinformação]])
  * Curso: Estatística.
  * Período: 2014/1.
  * Local: LABEST, LAB C.
  * Horário: Terça e Quinta, 17:30-19:00h.
  * Atendimento: Quinta, 19:00-20:30h.
  * Cartão de referência: {{http://www.leg.ufpr.br/~walmes/cursoR/guia_rapido_R.pdf|Guia rápido do usuário R}} - tradução por Conrado Oliveira (ex-aluno).
  * Ementa: {{http://www.leg.ufpr.br/~walmes/ensino/CE083-fichas-2013-05-03.pdf}}
----
==== Scripts, notas e documentos ====
{{url>http://www.leg.ufpr.br/~walmes/ensino/ce083-2014-01/ 800px, 600px center}}
----
/* ==== Histórico das Aulas do Curso ==== */
/*
Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas.
  - 11/02:
    * Download e instação do R;
    * Editores de script;
    * Primeira sessão com o RStudio;
    * Operações elementares com escalares;
    * Salvando script e área de trabalho;
  - 13/02:
    * Vetores nomeados;
    * Regras lógicas;
    * Seleção a partir de regras lógicas;
    * Classificação de valores em intervalos;
    * Sequencias regulares;
  - 18/02:
    * Matrizes;
    * Data frames;
  - 20/02:
    * Ordenar vetores e data.frames;
    * Reordenar e renomear fatores;
    * Arredondar e truncar números;
  - 25/02:
    * Medidas descritivas para uma amostra;
    * Distribuições de frequência;
    * Tarefas por grupo/estrato;
    * Tarefas por margem;
  - 27/02:
    * Leitura de dados a partir de aquivos de texto;
    * Tratamento de valores após leitura;
  - 11/03:
    * Download e leitura de dados em aquivos de texto;
    * Seleção dos carros e cálculo separado de estatísticas descritivas;
  - 13/03:
    * Análise descritiva tabular e gráfica;
    * Tarefas separadas por grupo e por resposta;
    * Cálculo de múltiplas estatísticas para a amostra;
    * Exportando gráficos;
  - 18/03:
    * Expressões regulares;
    * Captura de informações por meio de expressões regulares;
  - 20/03:
    * Fusão de tabelas de dados por chave comum;
    * Aglutinar/combinar níveis de fatores.
  - 25/03:
    * Revisão de distribuição de probabilidades;
    * Como fazer funções.
  - 27/03:
    * Geração de números aleatórios;
    * Método da congruência;
    * Geração de números aleatórios de distribuições discretas de suporte finito;
    * Método da transformação integral da probabilidade para gerar números aleatórios de outras distribuições.  - 
  - 01/04:
    * Cálculo de probabilidades;
    * Visualização de distribuições de probabilidade. 
  - 03/04:
    * Pesquisa reproduzível;
    * Relatórios dinâmicos com R+Markdown.
  - 08/04:
    * Fundamentos de testes de hipótese;
    * Erros de decisão;
  - 10/04:
    * Teste t para a média de uma população;
    * Teste t para a diferença de médias de duas populações independentes;
    * Teste t para a diferença de médias de duas populações pareadas.
  - 15/04:
    * Teste F para variâncias de duas populações normais;
    * Teste chi-quadrado para aderência;
    * Teste chi-quadrado para independência.
  - 22/04:
    * Avaliação do desempenho de teste de hipótese com desvio nos pressupostos;
    * Significância e cobertura nominais via estudo de simulação;
    * Curva de poder do teste de hipótese.
  - 24/04
  - 29/04
  - 01/05
  - 06/05
  - 08/05
  - 13/05
  - 15/05
  - 20/05
  - 22/05
  - 27/05
  - 29/05
  - 03/06
  - 05/06
  - 10/06
  - 12/06
  - 17/06
  - 19/06
  - 24/06
  - 26/06
*/
----
==== Links úteis ====
  * {{http://www.rstudio.com/ide/docs/authoring/using_markdown|Usando markdown com o RStudio}};
  * {{https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet|Markdown: guia de sintaxe (1)}};
  * {{http://support.iawriter.com/help/kb/general-questions/markdown-syntax-reference-guide|Markdown: guia de sintaxe (2)}};
----
==== Avaliações ====
=== Trabalho 1 - Análise comparativa de modelos de carros ===
    - Cada dupla ou trio deve escolher dois modelos de carros para avaliar (ex: Fiat Palio vs Volkswagen Gol, Renault Clio vs Fiat Uno);
    - O contexto do trabalho é orientar clientes na escolher entre os modelos de interesse via uma análise exploratória de dados baseada nos dados disponíveis de satisfação dos clientes;
    - As tabelas sobre a nota dada por donos desses modelos com relação à uma série de características serão extraídos do site [[http://www.carrosnaweb.com.br/|carros na web]] e disponibilizados via arquivo de texto;
    - Os dados devem ser lidos e uma análise exploratória com emprego de gráficos e tabelas deve ser feita;
    - A análise deve considerar comparações entre modelos, entre anos de fabricação e as diversas características votadas;
    - Cada grupo deve entrar no site [[http://www.carrosnaweb.com.br/opiniao.asp]] e consultar seus carros, anotar o número total de páginas de resultados e informar para o acadêmico Milton, responsável por reunir e enviar as informações de cada grupo: nomes dos acadêmicos, marcas, modelos, totais de páginas.
    - Os grupos e pares de carros a serem comparados seguem na tabela abaixo: 
^Acadêmicos^Carros^
|Bruna, Jonivan e Lucas |Gol vs Onix |
|Luiz, Maurício e Ana Laura |Gol vs HB20 |
|Danilo, Josafa e Francielle |HB20 vs Onix |
|Milton, Nathalie e Andressa |Ka vs Celta |
|Damiane e Cintia |Punto vs Polo |
|Adenmilson |Fluence vs Jetta |
| |S-10 vs Ranger |
| |Crossfox vs Idea |
| |Voyage vs Siena |
| |Uno vs Clio |
| |Sandero vs Gol |
| |Saveiro vs Strada |
| |Duster vs Ecosport |
| |Focus vs Fluence |
| |Fluence vs Cruze |
| |J3 vs Agile |
| |Punto vs City |
| |Logan vs Voyage |
| |Bravo vs Focus |
    - Os arquivos de texto a serem lidos são:
      - [[http://www.leg.ufpr.br/~walmes/data/aval_carros_nota.txt|Tabela]] com as notas no formato longo;
      - [[http://www.leg.ufpr.br/~walmes/data/aval_carros_info.csv|Tabela]] como as informações de origem e condição do carro;
      - [[http://www.leg.ufpr.br/~walmes/data/aval_carros_fwf.txt|Tabela]] com as notas no formato amplo, em comprimento fixo de campo;
      - [[http://www.leg.ufpr.br/~walmes/data/aval_carros_dic.txt|Tabela]] de dicionário para ler a tabela de comprimento fixo de campo;
      - 
Algumas escolhas de carros para comparação foram alteradas por não serem consideradas adequadas. Acadêmicos não listados devem escolher uma das opções disponíveis na tabela. Na aula de terça-feira (11/03) deve-se ler/importar os quarto arquivos fornecidos para download, selecionar/filtrar das tabelas os carros escolhidos e obter estatísticas descritivas para cada carro (tarefas por grupo/margem). Serão avaliados quanto a isso. 
=== Trabalho 2 - Distribuições de probabilidade ===
  - Resolver os exercícios selecionados do livro de {{http://www.leg.ufpr.br/~walmes/ensino/ce083-2014-01/exerc_bussabmoretin.pdf|Estatística Básica do Bussab e Moretin (5ª edição)}}, destacados com um X vermelho ao lado. Usar o R como calculadora e as funções p, d, q e r dos modelos de probabilidade.
  - Entregar a solução usando 1) [[http://www.rstudio.com/ide/docs/authoring/using_markdown|R+Markdown]], 2) [[http://cran.r-project.org/web/packages/odfWeave/vignettes/odfWeave.pdf|R+LibreOffice]], 3) [[http://www.r-statistics.com/2010/05/exporting-r-output-to-ms-word-with-r2wd-an-example-session/|R+MSWord]] ou 4) [[https://www.rstudio.com/ide/docs/authoring/overview|R+Latex]]. Instruções de como integrar o R aos sistemas de edição de texto serão passadas em sala de aula.
  - Instruções para envio do trabalho em [[http://www.leg.ufpr.br/doku.php/disciplinas:datafilehost]].
=== Trabalho 3 - Testes de hipótese ===
  - Aplicar cada um dos testes de hipótese abaixo com dados retirados de livros, dados reais, dados disponíveis na internet ou qualquer outra fonte. Evitar dados simulados.
    * Em medidas de posição:
      - Teste t para a média de uma v.a. normal;
      - Teste t para a diferença de médias entre duas v.a. normais por amostras independentes;
      - Teste t para a diferença de médias entre duas v.a. normais por amostras pareadas;
      - Teste exato para proporção de uma v.a. binomial;
      - Teste aproximando pela normal para proporção de uma v.a. binomial;
      - Teste para a diferença de proporções de duas ou mais v.a. binomiais;
      - Teste do sinal para a mediana de uma v.a.;
      - Teste de Wilcox para a diferença de médias de duas v.a. por amostras independentes;
      - Teste de Wilcox para a diferença de médias de duas v.a. por amostras pareadas;
    * Em medidas de dispersão:
      - Teste F para a igualdade de variâncias entre duas v.a. normais;
    * Aderência:
      - Teste chi-quadrado para aderência de uma distribuição à uma v.a.;
      - Teste de Shapiro-Wilk para a normalidade de uma v.a.;
      - Teste de Kolmogorov-Smirnov para a aderência de uma distribuição à uma v.a.;
    * Associação:
      - Teste chi-quadrado para independência de duas v.a. em tabelas de contingência;
      - Teste de correlação de Pearson entre duas v.a. normais;
      - Teste de correlação de Spearman entre duas v.a.;
  - Entregar a solução usando [[https://www.rstudio.com/ide/docs/authoring/overview|R+Latex]]. Instruções de como integrar o R aos sistemas de edição de texto serão passadas em sala de aula.
  - Instruções para envio do trabalho em [[http://www.leg.ufpr.br/doku.php/disciplinas:datafilehost]].
  - Prazo de entrega: 15/05/2014 até às 23h59.
{{threads>pessoais:walmes:ce083-2014-01:discussion_tb2}}
~~DISCUSSION~~