Não foi possível enviar o arquivo. Será algum problema com as permissões?
Diferenças

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

- Ambos lados da revisão anterior Revisão anterior
Próxima revisão
- disciplinas:ce071-2014-01 [2014/03/19 09:57] walmes
+ Revisão anterior
+ disciplinas:ce071-2014-01 [2014/06/17 14:46] (atual) walmes
@@ Linha -1,7 +1,14 @@ removida criada
 ====== CE-071: Análise de Regressão Linear ======
 
 <WRAP center round important 60%>
 <fs large><​fc #​FF0000>​EXAME FINAL</​fc>​ no dia 16/07, 19h00 no LABEST.
 Todo o conteúdo da disciplina.
 O aluno pode usar computador próprio.
 </fs>
 </​WRAP>​
 
 {{ http://​www.visualreporting.dk/​en/​images/​r-project-consultant.png?​480|}}
 
 ===== Detalhes da oferta da disciplina ​=====
 
   * Professor: [[http://​www.leg.ufpr.br/​~walmes|Walmes Marques Zeviani]], ([[http://​www.leg.ufpr.br|LEG:​ Laboratório de Estatística e Geoinformação]])
@@ Linha -12,5 +19,5 @@ removida criada
   * Atendimento:​ Segunda, 19:​00-20:​30h.
 
 ===== Scripts, notas e documentos ​======
 
 <note tip>
@@ Linha -20,6 +27,6 @@ removida criada
 {{url>​http://​www.leg.ufpr.br/​~walmes/​ensino/​ce071-2014-01/​ 800px, 600px center}}
 
 =/* ==== Histórico das Aulas do Curso ==== ==*/ 
 /*
 Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas.
   - 10/02:
@@ Linha -53,35 +60,98 @@ removida criada
     * Intervalos de confiança para \beta_j e funções lineares de \beta;
     * Intervalos de confiança para o valor predito e para observação futura.
   - 19/03
     * Prática de regressão linear múltipla com o R; 
     * Estudo sobre o preço de imóveis em função da área. 
   - 24/03
     * Fórmulas e matrizes correspondentes ao declarar modelos; 
     * Tipos de parametrizações em modelos lineares para variáveis categóricas;​ 
     * Prática de regressão linear múltipla com o R. 
   - 26/03
     * Prática de regressão linear múltipla com o R; 
     * Estudo sobre o preço de veículos em função da quilometragem e tipo de câmbio; 
     * Especificação e testes de hipóteses entre modelos aninhados. 
   - 31/03
     * Ajuste do modelo e previsão de valores; 
     * Intervalos de confiança e intervalos de predição. 
   - 02/04
     * Análise dos pressupostos do modelo; 
     * Medidas de influência;​ 
     * Tipos de resíduos (crus, padronizados,​ studentizados);​ 
     * DFfits, DFbetas e distância de Cook; 
   - 07/04
     * Análise dos resíduos e medidas de influência;​ 
     * Prática de regressão linear múltipla com o R; 
     * Estudo sobre o preço de relógios antigos; 
     * Estudo sobre o salário de trabalhadores sociais. 
   - 09/04
     * Medidas de colinearidade;​ 
     * Fator de inflação da variância. 
   - 14/04
     * Polinômios ortogonais;​ 
     * Centralização das variáveis;​ 
     * Prática de regressão linear múltipla com o R; 
     * Estudo sobre nível de ddt em peixes; 
     * Estudo sobre o gasto em consumo de alimentos por família. 
   - 16/04: 
   - 21/04   * Seleção de variáveis;​ 
     * Seleção forward, backwad e stepwise baseados em critérios de informação (AIC e BIC); 
   - 23/04
     * Prática de regressão linear múltipla com o R; 
     * Estudo sobre a qualidade de vinhos; 
     * Estudo sobre o salario de executivos. 
   - 28/04: 
   - 30/04   * Variáveis categóricas no modelo de regressão; 
   - 05/05   * Estudo das interações. 
   - 07/05
     * Introdução aos modelos de regressão não linear; 
     * Aspectos motivacionais práticos e diferenças para o modelo linear; 
     * Especificação,​ ajuste, diagnóstico e interpretação. 
   - 12/05
     * Regiões de confiança em modelos de regressão;​ 
     * Relações entre a região de confiança e a matriz de covariância dos parâmetros;​ 
     * Tipos de testes: razão de verossimilhanças e Wald; 
     * Tipos de intervalo de confiança: baseados na verossilhança e de Wald. 
   - 14/05
     * Teste de hipótese;​ 
     * Bandas de confiança;​ 
     * Medidas de diagnóstico. 
   - 19/05
     * Ajuste de modelos não lineares com variáveis independentes categórias. 
   - 21/05: 
   - 26/05   * Comparação de modelos não lineares; 
   - 28/05   * Parametrizações. 
   - 02/06
     * Apresentação de seminários. 
   - 04/06: 
   - 09/06   * Apresentação de seminários. 
  - 11*/06 
   - 16/06 
   - 18/06 
   - 23/06 
   - 25/06
 
 ==== Links úteis ​=Avaliações ​==
  
 === Cursos, dados e scripts sobre Regressão Linear === 
   * {{http://​www.ats.ucla.edu/​stat/​sas/​examples/​chp/​|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: scripts; 
   * {{http://​www.ats.ucla.edu/​stat/​sas/​examples/​chp/​chpsas_dl.htm|Regression Analysis by Example, by Chatterjee, Hadi and Price}}: dados em txt; 
   * {{http://​www.ats.ucla.edu/​stat/​stata/​examples/​ara/​default.htm|Applied Regression Analysis, by Fox}} 
   * {{http://​www.ats.ucla.edu/​stat/​stata/​examples/​alsm/​default.htm|Applied Lin Stat Models, by Neter, Kutner, Nachtsheim, and Wasserman}} 
   * {{http://​www.stat.ufl.edu/​~winner/​Regression_Examples.html|Regression Examples}}: dados e scripts de análises em R e $A$; 
  
 === Cartões de referência === 
   * {{http://​www2.kenyon.edu/​Depts/​Math/​hartlaub/​Math305%20Fall2011/​R.htm|Resumo de comandos R e pacotes para regressão}};​ 
   * {{http://​cran.r-project.org/​doc/​contrib/​Ricci-refcard-regression.pdf|Cartão de referência para regressão}};​ 
  
 === Medidas de diagnóstico === 
   * {{http://​www.stats.ox.ac.uk/​~burke/​Linear%20Models/​Linear%20Models%20Notes.pdf|Slides de curso completo de Regressão Linear}}; 
   * {{http://​statweb.stanford.edu/​~jtaylo/​courses/​stats203/​notes/​diagnostics.pdf|Slides de medidas de diagnóstico}};​ 
   * {{http://​www.stat.purdue.edu/​~jennings/​stat514/​stat512notes/​topic5.pdf|Resumo de medidas de diagnóstico}};​ 
   * {{http://​courses.washington.edu/​b515/​l7.pdf|Exemplos de diagnóstico}};​ 
   * {{http://​statweb.stanford.edu/​~jtaylo/​courses/​stats203/​notes/​diagnostics.pdf|Resumo de medidas de diagnóstico (com exemplos)}} 
  
 === Regressão com variáveis categóricas === 
   * {{http://​www.sagepub.com/​upm-data/​21120_Chapter_7.pdf|Dummy-Variable Regression}};​ 
   * {{http://​gauss.stat.su.se/​gu/​e/​slides/​F6-Dummy-Variable.pdf|Dummy variable regression models}}; 
   * {{http://​socserv.socsci.mcmaster.ca/​jfox/​Courses/​SPIDA/​dummy-regression-notes.pdf|Dummy-Variable Regression}};​ 
   * {{https://​www.princeton.edu/​~slynch/​soc504/​expanding_ols.pdf|Expanding the Model Capabilities:​ Dummy Variables, Interactions,​ and Nonlinear Transformations}}. 
  
 ==== Avaliações ​====
 
 === Trabalho 1 ===
@@ Linha -92,4 +162,5 @@ removida criada
   * Função para quadro de anova particionado.
   * Função para calcular o valor predito com IC.
   * Entregar o código impresso das funções programadas no dia 24/03/14.
 
 <code R>
@@ Linha -119,2 +190,109 @@ removida criada
 }
 </​code>​
 
 === Trabalho 2 ===
 
   * Fazer estudo de simulação para estudar a distribuição amostral dos estimadores e das estatísticas do testes.
   * Verificar que <​latex>​E(\hat\beta) = \beta</​latex>,​ <​latex>​var(\hat\beta) = \sigma^2(X'​X)^{-1}</​latex>,​ e que <​latex>​\hat\betas</​latex>​ têm distribuição Normal.
   * Verificar que <​latex>​E(\hat\sigma^2) = \sigma^2</​latex>​ e que <​latex>​(n-p)*\hat\sigma/​\sigma<​\latex>​ têm distribuição qui-quadrado.
   * Verificar que <​latex>​F = (A\hat\beta-m)'​[A(X'​X)^{-1}A'​]^{-1}(A\hat\beta-m)/​(r QMRes)</​latex>​ têm distribuição F sob H0 que <​latex>​A\betas = m</​latex>​.
   * Estudar a distribuição da estatística F = QMReg/QMres e comparar com o F anterior.
   * Entregar código impresso com gráficos e tabelas que sobre os resultados solicitados no dia 24/03/14.
 
 <code R>
 ## Função que retorna estimativas de parâmetros e estatísticas sob uma
 ## amostra aleatória simulada ao ser executada.
 mysimula <- function(X, beta, sigma, A, m=beta){
 ...
 }
 
 results <- replicate(10000,​ mysimula)
 </​code>​
 
 === Trabalho 3 ===
 
   * Programar funções para obter:
     * Resíduos ordinários,​ padronizados e studentizados;​
     * Valores de alavancagem;​
     * Distância de Cook;
     * DFfits, DFbetas;
   * As funções devem receber como argumentos as matrizes X e y e retornas as respectivas medidas;
 
   * Alavancagem
 <​latex>​
 h_i = H_{ii}\\
 h = \text{diag}(H) = \text{diag}(X(X^\top X)^{-1}X^\top)\\
 </​latex>​
 
   * Resíduos crus
 <​latex>​
 e_i = y_i - \hat{y}_i\\
 e = y - \hat{y}\\
 e = y - X\hat{\beta}
 </​latex>​
 
   * Resíduos padronizados (ou internamente studentizados)
 <​latex>​
 r_i = \dfrac{e_i}{s(e_i)} = \dfrac{e_i}{\hat{\sigma}\sqrt{1-h_{i}}}
 </​latex>​
 
   * Resíduos studentizados (ou externamente studentizados)
 <​latex>​
 t_i = \dfrac{e_i}{s(e_i)} = \dfrac{e_i}{\hat{\sigma}_{-i}\sqrt{1-h_{i}}}\\
 \hat{\sigma}_{-i}^2 = \dfrac{(n-p)\hat{\sigma}^2-\frac{e_i^2}{1-h_{i}}}{(n-1)-p}
 </​latex>​
 
   * Distância de Cook
 <​latex>​
 D_i = \dfrac{(\hat{y}-\hat{y}_{i(-i)})^\top (\hat{y}-\hat{y}_{i(-i)})}{p\hat{\sigma}^2} = 
 \dfrac{1}{p}\cdot\dfrac{h_i}{(1-h_i)}\cdot\dfrac{e_i^2}{\hat{\sigma}^2(1-h_i)}
 </​latex>​
 
   * DFfits
 <​latex>​
 dffits_i = \dfrac{\hat{y}_i-\hat{y}_{i(-i))}}{\hat{\sigma}_{-i}\sqrt{h_i}} = t_i\left( \dfrac{h_i}{1-h_i} \right )^{1/2}
 </​latex>​
 
   * DFbetas
 <​latex>​
 dbetas_i = \dfrac{\hat{\beta}-\hat{\beta}_{-i}}{\hat{\sigma}_{-i}\sqrt{\text{diag}((X^\top X)^{-1})}}\\
 \hat{\beta}_{-i} = \hat{\beta}-\dfrac{e_i}{1-h_i}\cdot (X^\top X)^{-1} x_i
 </​latex>​
 
 === Trabalho 4 ===
 
   * Análise de dados por meio de regressão com presença de variáveis independentes categóricas;​
   * Os dados e contexto são exercício do capítulo 6 do *Applied Linear Regression* 3.ed do Weisberg;
   * Fazer a análise dos dados fornecendo o contexto e objetivos do mesmo, declarar o modelo, correr análise dos resíduos, interpretar os resultados, fazer a predição com bandas de confiança;
   * Entregar *.zip o pdf, Rnw e arquivos acessórios;​
   * Prazo de entrega: 12/05/2014 até às 23h59;
 
 <code R>
 ##​-----------------------------------------------------------------------------
 str(twins) ​    ## 6.4.  Eduardo.
 str(BGSall) ​   ## 6.6.  Michele.
 str(cathedral) ## 6.10. Paula.
 str(salary) ​   ## 6.13. Cintia.
 str(mile) ​     ## 6.18. Gustavo.
 ##​-----------------------------------------------------------------------------
 </​code>​
 
 
 ==== Links de arquivos e dados disponibilizados pelos alunos ====
 
 {{threads>​pessoais:​walmes:​ce071-2014-01:​discussion}}
 
 ~~DISCUSSION~~
 
 /*
 === Passos para disponibilizar arquivos no DATAFILEHOST ===
 
   - Subir os arquivos (preferencialmente *.txt para dados) site {{http://​www.datafilehost.com/​|datafilehost}};​
   - Seguir as etapas caixas numeradas da figura abaixo: 1 - escolher o arquivo, 2 - fazer upload, 3 - copiar o link para colar na mensagem e 4 - em caso de erro use o link para deletar o arquivo;
   - Junto ao link para o arquivo coloque informações sobre o mesmo livro do qual foi retirado, página, número da tabela, nomenclatura das variáveis, contexto, objetivos da análise, unidade de medida das variáveis. As caixas numeradas indicam: 1 - identificação do remetente, 2 - mensagem contendo informações básicas e link para download, 3 - preenchimento de código de segurança e 4 - para concluir com o envio da mensagem.
 
 {{http://​www.leg.ufpr.br/​~walmes/​ensino/​passos_datafilehost.png?​800|}}
 
 {{http://​www.leg.ufpr.br/​~walmes/​ensino/​passos_discussao.png?​800|}}
 
 */

QR Code
QR Code disciplinas:ce071-2014-01 (generated for current page)