disciplinas:ce071-2014-01

Não foi possível enviar o arquivo. Será algum problema com as permissões?

Você está aqui: start » disciplinas » ce071-2014-01

Essa é uma revisão anterior do documento!

Tabela de conteúdos

Detalhes da oferta da disciplina
Scripts, notas e documentos
Histórico das Aulas do Curso
Links úteis
Avaliações
Links de arquivos e dados disponibilizados pelos alunos

CE-071: Análise de Regressão Linear

Detalhes da oferta da disciplina

Professor: Walmes Marques Zeviani, (LEG: Laboratório de Estatística e Geoinformação)
Curso: Estatística.
Período: 2014/1.
Local: LABEST, LAB C.
Horário: Segunda, 20h45-22:00h e quarta 19:00-20:30h.
Atendimento: Segunda, 19:00-20:30h.

Scripts, notas e documentos

Apostilas e textos úteis: ce071_livros.zip (84 MB)

Histórico das Aulas do Curso

Abaixo o histórico de atividades realizadas em classe e atividades extra classe aplicadas.

10/02:
- Informação sobre a oferta da disciplina;
- Introdução à regressão linear;
- Panorama do conteúdo previsto.
12/02:
- Análise gráfica exploratória visando aplicação de regressão.
17/02:
- Representação matricial;
- Interpretação geométrica;
- Estimação pelo método dos mínimos quadrados.
19/02:
- Métodos numéricos considerados na estimação: decomposição QR e de Cholesky.
24/02:
- Estimação baseada na verossimilhança.
26/02:
- Esperança e variância dos estimadores;
- Teorema de Gauss-Markov;
- Análise de variância.
10/03:
- Regressão linear múltipla, resultados representados matricialmente;
- Quadro de análise de variância;
12/03:
- Propriedades distribucionais dos estimadores;
- Teste F de uma função linear para inferência sobre \beta;
- Teste F do quadro de análise de variância.
17/03:
- Teste de hipótese para \beta e subconjuntos de \beta;
- Teste da soma de quadrados extra;
- Intervalos de confiança para \beta_j e funções lineares de \beta;
- Intervalos de confiança para o valor predito e para observação futura.
19/03:
- Prática de regressão linear múltipla com o R;
- Estudo sobre o preço de imóveis em função da área.
24/03:
- Fórmulas e matrizes correspondentes ao declarar modelos;
- Tipos de parametrizações em modelos lineares para variáveis categóricas;
- Prática de regressão linear múltipla com o R.
26/03:
- Prática de regressão linear múltipla com o R;
- Estudo sobre o preço de veículos em função da quilometragem e tipo de câmbio;
- Especificação e testes de hipóteses entre modelos aninhados.
31/03
02/04
07/04
09/04
14/04
16/04
21/04
23/04
28/04
30/04
05/05
07/05
12/05
14/05
19/05
21/05
26/05
28/05
02/06
04/06
09/06
11/06
16/06
18/06
23/06
25/06

Links úteis

Regression Analysis by Example, by Chatterjee, Hadi and Price: scripts;
Regression Analysis by Example, by Chatterjee, Hadi and Price: dados em txt;
Applied Regression Analysis, by Fox
Applied Lin Stat Models, by Neter, Kutner, Nachtsheim, and Wasserman
Regression Examples: dados e scripts de análises em R e $A$;

Avaliações

Trabalho 1

Função para estimação de beta a partir de X e y. Implementar o método de estimação literal, decomposição de Cholesky e decomposição QR.
Função para calcular o quadro de análise de variância.
Função para tabela de estimativas com erro-padrão e IC.
Função para quadro de anova particionado.
Função para calcular o valor predito com IC.
Entregar o código impresso das funções programadas no dia 24/03/14.

## Estima o vetor de parâmetros \beta
mycoef <- function(X, y, method){
...
}
 
## Retorna o quadro de análise de variância corrigido para a média
myanova <- function(X, y){
...
}
 
## Retorna a tabela com erros padrões, t-valor, p-valor e IC para \betas
mycoeftable <- function(X, y, conf=0.95){
...
}
 
## Retorna o quadro de análise de variância particionado para X1
myanovapart <- function(X, y, X1){
...
}
 
## Retorna o valor predito com IC
mypredict <- function(x0, betas, vcov, conf){
...
}

Trabalho 2

Fazer estudo de simulação para estudar a distribuição amostral dos estimadores e das estatísticas do testes.
Verificar que E(\hat\beta) = \beta, var(\hat\beta) = \sigma^2(X'X)^{1}, e que \hat\betas têm distribuição Normal. * Verificar que E(\hat\sigma^2) = \sigma^2 e que (n-p)*\hat\sigma/\sigma têm distribuição qui-quadrado. * Verificar que F = (A\hat\beta-m)'[A(X'X)^{-1}A']^{-1}(A\hat\beta-m)/(r QMRes) têm distribuição F sob H0 que A\betas = m. * Estudar a distribuição da estatística F = QMReg/QMres e comparar com o F anterior. * Entregar código impresso com gráficos e tabelas que sobre os resultados solicitados no dia 24/03/14. <code R> ## Função que retorna estimativas de parâmetros e estatísticas sob uma ## amostra aleatória simulada ao ser executada. mysimula ← function(X, beta, sigma, A, m=beta){ … } results ← replicate(10000, mysimula) </code> === Trabalho 3 === * Programar funções para obter: * Resíduos ordinários, padronizados e studentizados; * Valores de alavancagem; * Distância de Cook; * DFfits, DFbetas; * As funções devem receber como argumentos as matrizes X e y e retornas as respectivas medidas; * Alavancagem <latex> h_i = H_ii
h = diag(H) = diag(X(X^\top X)^{-1}X^\top)
</latex> * Resíduos crus <latex> e_i = y_i - \hat{y}_i
e = y - \hat{y}
e = y - X\hat{\beta} </latex> * Resíduos padronizados (ou internamente studentizados) <latex> r_i = \dfrac{e_i}{s(e_i)} = \dfrac{e_i}{\hat{sigma}\sqrt{1-H_{ii}}} </latex> * Resíduos studentizados (ou externamente studentizados) <latex> r_i = \dfrac{e_i}{s(e_i)} = \dfrac{e_i}{\hat{\sigma}_{-i}\sqrt{1-H_{ii}}}
\hat{\sigma}_{-i}^2 = \dfrac{(n-p)\hat{\sigma}^2\frac{e_i}{1-H_{ii}}}{(n-1)~~p} </latex> * Distância de Cook <latex> D_i = \dfrac{(\hat{y}~~\hat{y}_{i(~~i)})^\top (\hat{y}~~\hat{y}_{i(~~i)})}{p\hat{\sigma}^2} = \dfrac{1}{p}\cdot\dfrac{h_i}{(1-h_i)}\cdot\dfrac{e_i^2}{\sigma^2(1-h_i)} </latex> * DFfits <latex> dffits_i = \dfrac{\hat{y}_i~~\hat{y}_{i(-i))}}{\sigma_{-i}\sqrt{1-h_i}} = \left( \dfrac{p\cdot D_i \hat{\sigma}^2}{\hat{\sigma}^2_{-i}} \right )^{1/2}

</latex>

DFbetas

$Graph$

</code>

##-----------------------------------------------------------------------------
 
require(car)
 
##-----------------------------------------------------------------------------
## Dados sobre o preço de leitão (price) de relógios antigos (do avô) em
## função da idade do relógio (age) e do número de potenciais
## compradores (bidders).
 
da <-
    read.table("http://www.leg.ufpr.br/~walmes/data/business_economics_dataset/EXAMPLES/GFCLOCKA.DAT",
               header=FALSE)
 
str(da)
 
## Essa coluna removida é o produto de age*bidders
da <- da[,-4]
 
names(da) <- c("age", "bidders", "price")
str(da)
 
##-----------------------------------------------------------------------------
## Dados sobre o salário em função dos anos de experiência de uma
## amostra de trabalhadores sociais.
 
db <-
    read.table("http://www.leg.ufpr.br/~walmes/data/business_economics_dataset/EXAMPLES/SOCWORK.DAT",
               header=FALSE)
 
names(db) <- c("yrsexp", "salary")
 
##-----------------------------------------------------------------------------