projetos:hipertensao - Wiki do LEG

Não foi possível enviar o arquivo. Será algum problema com as permissões?

Você está aqui: start » projetos » hipertensao

Essa é uma revisão anterior do documento!

Tabela de conteúdos

Métodos Multivariados.
Avaliação de Capacidade Preditiva
Estudo - Regressão Logística

Participantes

Flaviane Peccin, Graduanda (UFPR)
Christine Cardozo de Araujo, Graduanda (UFPR)
Joel Maurício Corrêa da Rosa , Prof. Dr. (UFPR)

Objetivos

Geral : Aplicar técnicas multivariadas para encontrar possíveis fatores de risco para idosas hipertensas.

Específicos

Aplicar métodos de clusterização
Aplicar métodos de classificação
Comparar os métodos de classificação
Avaliar a importância das variáveis explicativas

Metodologia

Métodos Multivariados.

Regressão Logística
Clusterização
Análise Linear Discriminante
Árvores de Decisão
Redes Neurais Artificiais

Árvores de Decisão

Árvores de Decisão são extremamente úteis para revelar de forma simples, estruturas que são extremamente complexas. O pacote R dispõe de duas funções para o ajuste de árvores de decisão: tree e rpart.

Pela função rpart é possível construir árvores de decisão no mesmo espírito descrito em Breiman et al. (1984) na monografia CART (Classification and Regression Trees).

Regressão Logística

Este problema envolve um grande número de covariáveis e, portanto, uma das maiores dificuldades está na seleção do conjunto de preditoras. Métodos do tipo stepwise, embora sejam atraentes na prática podem conduzir à modelos enganosos.

A tarefa aqui, é integrar à construção do modelo a intervenção dos especialistas na área. Então um passo no processo iterativo de seleção de variáveis é retirar preditoras selecionadas automaticamente que não tenham sentido, de acordo com opinião especializada.

Análise Linear Discriminante

A função lda() presente no pacote MASS do R realiza análise linear discriminante. É importante notar que para a construção da função linear discriminante os preditores devem ser quantitativos e assume-se matrizes de covariância iguais nos grupos.

Redes Neurais Artificiais

Redes Neurais Artificiais para classificação estão implementadas no pacote nnet() presente na biblioteca MASS do R.

Avaliação de Capacidade Preditiva

Os desempenhos de diferentes métodos para a classificação são usualmente comparados por intermédio de experimentos de validação cruzada com 10-dobras. Estes consistem em utilizar 90% dos dados para treinamento e 10% para teste. Os métodos passam por aprendizado supervisionado utilizando a chamada amostra de treinamento composta pelos dados selecionados com esta finalidade e o ajuste final é testado na amostra de teste.

Resultados e Discussão

Banco de Dados e Scripts do R

Banco de Dados - Hipertensão

Links de Interesse

Data Mining com R - Universidade do Minho

Using-R - parte 2

Funções do R

Pacote para Mapas Auto-Organizáveis (SOM) de Kohonen no R

Scripts do R

# pacotes necessarios
require(MASS)
require(tree)# arvores de decisao
require(rpart)# arvores de decisao

# Leitura do conjunto de dados
dados<-read.csv2('http://www.leg.ufpr.br/~joel/dados/hiipertensao.csv',na.strings="")

# Re-expressão das variáveis
dados<-transform(dados,sexo=factor(sexo,labels=c('feminino','masculino')))

Estudo - Regressão Logística

#Descritivo dos dados originais
summary(dados)
sapply(dados,class)
names(dados)

#separação por sexo
dad <- split(dados , dados$sexo)
dadfem <- dad[["feminino"]]
dadf <- na.omit(dadfem)

#verificação
summary (dados$sexo)
summary (dadfem$sexo)
summary (dadf$sexo)

#Verificar os nomes das variáveis
names(dadf)

Bibliografias

[1998, book]: Johnson, R. A., & Wichern, D. W. (1998). Applied Multivariate Statistical Analysis Prentice Hall.

[2002, book]: Venables, W. N., & Ripley. (2002). Modern Applied Statistic with S. Springer.

Laboratórios de Estatística

== ==== Flaviane Peccin ==== ==

Artigo: Fatores de Hipertensão usando Redes Neurais Kohonen

Apresentação: 05/09/2007 - Grupo II

== ==== Christine Cardozo de Araujo ==== ==

Artigo: Projeto Bambuí-MG

Apresentação: 05/09/2007 - Grupo I

Acompanhamento Assessoria

Assessoria LAB I