Não foi possível enviar o arquivo. Será algum problema com as permissões?
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
- | Ambos lados da revisão anterior Revisão anterior Próxima revisão |
- | projetos:hipertensao [2007/10/30 13:22] tinetoon |
---|---|
+ | Revisão anterior |
+ | projetos:hipertensao [2007/12/17 20:27] (atual) joel |
@@ Linha -7,23 +7,21 @@ | |
===== Objetivos ===== | |
Geral : Aplicar técnicas multivariadas | |
Específicos : | |
- | |
- | |
- | |
- | |
===== Metodologia ===== | |
==== Métodos Multivariados. ==== | |
* Clusterização pelo método das k-médias | |
* Regressão Logística | |
* Análise Linear Discriminante | |
* Árvores de Decisão | |
@@ Linha -31,38 +29,6 @@ | |
=== Análise de Cluster === | |
Denomina-se Análise de Cluster ou Análise de Agrupamentos o conjunto de técnicas utilizadas na identificação de padrões de comportamento em bancos de dados através da formação de grupos homogêneos. O objetivo da analise de cluster é agrupar objetos ou variáveis semelhantes de forma que cada grupo seja homogêneo internamente e sejam diferentes entre si. | |
=== Árvores de Decisão === | |
@@ Linha -82,11 +48,10 @@ | |
Neste trabalho será realizada somente a análise linear discriminante (LDA). Outros tipos de análise discriminante são: QDA(Quadratic Discriminant Analysis), FDA(Flexible Discriminant Analysis), PDA(Penalized Discriminant Analysis) e MDA(Mixture Discriminant Analysis). A função lda() presente no pacote MASS do R realiza análise linear discriminante. É importante notar que para a construção da função linear discriminante os preditores devem ser quantitativos e assume-se matrizes de covariância iguais nos grupos. | |
=== Redes Neurais Artificiais === | |
Apesar de todo mito que envolve o uso de Redes Neurais Artificiais, o que está por trás desta técnica é a utilização de modelos não-lineares. Redes Neurais Artificiais para classificação estão implementadas no pacote nnet() presente na biblioteca MASS do R. A construção de uma rede neural associa-se a definição de sua topologia que no caso das redes do tipo feed-forward envolve a definição de 3 ou mais camadas. A primeira camada, chamada de camada de entrada necessita de tantos neurônios quanto forem o número de variáveis independentes, enquanto a última camada, denominada camada de saída, apresenta tantos neurônios quantas forem as variáveis resposta. Entre estas duas camadas podem existir uma ou mais camadas intermediárias, chamadas de camadas escondidas. O Teorema de Kolmogorov garante que uma camada escondida é suficiente para aproximar qualquer relação não-linear entre a resposta e as variáveis independentes, desde que satisfeitas algumas condições. | |
==== Avaliação de Capacidade Preditiva ==== | |
@@ Linha -99,19 +64,18 @@ | |
===== Banco de Dados e | |
{{projetos:dados_hipertenso.txt|Banco de Dados - Hipertensão}} | |
{{pessoais:tinetoon:nomesvariaveis.xls|Nome das Variáveis - Hipertensão}} | |
{{pessoais:peccin:dadostrein.txt|Dados Treinamento}} | |
{{pessoais:peccin:dadostest.txt|Dados Validação}} | |
===== Links de Interesse ===== | |
@@ Linha -124,4 +88,5 @@ | |
* [[http://www.sanny.com.br/si/site/0302?idioma=portugues|Sanny - American Medical do Brasil: Dobra Cultânea]] | |
* [[http://www.the-data-mine.com/bin/view/Misc/WebIndex | Recursos de Data Mining na WEB]] | |
* [[http://www.devmedia.com.br/articles/viewcomp.asp?comp=5945 | Data Mining: conceitos e casos de uso na área da saúde]] | |
===== Outros Materiais ===== | |
@@ Linha -131,4 +96,6 @@ | |
* {{projetos:modeltree:cart_area_medica.pdf|Comparação: Regressão Linear, Redes Neurais e CART}} | |
* {{projetos:usingr-2.pdf|Using-R - parte 2}} | |
* {{projetos:obesidade:rnalogistichepatite.pdf|Redes Neurais e Regressão Logística para Diagnóstico de Hepatite}} | |
* {{projetos:artigo.pdf|Fatores de Hipertensão usando Redes Neurais Kohonen}} | |
===== Funções do R ===== | |
@@ Linha -137,23 +104,23 @@ | |
[[http://cran.at.r-project.org/src/contrib/Descriptions/som.html |Pacote para Mapas Auto-Organizáveis | |
(SOM) de Kohonen no R]] | |
===== Scripts do R ===== | |
<code R> | |
# pacotes necessarios | |
require(MASS) | |
require(tree)# arvores de decisao | |
require(rpart)# arvores de decisao | |
# Leitura do conjunto de dados | |
dados<-read.csv2('http://www.leg.ufpr.br/~joel/dados/hiipertensao.csv',na.strings="") | |
</code> | |
==== | |
<code> | |
@@ Linha -163,21 +130,70 @@ | |
names(dados) | |
# | |
dad <- split(dados , dados$sexo) | |
dadfem <- dad[["feminino"]] | |
#Eliminação do NA | |
dadf <- na.omit(dadfem) | |
# | |
summary (dados$sexo) | |
summary (dadfem$sexo) | |
summary (dadf$sexo) | |
sapply(dadf,class) | |
#Verificar os nomes das variáveis | |
names(dadf) | |
#Substituições necessárias devido erro de digitação | |
dadf$tabag[92]<-NA #era 2 | |
dadf$tabag[713]<-NA #era 8 | |
#Eliminação do NA | |
dadff <- na.omit(dadf) | |
#Verificação | |
summary (dados$sexo) | |
summary (dadfem$sexo) | |
summary (dadf$sexo) | |
summary (dadff$sexo) | |
#Arrumando classe de dados | |
dadff$inst <- as.factor(dadff$inst) | |
dadff$tabag <- as.factor(dadff$tabag) | |
dadff$dcv <- as.factor(dadff$dcv) | |
dadff$peso <- as.numeric(dadff$peso) | |
dadff$estat <- as.numeric(dadff$estat) | |
dadff$pasis <- as.numeric(dadff$pasis) | |
dadff$padias <- as.numeric(dadff$padias) | |
dadff$ccint <- as.numeric(dadff$ccint) | |
dadff$cabd <- as.numeric(dadff$cabd) | |
dadff$cquad <- as.numeric(dadff$cquad) | |
dadff$ccoxa <- as.numeric(dadff$ccoxa) | |
dadff$dcabd <- as.numeric(dadff$dcabd) | |
dadff$dcsupra <- as.numeric(dadff$dcsupra) | |
dadff$dctric <- as.numeric(dadff$dctric) | |
dadff$dccoxa <- as.numeric(dadff$dccoxa) | |
dadff$fa30 <- as.numeric(dadff$fa30) | |
dadff$lc30 <- as.numeric(dadff$lc30) | |
dadff$tc6x <- as.numeric(dadff$tc6x) | |
dadff$tc6f <- as.factor(dadff$tc6f) | |
dadff$Idade <- as.numeric(dadff$Idade) | |
dadff$imc <- as.numeric(dadff$imc) | |
dadff$rcq <- as.numeric(dadff$rcq) | |
dadff$nsecon <- as.factor(dadff$nsecon) | |
dadff$exerc <- as.numeric(dadff$exerc) | |
dadff$hipertensao <- as.factor(dadff$hipertensao) | |
dadff$diabete <- as.factor(dadff$diabete) | |
dadff$regi <- as.factor(dadff$regi) | |
dadff$hipaf <- as.factor(dadff$hipaf) | |
dadff$somadc <- as.numeric(dadff$somadc) | |
#Verificação | |
sapply(dadff,class) | |
</code> | |
==== Criação de Vetor de Índices ==== | |
<code> | |
# Criacao de vetor de indices | |
@@ Linha -261,4 +277,21 @@ | |
virginica 0 0 5 | |
</code> | |
==== Criação das Bases de Desenvolvimento e de Validação ==== | |
<code R> | |
<echo=F,results=hide>>= | |
ind<-1:989 # Criacao de vetor de indices | |
ind.trein<-sample(ind,890)# Indices para treinamento | |
ind.trein | |
dados.trein<-dadff[ind.trein,] # Selecao do conjunto de treinamento | |
dados.test<-dadff[-ind.trein,] # Selecao do conjunto de teste | |
@ | |
</code> | |
<code R> | |
dadostrein<-read.table("http://www.leg.ufpr.br/~joel/dados/dadostrein.txt",h=T) | |
dadostest<-read.table("http://www.leg.ufpr.br/~joel/dados/dadostest.txt",h=T) | |
</code> | |
@@ Linha -284,24 +317,384 @@ | |
</bibtex> | |
<bibtex> | |
@Book{hair+tatham+anderson+black:2006, | |
author = {Hair, Joseph F. AND Tatham; Ronald L. AND Anderson, Rolph E. AND Black, William}, | |
title = {Multivariate Data Analysis}, | |
note = {Tradu\c{c}\~{a}o: Adonai Schulup Sant'Anna e Anselmo Chaves Neto}, | |
pages = {}, | |
publisher = {Bookman}, | |
address = {Porto Alegre}, | |
year = {2006}, | |
} | |
</bibtex> | |
==================================================== | |
<bibtex> | |
@article{ABC2422007, | |
author = {ABC da Saúde}, | |
title = {Hipertensão Arterial - Crise Hipertensiva}, | |
language = {pt}, | |
note = {http://www.abcdasaude.com.br/artigo.php?242}, | |
year = {2007}, | |
month = {11}, | |
} | |
@article{ABC2442007, | |
author = {ABC da Saúde}, | |
title = {{Hipertensão Arterial - Introdução}}, | |
language = {pt}, | |
note = {http://www.abcdasaude.com.br/artigo.php?244}, | |
year = | |
month = {11}, | |
} | |
@article{ABC2452007, | |
author = {ABC da Saúde}, | |
title = {{Hipertensão Arterial - Investigação Clínica e Laboratorial}}, | |
language = {pt}, | |
note = {http://www.abcdasaude.com.br/artigo.php?245}, | |
year = {2007}, | |
month = | |
} | |
author = { | |
title = {{Hipertensão Arterial - Prevenção e Tratamento}}, | |
language = {pt}, | |
note = {http://www.abcdasaude.com.br/artigo. | |
year = {2007}, | |
month = {11}, | |
} | |
title = {{Uma investiga\c{c}\~ao antropol\'ogica na terceira idade: concep\c{c}\~oes sobre a hipertens\~ao arterial}}, | |
journal = {{Cadernos de Sa\'ude P\'ublica}}, | |
author = {Carvalho, Fernanda AND Telarolli Junior, Rodolpho AND Machado, Jos\'e C\^andido Monteiro da Silva}, | |
ISSN = {0102-311X}, | |
language = {pt}, | |
url = {http: | |
volume = {14}, | |
year = {1998}, | |
month = {07}, | |
pages = {617 - | |
publisher = {scielo}, | |
} | |
title = {{Modelo hierarquizado: uma proposta de modelagem aplicada \`a investiga\c{c}\~ao de fatores de risco para diarr\'eia grave}}, | |
journal = {{Revista de Sa\'ude P\'ublica}}, | |
author={Fuchs, Sandra C AND Victora, Cesar G. AND Fachel, Jandyra}, | |
ISSN = {0034-8910}, | |
language = {pt}, | |
url = {http: | |
volume = {30}, | |
year = {1996}, | |
month = {04}, | |
pages = {168 - | |
publisher = {scielo}, | |
} | |
author = {Hoffmann, Rodolfo AND Vieira, S\^{o}nia}, | |
title = {{ An\'alise de Regress\~{a}o: uma introdu\c{c}\~{ | |
pages = {}, | |
publisher = {Hucitec - USP}, | |
address = {São Paulo}, | |
year = {1977}, | |
} | |
@article{JARDIM2007, | |
title = {{Hipertens\~ao arterial e alguns fatores de risco em uma capital brasileira}}, | |
journal = {{Arquivos Brasileiros de Cardiologia}}, | |
author={Jardim, Paulo C\'esar B. Veiga AND Gondim, Maria do Ros\'ario Peixoto AND Monego, Estelamaris Tronco AND Moreira, Humberto Graner AND Vitorino, Priscila Valverde de Oliveira AND Souza, Weimar Kunz Sebba Barroso AND Scala, Luiz C\'esar Naz\'ario}, | |
ISSN = {0066-782X}, | |
language = {pt}, | |
url = {http: | |
volume = {88}, | |
year = {2007}, | |
month = {04}, | |
pages = {452 - 457}, | |
publisher = {scielo}, | |
} | |
@Book{JOHNSON2007, | |
author = {Johnson, Richard A. AND Wichern, Dean W.}, | |
title = {{Applied Multivariate Statistical Analysis}}, | |
note = {Sixth Edition}, | |
pages = {}, | |
publisher = {Pearson Prentice Hall}, | |
address = {}, | |
year = {1998}, | |
} | |
@Book{KLEINBAUM1994, | |
author = {KLEINBAUM, David G.}, | |
title = {Logistic Regression - Self-Learning Text}, | |
pages = {}, | |
publisher = {Springer-Verlang}, | |
address = {New York}, | |
year = {1994}, | |
} | |
@article{LOLIO1993, | |
title = {{Hipertens\~ao arterial e possíveis fatores de risco}}, | |
journal = {{Revista de Sa\'ude P\'ublica}}, | |
author = {Lolio, Cec\'{\i}lia Amaro de AND Pereira, J\'ulio C\'esar Rodrigues AND Lotufo, Paulo Andrade AND Souza, Jos\'e Maria Pacheco de}, | |
ISSN = {0034-8910}, | |
language = {pt}, | |
url = {http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-89101993000500006&nrm=iso}, | |
volume = {27}, | |
year = {1993}, | |
month = {10}, | |
pages = {357 - 362}, | |
publisher = {scielo}, | |
} | |
@article{MEDICINAESAUDE2007, | |
author = {Medicina e Saúde}, | |
title = {{Pressão Arterial}}, | |
language = {pt}, | |
url = { http://www.portalbrasil.net/medicina_pressao.htm}, | |
year = {2007}, | |
month = {11}, | |
} | |
@article{PESSUTO1998, | |
title = {{Fatores de risco em indiv\'{\i}duos com hipertens\~ao arterial}}, | |
journal = {{Revista Latino-Americana de Enfermagem}}, | |
author={Pessuto, Janete AND Carvalho, Em\'{\i}lia Campos de}, | |
ISSN = {0104-1169}, | |
language = {pt}, | |
url = {http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0104-11691998000100006&nrm=iso}, | |
volume = {6}, | |
year = {1998}, | |
month = {01}, | |
pages = {33 - 39}, | |
publisher = {scielo}, | |
} | |
@Manual{R2007, | |
title = {R: A Language and Environment for Statistical Computing}, | |
author = {{R Development Core Team}}, | |
organization = {R Foundation for Statistical Computing}, | |
address = {Vienna, Austria}, | |
year = {2007}, | |
note = {{ISBN} 3-900051-07-0}, | |
url = {http://www.R-project.org}, | |
} | |
@article{RELIASOFT2007, | |
author = {Reliasoft}, | |
title = {{Relia Soft Brasil - Conceitos de Confiabilidade: Estimador de Máxima Verossimilhança (MLE)}}, | |
language = {pt}, | |
note = {http://www.reliasoft.com.br/hotwire/edicao2/conceito2.htm}, | |
year = {2007}, | |
month = {11}, | |
} | |
@book{ROTHENBERG1976, | |
author = {Rothenberg, Robert E}, | |
title = {{Enciclopédia Médica ilustrada para uso no lar - Vol 1}}, | |
note = {Tradução: Camargo, Marisis Aranha}, | |
pages = {208 - 242}, | |
publisher = {Editora Abril}, | |
address = {São Paulo}, | |
year = {1976}, | |
} | |
@article{SANNY2007, | |
author = {Sanny - American Medical do Brasil}, | |
title = {{Sanny - American Medical do Brasil - Dobra Cultânea}}, | |
language = {pt}, | |
url = {http://www.sanny.com.br/si/site/0302?idioma=portugues}, | |
year = {2007}, | |
month = {11}, | |
} | |
@article{SBN2006, | |
author = {Sociedade Brasileira de Nefrologia}, | |
title = {{SBN - V Diretrizes Brasileiras de Hipertensão realizada em conjunto pelas Sociedades Brasileiras de Nefrologia, Cardiologia e Hipertensão em fevereiro de 2006}}, | |
language = {pt}, | |
note = {http://www.sbn.org.br/Diretrizes/V_Diretrizes_Brasileiras_de_Hipertensao_Arterial.pdf | |
year = {2007}, | |
month = {11}, | |
} | |
@article{SBNCAP9, | |
author = {Sociedade Brasileira de Nefrologia}, | |
title = {{SBN - | |
language = {pt}, | |
note = {http://www.sbn.org.br/Diretrizes/HA/Capitulo\%2009\%20diretrizes\%20corrigido.pdf}, | |
year = {2007}, | |
month = {11}, | |
} | |
@article{SILVA2004, | |
title = {{Fatores de risco para hipertensão arterial sistêmica versus estilo de vida docente}}, | |
journal = {{ Revista Eletrônica de Enfermagem }}, | |
author={Silva, Jorge Luis Lima AND Souza, Solange Lourdes de}, | |
language = {pt}, | |
url = {http://www.fen.ufg.br/revista/revista6_3/pdf/03_Original.pdf}, | |
volume = {06}, | |
year = {2004}, | |
pages = {330 - 335}, | |
publisher = {fen}, | |
} | |
@MastersThesis{SIMAO2005, | |
author = {Simão, Manuel}, | |
title = {{Hipertensão arterial e fatores de risco associados: estudo entre universitários da cidade de Lubango-Angola}}, | |
school = {USP}, | |
year = {2005}, | |
note = { http://www.teses.usp.br/teses/disponiveis/22/22132/tde-13092005-105607} | |
} | |
@article{SOUZA2005, | |
title = {{Prevalência de hipertensão arterial e fatores de risco associados em trabalhadores de uma instituição de ensino superior}}, | |
journal = {{Revista da AMRIGS}}, | |
author={Souza, Jonny Arruda AND Zanettini, Luis Felipe Snell AND Zanettini, Marco Tulio AND Boldo, Rodrigo AND Moraes, Renan Stoll}, | |
language = {pt}, | |
url = { http://www.amrigs.com.br/revista/49-04/ao01.PDF}, | |
volume = {49}, | |
year = {2005}, | |
pages = {226 - 232}, | |
publisher = {amrigs}, | |
} | |
@article{ZAITUNE2006, | |
title = {{Hipertensão arterial em idosos: prevalência, fatores associados e práticas de controle no Município de Campinas, São Paulo, Brasil}}, | |
journal = {{Cadernos de Sa\'ude P\'ublica}}, | |
author={Zaitune, Maria Paula do Amaral AND Barros, Marilisa Berti de Azevedo AND C\'esar, Chester Luiz Galv\~ao AND Carandina, Luana AND Goldbaum, Mois\'es }, | |
ISSN = {0102-311X}, | |
language = {pt}, | |
url = {http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-311X2006000200006&nrm=iso}, | |
volume = {22}, | |
year = {2006}, | |
month = {02}, | |
pages = {285 - 294}, | |
publisher = {scielo}, | |
} | |
@article{KRAUSE2007, | |
author = {Krause, Maressa Priscila AND Hallage, Tatiane AND Miculis, Cristiane Petra AND Santos, Elisa Cesar Ribeiro dos AND Buzzachera, Cosme Franklin AND Silva, Sergio Gregorio da} | |
title = {{Associação entre a adiposidade corporal e a aptidão cárdio-respiratória em mulheres idosas}}, | |
language = {pt}, | |
url = {http://www.efdeportes.com/efd110/adiposidade-corporal-e-a-aptidao-cardio-respiratoria-em-mulheres-idosas.htm}, | |
publisher= {Revista Digital - Buenos Aires - Año 12 - N° 110} | |
year = {2007}, | |
month = {07}, | |
} | |
@book{SOARES1991, | |
author = {Soares, José Francisco AND Farias, Alfredo Alves de AND Cesar, Cibele Comini}, | |
title = {{Introdução a Estatística}}, | |
note = {}, | |
pages = {234 - 245}, | |
publisher = {Editora Guanabara Koogan}, | |
address = {Rio de Janeiro}, | |
year = {1991}, | |
} | |
@book{SOARES1983, | |
author = {Soares, José Francisco AND Bartan, Flávio Celso}, | |
title = {{Métodos Estatísticos em Medicina e Biologia}}, | |
journal = {{14º Colóquio Brasileiro de Matemática}} | |
note = {Poços de Caldas de 14 a 22 de Jul de 1983}, | |
pages = {20 - 27 ; 81 - 108}, | |
publisher = {Instituto de Matemática Pura e Aplicada do CNPq}, | |
address = {Rio de Janeiro}, | |
year = {1983}, | |
} | |
@book{COSTANETO1977, | |
author = {Costa Neto, Pedro Luís de Oliveira}, | |
title = {Estatística}, | |
note = {14ª reimpressão}, | |
pages = {39 - 45}, | |
publisher = {Editora Edgard Blücher}, | |
address = {São Paulo}, | |
year = {1991}, | |
} | |
@book{PAULA2004, | |
author = {Paula, Gilberto A}, | |
title = {{Modelos de Regressão com Apoio Computacional}}, | |
note = {www.ime.usp.br/~giapaula}, | |
pages = {100 - 143}, | |
publisher = {Universidade de São Paulo}, | |
address = {São Paulo}, | |
year = {2004}, | |
} | |
@article{LUNAFILHO1998, | |
title = {{Seq\"u\^encia b\'asica na elabora\c{c}\~ao de protocolos de pesquisa}}, | |
journal = {{Arquivos Brasileiros de Cardiologia}}, | |
author={Luna Filho, Br\'aulio}, | |
ISSN = {0066-782X}, | |
language = {pt}, | |
URL = {http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0066-782X1998001200001&nrm=iso}, | |
volume = {71}, | |
year = {1998}, | |
month = {12}, | |
pages = {735 - 740}, | |
publisher = {scielo}, | |
} | |
@unpublished{GIOLO2006, | |
author = {Giolo, Suely Ruiz}, | |
title = {Análise de Dados Categóricos}, | |
note = {notas de aula para o Curso de Estatística da UFPR}, | |
address = {Curitiba}, | |
year = {2006}, | |
} | |
@unpublished{GIOLO2007, | |
author = {Giolo, Suely Ruiz}, | |
title = {Análise de Regressão}, | |
note = {Notas de aula para o Curso de Estatística da UFPR}, | |
pages = {}, | |
address = {Curitiba}, | |
year = {2007}, | |
} | |
@Manual{GIOLO2004, | |
author = {Giolo, Suely Ruiz}, | |
title = {{Análise de Regressão}}, | |
note = {Apostila e Notas de Aula}, | |
pages = {}, | |
publisher = {UFPR}, | |
address = {Curitiba}, | |
year = {2004}, | |
} | |
@Manual{OGLIARI2007, | |
author = {Ogliari, Paulo José}, | |
title = {Regressão Logística}, | |
note = {Curso On-Line - http://www.inf.ufsc.br/~ogliari/cursoderegressao.html}, | |
pages = {}, | |
publisher = {UFSC}, | |
address = {Curitiba}, | |
year = {2007}, | |
} | |
@Manual{ANSELMO2006, | |
author = {Chaves Neto, Anselmo}, | |
title = {{Análise Multivariada II}}, | |
note = {Apostila e Notas de Aula}, | |
pages = {}, | |
publisher = {UFPR}, | |
address = {Curitiba}, | |
year = {2006}, | |
} | |
</bibtex> | |
===== Modelos para Redação do TCC ===== |