2019-03-28
Análise de texto é sobre extrair informação.
Text mining é o processo de analisar um texto desestruturado, extrair informação relevante e transformá-la em estruturada de forma que possa ser aproveitada de diversas formas (Hurwitz et al. 2016).
The practice of text mining is aimed at undestanding and applying insights from the most complex analytical processing system in the universe - the human brain - to the analysis of written language.
Nota fiscal | Notícia | Tweet |
---|---|---|
pré estrutura | organização | coloquial e curto |
números e campos | língua formal | abreviações e hashtags |
Mais em list of text mining software.
Text mining | Web scraping | Outros |
---|---|---|
tm | XML | d3Network |
Rweka | rvest | leafletR |
SnowballC | RCurl | googleVis |
wordcloud | jsonlite | lattice |
topicmodels | latticeExtra | |
RTextTools | Rfacebook | ggplot2 |
lsa | Rlinkedin | |
openNPL | ||
koRpus | ||
tidytext |
Como extrair ou consumir dados da Web?
Hurwitz, J., A. Nugent, F. Dr. Halper, and M. Kaufman. 2016. Big Data Para Leigos: ALTA BOOKS.