Talks

Visualização de dados

Fundamentos, precauções e tendências

Alunos de Pós Graduação em Engenharia Florestal UFPR
24 de Agosto de 2018
Biofix, Campus Jardim Botânico, UFPR · Curitiba/PR

Visualização de dados é um importante aspecto na análise de dados. Com a era do Big Data, a visualização de dados toma ainda maior relevância tornando-se uma linguagem para compreensão dos dados e comunicação dos resultados, usada para rapidamente reagir a informação exposta pelos dados. Nesse seminário é discutida a importância da visualização de dados, abordado aspectos da sua história e discutidas as principais tendências. Da metade em diante, aspectos fundamentos da visualização efetiva são comentados, bem como feitas recomendações e precauções sobre o uso correto de gráficos. O landscape de recursos gráficos do R é apresentado.

Planejamento e análise de experimentos

Uma visão panorâmica

Alunos de Pós Graduação da UFPR
11 de Julho de 2018
Auditório Ulysses de Campus, Setor de Ciências Sociais, UFPR · Curitiba/PR

A primeiras contribuições para a área de planejamento e análise de experimentos foram de Ronald A. Fisher a quase de um século atrás. Desde então, a área de planejamento de experimentos tem evoluído e hoje é determinante para o avanço da pesquisa em todas as Ciências. Apesar da exigência e ampla adoção dos experimentos planejados, a incorreta comprensão ou emprego dos princípios fundamentais pode comprometer os resultados de pesquisas onerosas. Neste seminário são discutidos os princípios fundamentais de planejamentos experimentais, apresentada a terminologia, introduzido os experimentos fatoriais e feitas recomendações para os praticantes.

Machine Leaning e Estatística

Rivais, redundantes ou complementares?

MeetUp de Data Science Curitiba
24 de Abril de 2018
MadeiraMadeira, Curitiba/PR

No passado, todas as profissões e negócios correram para incorporar o uso dos computadores. Hoje o mesmo acontece com os dados. Projetos de data science ou big data são intensivos quanto o consumo de dados. Esse cenário popularizou o uso de Machine Learning e também de Estatística para solução de problemas envolvendo dados. Com isso, comparações entre Machine Learning são realizadas com frequência mas, no geral, as declarações são tendenciosas ou sem estabelecimento de critérios claros. Um entendimento incorreto das diferenças fatuais ou comunalidades pode levar rapidamente a falsos julgamentos, péssimas escolhas e conclusões ruins. Nesta conferência são abordadas as ideias fundamentais de Machine Learning e Estatística voltados para análise de dados bem como são apresentados e delimitados os território dos diferentes tipos de data analytics e como Machine Learning e Estatística estão localizados nesse espaço.

Mineração de texto

Conceitos e aplicações

MeetUp de Data Science Curitiba
06 de Fevereiro de 2018
Jupter

Hoje a informação em forma de texto não é apenas abundante mas é facilmente acessível. Estima-se que 80% da informação disponível no mundo está armazenada na forma de texto livre. Text mining e text analytics são termos amplos que descrevem tecnologias para processar e analisar texto semiestruturado ou não estruturado. Na perspectiva de MINER et al. (2012), essas tecnologias podem ser agrupadas em sete áreas práticas. Tais tecnologias lidam com uma quantidade massiva de dados não estruturados e requerem alto poder de processamento computacional. Dessa forma, para aplicações de negócios, a mineração de texto deve ser baseada em ecossistemas de big data. Por outro lado, os problemas de mineração de texto são sempre peculiares em algum sentido, apesar das divisões conceituais ou didáticas. Dessa forma, decidir quais e como aplicar os recursos dispoíveis pode não ser uma tarefa simples. Nesta apresentação serão apresentados os principais conceitos e aplicações de mineração de texto comuns em data science. Serão apontados recursos computacionais voltados para processamento de texto e será apresentado um estudo de caso considerando a linguagem R.