Walmes Marques Zeviani


Laboratory of Statistics and Geoinformation
Department of Statistics
Federal University of Paraná
"Those who know, do. Those that understand, teach."
― Aristotle

Welcome!

I am associate professor at Department of Statistics at Federal University of Paraná (UFPR, 2010 - today). I lecture Computational Statistics regularly at Bachelor in Statistics and several topics at Data Science & Big Data Specialization. I also teach Elementary Statistics and Applied Statistics, related to the data analysis, frequently.

I finished my PhD in Statistics and Agricultural Experimentation at UFLA in 2013, after finishing my MSc in the same program in 2009. I graduated in Agronomy at UFGD in 2007.

My major competencies are design and analysis of experiments, nonlinear regression and regression models for count data. I have special interest in data visualization, web scraping, text mining and machine learning.

I am tutor of the Tutorial Education Program on the Bachelor in Statistics (2015 - today). The program provides scholarship for 12 students to develop Education, Research and Extension activities.

I participate as organizer of the Data Science Curitiba MeetUp. Our mettings discuss tendencies, technologies and case studies from an applied and academic point of view.

I am a R programmer and data lover. Because of that, I have experience with R language and I am frequently invited to give short courses related to the subject.

Expertises

  • Design and analysis of experiments
  • Nonlinear regression
  • Count data regression
  • Data visualization

Interests

  • Data manipulation and visualization
  • Text mining and analytics
  • Web scraping
  • Reproducible research

Education

  • PhD in Statistics and Agricultural Experimentation (2010 - 2013)

    Universidade Federal de Lavras

  • MSc in Statistics and Agricultural Experimentation (2008 - 2009)

    Universidade Federal de Lavras

  • BSc in Agronomy (2003 - 2007)

    Universidade Federal da Grande Dourados

Skills

R
Shell & Git
HTML/CSS & LaTeX
Emacs
LISP
Python
C/C++
SQL

Upcoming Talks, Courses and Activities

2019

  1. DONE Estudos epidemiológicos visando a avaliação e o controle de manchas foliares em macieira
    • Coorientador e membro da banca de defesa de mestrado de Camilla Castellar
    • Programa de Pós-Graduação em Agronomia/Produção Vegetal - UFPR
    • Campus I · UFPR - Curitiba/PR
    • 21/Fev/2019 às 08h30
  2. DONE Manipulação de dados com a abordagem tidyverse
  3. DONE Engenharia de características: novas perspectivas para uso dos dados
    • Conferência
    • Workshop em Data Science · Departamento de Estatística - UFLA
    • Lavras/MG
    • 13 a 15/Mar/2019
    • Grande parte do esforço e do sucesso em data science, tanto em modelagem estatística quanto em machine learning, depende de uma adequada representação das características. A engenharia de características é um processo que depende principalmente da habilidade do cientista de dados em identificar, curar, construir e descobrir características dos dados relevantes para interpretação e/ou modelagem preditiva. Nessa palestra serão vistas as principais etapas dentro do processo de engenharia de características, desde a inspeção inicial, passando por questões de visualização, transformação e além. Com tais noções, o cientista de dados terá a habilidade de conhecer novas perspectivas sobre os dados, aprimorando o conhecimento trazido por estes e aumentando adequação dos métodos de análise para alcançar melhores resultados.
  4. DONE Visualização de dados: fundamentos e aplicações com R
    • Minicurso (4h)
    • Workshop em Data Science · Departamento de Estatística - UFLA
    • Lavras/MG
    • 13 a 15/Mar/2019
    • A visualização permite rápida extração de insights de problemas baseados em dados. É a língua nativa para comunicação de padrões, tendências e fatos dos dados para humanos e entre humanos. Inúmeros softwares e planilhas eletrônicas oferecem recursos para confecção de gráficos. Ainda que haja tal disponibilidade, são vistos com frequência representações de má qualidade no âmbito profissional e acadêmico. Dessa forma, o conhecimento dos princípios de visualização gráfica e o domínio de recursos computacionais para elaboração ágil, interativa e reproduzível são fundamentais para obter visualizações que comuniquem valor de forma descomplicada em todos os aspectos: elaboração, leitura e interpretação. Nesse minicurso serão discutidos fundamentos da visualização de dados e sua aplicação no ambiente R. A ênfase desse curso será instrumentar o uso coordenado de pacotes e funções do R e também desenvolver massa crítica para construção e julgamento de representações gráficas de dados.
  5. DONE Manipulação e visualização de dados com R: a abordagem tidyverse
    • Curso (20h)
    • Grupo de Estudos em Genética e Melhoramento de Plantas - UFV
    • Viçosa/MG
    • 18 a 22/Mar/2019 (previsto)
    • leg.ufpr.br/~walmes/cursoR/data-vis/
    • A maior parte do esforço na análise de dados está na manipulação dos dados: leitura, preparo, higienização, imputação, construção, seleção, agregação, síntese e visualização. O ambiente R como linguagem de programação para computação estatística sempre teve recursos para manipulação de dados. A recente abordagem tidyverse, no entanto, se baseia em uma gramática clara para a manipulação de dados, o que reduz o tempo de confecção e entendimento de instruções de código, tornando-o mais portável e reproduzível. Em muito aspectos, pode inclusive ter melhor performance computacional. Nesse minicurso, serão abordados os elementos da abordagem tidyverse, seus principais recursos para manipulação e visualização de dados. Exemplos baseados em conjuntos de dados reais e scripts R serão disponibilizados.
  6. 1o Encontro de Data Science (nome provisório)
  7. II R Day - Encontro Nacional de Usuários do R
  8. 64a RBras e 18o SEAGRO
    • Participante
    • www.rbras64.com.br
    • Departamento de Estatística · UFMT
    • Centro de Eventos do Pantanal - Cuiabá/MT
    • 29/Jul a 02/Ago/2019
  1. DONE Aspectos epidemiológicos da ferrugem da ameixeira (Tranzschelia discolor).
    • Banca de qualificação da Glória Soriano Vidal
    • Programa de Pós-Graduação em Produção Vegetal - UFPR
    • Campus I · UFPR - Curitiba/PR
    • 02/Ago/2018 às 14h00
  2. DONE Visualização de dados com ggplot2.
    • Curso
    • Núcleo de Estudos em Genética e Melhoramento de Plantas - UFLA
    • Lavras/MG
    • 07-09/Ago/2018
  3. DONE Visualização de dados: fundamentos, precauções e tendências.
    • Palestra
    • Programa de Pós Graduação em Engenharia Florestal - UFPR
    • Curitiba/PR
    • 24/Ago/2018 às 14h00
  4. DONE Uma aplicação Shiny para aplicação de modelos lineares generalizados.
    • Banca de defesa do Cayan Atreio Portela Bárcena Saavedra
    • Programa de Pós-Graduação em Estatística e Experimentação Agrônomica - Esalq/USP
    • Departamento de Ciências Exatas · Esalq/USP - Piracicaba/SP
    • 01/Out/2018 às 08h00 (videoconferência de Curitiba)
  5. DONE Hackathon Nasa Space Apps 2018.
  6. DONE Machine Learning e Estatística: rivais, redundantes ou complementares?.
  7. DONE Alternative approaches to the analysis of multilevel experiments.
  8. DONE Modelos de regressão não linear: fundamentos e aplicações.
  9. DONE Registros de enfermagem no cuidado a pacientes com deterioração clínica: estudo de influência de algoritmo de inteligência artificial.
    • Membro de banca de qualificação da Maria Luiza de Medeiros Amaro (Orientadora: Professora Dra. Luciana Schleder Gonçalves)
    • Programa de Pós-Graduação em Enfermagem - UFPR
    • Campus Jardim Botânico · UFPR - Curitiba/PR
    • 27/Nov/2018 às 14h00