Walmes Marques Zeviani


Laboratory of Statistics and Geoinformation
Department of Statistics
Federal University of Paraná
"Those who know, do. Those that understand, teach."
― Aristotle

Welcome!

I am associate professor at Department of Statistics at Federal University of Paraná (UFPR, 2010 - today). I lecture Computational Statistics regularly at Bachelor in Statistics and several topics at Data Science & Big Data Specialization. I also teach Elementary Statistics and Applied Statistics, related to the data analysis, frequently.

I finished my PhD in Statistics and Agricultural Experimentation at UFLA in 2013, after finishing my MSc in the same program in 2009. I graduated in Agronomy at UFGD in 2007.

My major competencies are design and analysis of experiments, nonlinear regression and regression models for count data. I have special interest in data visualization, web scraping, text mining and machine learning.

I am tutor of the Tutorial Education Program on the Bachelor in Statistics (2015 - today). The program provides scholarship for 12 students to develop Education, Research and Extension activities.

I participate as organizer of the Data Science Curitiba MeetUp. Our mettings discuss tendencies, technologies and case studies from an applied and academic point of view.

I am a R programmer and data lover. Because of that, I have experience with R language and I am frequently invited to give short courses related to the subject.

Expertises

  • Design and analysis of experiments
  • Data visualization
  • Nonlinear regression
  • Count data regression

Interests

  • Data manipulation and visualization
  • Web scraping
  • Reproducible research
  • Text mining and analytics

Education

  • PhD in Statistics and Agricultural Experimentation (2010 - 2013)

    Universidade Federal de Lavras

  • MSc in Statistics and Agricultural Experimentation (2008 - 2009)

    Universidade Federal de Lavras

  • BSc in Agronomy (2003 - 2007)

    Universidade Federal da Grande Dourados

Skills

R
Emacs & LISP
Shell & Git
HTML/CSS & LaTeX
Python
C/C++
SQL

Manual de Planejamento e Análise de Experimentos com R

This material is a free and open access bookdown document that is under continuously construction.

The intent of it is to cover the procedures to design and analyse experiments with R. The main features are:

  • commented and reproducible code,
  • data visualization to explore and communicate results,
  • illustrations of experimental designs,
  • and didatic and real datasets available.

Please, feel free to use this material, report bugs or mistakes, suggest improvements, send data or requests chapters.


Upcoming Talks, Courses and Activities

2019

  1. DONE Estudos epidemiológicos visando a avaliação e o controle de manchas foliares em macieira
    • Coorientador e membro da banca de defesa de mestrado de Camilla Castellar
    • Programa de Pós-Graduação em Agronomia/Produção Vegetal - UFPR
    • Campus I · UFPR - Curitiba/PR
    • 21/Fev/2019 às 08h30
  2. DONE Manipulação de dados com a abordagem tidyverse
  3. DONE Engenharia de características: novas perspectivas para uso dos dados
    • Conferência
    • Workshop em Data Science · Departamento de Estatística - UFLA
    • Lavras/MG
    • 13 a 15/Mar/2019
    • Grande parte do esforço e do sucesso em data science, tanto em modelagem estatística quanto em machine learning, depende de uma adequada representação das características. A engenharia de características é um processo que depende principalmente da habilidade do cientista de dados em identificar, curar, construir e descobrir características dos dados relevantes para interpretação e/ou modelagem preditiva. Nessa palestra serão vistas as principais etapas dentro do processo de engenharia de características, desde a inspeção inicial, passando por questões de visualização, transformação e além. Com tais noções, o cientista de dados terá a habilidade de conhecer novas perspectivas sobre os dados, aprimorando o conhecimento trazido por estes e aumentando adequação dos métodos de análise para alcançar melhores resultados.
  4. DONE Visualização de dados: fundamentos e aplicações com R
    • Minicurso (4h)
    • Workshop em Data Science · Departamento de Estatística - UFLA
    • Lavras/MG
    • 13 a 15/Mar/2019
    • A visualização permite rápida extração de insights de problemas baseados em dados. É a língua nativa para comunicação de padrões, tendências e fatos dos dados para humanos e entre humanos. Inúmeros softwares e planilhas eletrônicas oferecem recursos para confecção de gráficos. Ainda que haja tal disponibilidade, são vistos com frequência representações de má qualidade no âmbito profissional e acadêmico. Dessa forma, o conhecimento dos princípios de visualização gráfica e o domínio de recursos computacionais para elaboração ágil, interativa e reproduzível são fundamentais para obter visualizações que comuniquem valor de forma descomplicada em todos os aspectos: elaboração, leitura e interpretação. Nesse minicurso serão discutidos fundamentos da visualização de dados e sua aplicação no ambiente R. A ênfase desse curso será instrumentar o uso coordenado de pacotes e funções do R e também desenvolver massa crítica para construção e julgamento de representações gráficas de dados.
  5. DONE Manipulação e visualização de dados com R: a abordagem tidyverse
    • Curso (20h)
    • Grupo de Estudos em Genética e Melhoramento de Plantas - UFV
    • Viçosa/MG
    • 18 a 22/Mar/2019
    • leg.ufpr.br/~walmes/cursoR/data-vis/
    • A maior parte do esforço na análise de dados está na manipulação dos dados: leitura, preparo, higienização, imputação, construção, seleção, agregação, síntese e visualização. O ambiente R como linguagem de programação para computação estatística sempre teve recursos para manipulação de dados. A recente abordagem tidyverse, no entanto, se baseia em uma gramática clara para a manipulação de dados, o que reduz o tempo de confecção e entendimento de instruções de código, tornando-o mais portável e reproduzível. Em muito aspectos, pode inclusive ter melhor performance computacional. Nesse minicurso, serão abordados os elementos da abordagem tidyverse, seus principais recursos para manipulação e visualização de dados. Exemplos baseados em conjuntos de dados reais e scripts R serão disponibilizados.
  6. DONE Importância, tendências e competências em visualização de dados
  7. DONE Data Science, Big Data e Inovação
  8. DONE 1o Encontro de Data Science & Big Data
  9. DONE R para Ciência de Dados: um curso introdutório
  10. Uso da linguagem R para análise de dados de inventário florestal
    • Conferência (40 min)
    • Workshop Inventário e Mensuração · Apre
    • Auditório da Emater · Rua da Bandeira, 500, Cabral · Curitiba/PR
    • 14:00 · 25/Out/2019
  11. DSS19 · Data Science Summit 2019
  12. II R Day - Encontro Nacional de Usuários do R
  1. DONE Aspectos epidemiológicos da ferrugem da ameixeira (Tranzschelia discolor).
    • Banca de qualificação da Glória Soriano Vidal
    • Programa de Pós-Graduação em Produção Vegetal - UFPR
    • Campus I · UFPR - Curitiba/PR
    • 02/Ago/2018 às 14h00
  2. DONE Visualização de dados com ggplot2.
    • Curso
    • Núcleo de Estudos em Genética e Melhoramento de Plantas - UFLA
    • Lavras/MG
    • 07-09/Ago/2018
  3. DONE Visualização de dados: fundamentos, precauções e tendências.
    • Palestra
    • Programa de Pós Graduação em Engenharia Florestal - UFPR
    • Curitiba/PR
    • 24/Ago/2018 às 14h00
  4. DONE Uma aplicação Shiny para aplicação de modelos lineares generalizados.
    • Banca de defesa do Cayan Atreio Portela Bárcena Saavedra
    • Programa de Pós-Graduação em Estatística e Experimentação Agrônomica - Esalq/USP
    • Departamento de Ciências Exatas · Esalq/USP - Piracicaba/SP
    • 01/Out/2018 às 08h00 (videoconferência de Curitiba)
  5. DONE Hackathon Nasa Space Apps 2018.
  6. DONE Machine Learning e Estatística: rivais, redundantes ou complementares?.
  7. DONE Alternative approaches to the analysis of multilevel experiments.
  8. DONE Modelos de regressão não linear: fundamentos e aplicações.
  9. DONE Registros de enfermagem no cuidado a pacientes com deterioração clínica: estudo de influência de algoritmo de inteligência artificial.
    • Membro de banca de qualificação da Maria Luiza de Medeiros Amaro (Orientadora: Professora Dra. Luciana Schleder Gonçalves)
    • Programa de Pós-Graduação em Enfermagem - UFPR
    • Campus Jardim Botânico · UFPR - Curitiba/PR
    • 27/Nov/2018 às 14h00