Walmes Marques Zeviani


Laboratory of Statistics and Geoinformation
Department of Statistics
Federal University of Paraná
"Those who know, do. Those that understand, teach."
― Aristotle

Welcome!

I am associate professor at Department of Statistics at Federal University of Paraná (UFPR, 2010 - today). I lecture Computational Statistics regularly at Bachelor in Statistics and several topics at Data Science & Big Data Specialization. I also teach Elementary Statistics and Applied Statistics, related to the data analysis, frequently.

I finished my PhD in Statistics and Agricultural Experimentation at UFLA in 2013, after finishing my MSc in the same program in 2009. I graduated in Agronomy at UFGD in 2007.

My major competencies are design and analysis of experiments, nonlinear regression and regression models for count data. I have special interest in data visualization, web scraping, text mining and machine learning.

I am tutor of the Tutorial Education Program on the Bachelor in Statistics (2015 - today). The program provides scholarship for 12 students to develop Education, Research and Extension activities.

I participate as organizer of the Data Science Curitiba MeetUp. Our mettings discuss tendencies, technologies and case studies from an applied and academic point of view.

I am a R programmer and data lover. Because of that, I have experience with R language and I am frequently invited to give short courses related to the subject.

Expertises

  • Design and analysis of experiments
  • Data visualization
  • Nonlinear regression
  • Count data regression

Interests

  • Data manipulation and visualization
  • Web scraping
  • Reproducible research
  • Text mining and analytics

Education

  • PhD in Statistics and Agricultural Experimentation (2010 - 2013)

    Universidade Federal de Lavras

  • MSc in Statistics and Agricultural Experimentation (2008 - 2009)

    Universidade Federal de Lavras

  • BSc in Agronomy (2003 - 2007)

    Universidade Federal da Grande Dourados

Skills

R
Emacs & LISP
Shell & Git
HTML/CSS & LaTeX
Python
C/C++
SQL

Manual de Planejamento e Análise de Experimentos com R

This material is a free and open access bookdown document that is under continuously construction.

The intent of it is to cover the procedures to design and analyse experiments with R. The main features are:

  • commented and reproducible code,
  • data visualization to explore and communicate results,
  • illustrations of experimental designs,
  • and didatic and real datasets available.

Please, feel free to use this material, report bugs or mistakes, suggest improvements, send data or requests chapters.


Upcoming Talks, Courses and Activities

2020

  1. DONE Statistical Techniques Applied to Forest Biometrics
  2. DONE Smart&Green: um Framework da Internet das Coisas para a Agricultura Inteligente
  3. DONE I CiDWeek · I Semana de Ciência de Dados do CiDAMO
    • Conferencista
    • CiDAMO · Grupo de Ciência de Dados, Aprendizagem de Máquina, e Otimização
    • Centro Politécnico UFPR - Curitiba/PR
    • 03 a 07/Fev/2020 · 9h - 18h
    • cidamo.com.br/CiDWeek
  4. DONE Planejamento e Análise de Experimentos com R
    • Minicurso (15h)
    • Programa de Pós Graduação em Ciência do Solo · Esalq/USP
    • Piracicaba/SP
    • 19 a 21/Fev/2020
    • Conhecimento sobre Planejamento e Análise de Experimentos são centrais para pesquisadores de todas as áreas da Ciência. Apesar de ser um campo da Estatística bastante desenvolvido, a aplicação dos métodos estatísticos pela comunidade cientifica ainda restringe-se muito ao conteúdo abordado nos livros de estatística experimental que tratam predominantemente dos experimentos balanceados com resposta Gaussiana. Na prática ocorrem muitas situações em que a suposição normalidade não é atendida, ocorrem perda de parcelas ou até celas experimetais, ou ainda em que há necessidade de se usar modelos não lineares, de acomodar não independência entre observações ou termos de efeito aleatório. O software e linguagem R para computação estatística dispõe de inúmeros recursos, tradicionais e contemporâneos, que auxiliam a realização da análise de dados experimentais de forma auditável e reproduzível. A ênfase deste curso será no uso coordenado de pacotes e funções para a realização de análise de experimentos. Além da instrumentação em linguagem R, o curso irá revisar e ampliar conceitos sobre planejamento e anáise de experimentos de forma a contribuir para o desenvolvimento de massa crítica para elaboração e apreciação de análise de dados experimentais.
  5. DONE Métodos para Classificação Automática dos Estados de Saúde de Colônias de Abelhas Apis mellifera
  6. DONE Introdução ao Planejamento e Análise de Experimentos com R
    • Minicurso (8h)
    • PPG em Engenharia de Teleinformática, PPG em Agronomia/Fitotecnia e PPG em Zootecnia · UFC
    • Fortaleza/CE
    • 03 a 05/Mar/2020
    • Conhecimento sobre Planejamento e Análise de Experimentos são centrais para pesquisadores de todas as áreas da Ciência. Apesar de ser um campo da Estatística bastante desenvolvido, a aplicação dos métodos estatísticos pela comunidade cientifica ainda restringe-se muito ao conteúdo abordado nos livros de estatística experimental que tratam predominantemente dos experimentos balanceados com resposta Gaussiana. Na prática ocorrem muitas situações em que a suposição normalidade não é atendida, ocorrem perda de parcelas ou até celas experimetais, ou ainda em que há necessidade de se usar modelos não lineares, de acomodar não independência entre observações ou termos de efeito aleatório. O software e linguagem R para computação estatística dispõe de inúmeros recursos, tradicionais e contemporâneos, que auxiliam a realização da análise de dados experimentais de forma auditável e reproduzível. A ênfase deste curso será no uso coordenado de pacotes e funções para a realização de análise de experimentos. Além da instrumentação em linguagem R, o curso irá revisar e ampliar conceitos sobre planejamento e anáise de experimentos de forma a contribuir para o desenvolvimento de massa crítica para elaboração e apreciação de análise de dados experimentais.
  7. Estatística e Machine Learning: uma avaliação comparativa com recomendações
    • Conferencista em Sessão Temática da 65a RBras
    • Universidade Federal de Santa Catarina
    • Florianópolis/SC
    • 20 a 22/Maio/2020
    • www.rbras65.com.br
    • A recente área de Data Science tem utilizado soluções, para problemas relacionados a dados, baseadas em métodos estatísticos bem como de machine learning. Não raramente, essas duas disciplinas são comparadas de forma tendenciosa ou vagamente criteriosa. Um entendimento incorreto das diferenças fatuais pode levar rapidamente a falsos julgamentos, péssimas escolhas e conclusões ruins tanto para o praticante quanto para o estudante em formação. Nessa palestra será apresentada uma divisão da análise de dados em 4 áreas e como Estatística e Machine Learning se distribuem nelas. Além de comentar sobre as escolas e tradições por de trás destas disciplinas, também serão feitas recomendações para o praticante de Data Science sobre como tirar o maior proveito prático de ambas.
  8. Principais Recursos no R para Análise de Experimentos
    • Webconferência (1h)
    • Programa de Pós Graduação em Estatística e Experimentação Agropecuária · UFLA
    • Lavras/MG
    • 28/Jul/2020 · 14h00
    • O R é amplamente utilizado para análise de experimentos porque possui recursos que permitem a análise para diversas situações: experimentos desbalanceados, com termos de efeito aleatório, com respostas compatíveis com distribuições da família exponencial, com respostas para análise de sobreviência, respostas multivariadas, que considerem preditores não lineares e semiparamétricos, etc. Nessa webconferência, serão listados os principais pacotes para análise de experimentos ágeis e com ampla cobertura de casos. Isso é importante para o praticante da análise de experimentos para fazer análises em menos tempo e utilizando recursos que sejam genéricos e adaptáveis. Alguns estudos de casos serão apresentados.
  9. 2o Encontro de Data Science & Big Data
  10. VI EpidemioBrasil · Workshop de Epidemiologia de Doenças de Plantas
    • Coordenador de Sessão Temática "Recursos Computacionais de Código Aberto para Epidemiologia"
    • Chapecó/SC
    • 02 e 03/Set/2020
    • epidemiobrasil.netlify.com
  11. XX Semana da Matemática e X Semana da Estatística

2019

  1. DONE Estudos epidemiológicos visando a avaliação e o controle de manchas foliares em macieira
    • Coorientador e membro da banca de defesa de mestrado de Camilla Castellar
    • Programa de Pós-Graduação em Agronomia/Produção Vegetal - UFPR
    • Campus I · UFPR - Curitiba/PR
    • 21/Fev/2019 às 08h30
  2. DONE Manipulação de dados com a abordagem tidyverse
  3. DONE Engenharia de características: novas perspectivas para uso dos dados
    • Conferência
    • Workshop em Data Science · Departamento de Estatística - UFLA
    • Lavras/MG
    • 13 a 15/Mar/2019
    • Grande parte do esforço e do sucesso em data science, tanto em modelagem estatística quanto em machine learning, depende de uma adequada representação das características. A engenharia de características é um processo que depende principalmente da habilidade do cientista de dados em identificar, curar, construir e descobrir características dos dados relevantes para interpretação e/ou modelagem preditiva. Nessa palestra serão vistas as principais etapas dentro do processo de engenharia de características, desde a inspeção inicial, passando por questões de visualização, transformação e além. Com tais noções, o cientista de dados terá a habilidade de conhecer novas perspectivas sobre os dados, aprimorando o conhecimento trazido por estes e aumentando adequação dos métodos de análise para alcançar melhores resultados.
  4. DONE Visualização de dados: fundamentos e aplicações com R
    • Minicurso (4h)
    • Workshop em Data Science · Departamento de Estatística - UFLA
    • Lavras/MG
    • 13 a 15/Mar/2019
    • A visualização permite rápida extração de insights de problemas baseados em dados. É a língua nativa para comunicação de padrões, tendências e fatos dos dados para humanos e entre humanos. Inúmeros softwares e planilhas eletrônicas oferecem recursos para confecção de gráficos. Ainda que haja tal disponibilidade, são vistos com frequência representações de má qualidade no âmbito profissional e acadêmico. Dessa forma, o conhecimento dos princípios de visualização gráfica e o domínio de recursos computacionais para elaboração ágil, interativa e reproduzível são fundamentais para obter visualizações que comuniquem valor de forma descomplicada em todos os aspectos: elaboração, leitura e interpretação. Nesse minicurso serão discutidos fundamentos da visualização de dados e sua aplicação no ambiente R. A ênfase desse curso será instrumentar o uso coordenado de pacotes e funções do R e também desenvolver massa crítica para construção e julgamento de representações gráficas de dados.
  5. DONE Manipulação e visualização de dados com R: a abordagem tidyverse
    • Curso (20h)
    • Grupo de Estudos em Genética e Melhoramento de Plantas - UFV
    • Viçosa/MG
    • 18 a 22/Mar/2019
    • leg.ufpr.br/~walmes/cursoR/data-vis/
    • A maior parte do esforço na análise de dados está na manipulação dos dados: leitura, preparo, higienização, imputação, construção, seleção, agregação, síntese e visualização. O ambiente R como linguagem de programação para computação estatística sempre teve recursos para manipulação de dados. A recente abordagem tidyverse, no entanto, se baseia em uma gramática clara para a manipulação de dados, o que reduz o tempo de confecção e entendimento de instruções de código, tornando-o mais portável e reproduzível. Em muito aspectos, pode inclusive ter melhor performance computacional. Nesse minicurso, serão abordados os elementos da abordagem tidyverse, seus principais recursos para manipulação e visualização de dados. Exemplos baseados em conjuntos de dados reais e scripts R serão disponibilizados.
  6. DONE Importância, tendências e competências em visualização de dados
  7. DONE Data Science, Big Data e Inovação
  8. DONE 1o Encontro de Data Science & Big Data
  9. DONE R para Ciência de Dados: um curso introdutório
  10. DONE Uso da linguagem R para análise de dados de inventário florestal
    • Conferência (40 min)
    • Workshop Inventário e Mensuração · Apre
    • Auditório da Emater · Rua da Bandeira, 500, Cabral · Curitiba/PR
    • 14:00 · 25/Out/2019
  11. DONE II R Day - Encontro Nacional de Usuários do R

2018

  1. DONE Aspectos epidemiológicos da ferrugem da ameixeira (Tranzschelia discolor).
    • Banca de qualificação da Glória Soriano Vidal
    • Programa de Pós-Graduação em Produção Vegetal - UFPR
    • Campus I · UFPR - Curitiba/PR
    • 02/Ago/2018 às 14h00
  2. DONE Visualização de dados com ggplot2.
    • Curso
    • Núcleo de Estudos em Genética e Melhoramento de Plantas - UFLA
    • Lavras/MG
    • 07-09/Ago/2018
  3. DONE Visualização de dados: fundamentos, precauções e tendências.
    • Palestra
    • Programa de Pós Graduação em Engenharia Florestal - UFPR
    • Curitiba/PR
    • 24/Ago/2018 às 14h00
  4. DONE Uma aplicação Shiny para aplicação de modelos lineares generalizados.
    • Banca de defesa do Cayan Atreio Portela Bárcena Saavedra
    • Programa de Pós-Graduação em Estatística e Experimentação Agrônomica - Esalq/USP
    • Departamento de Ciências Exatas · Esalq/USP - Piracicaba/SP
    • 01/Out/2018 às 08h00 (videoconferência de Curitiba)
  5. DONE Hackathon Nasa Space Apps 2018.
  6. DONE Machine Learning e Estatística: rivais, redundantes ou complementares?.
  7. DONE Alternative approaches to the analysis of multilevel experiments.
  8. DONE Modelos de regressão não linear: fundamentos e aplicações.
  9. DONE Registros de enfermagem no cuidado a pacientes com deterioração clínica: estudo de influência de algoritmo de inteligência artificial.
    • Membro de banca de qualificação da Maria Luiza de Medeiros Amaro (Orientadora: Professora Dra. Luciana Schleder Gonçalves)
    • Programa de Pós-Graduação em Enfermagem - UFPR
    • Campus Jardim Botânico · UFPR - Curitiba/PR
    • 27/Nov/2018 às 14h00