RDay-2018 - UFPR, 22 de Maio de 2018

História do R:

Uma visão pessoal

De onde viemos …

  • Recursos computacionais em estatística, uma longa história
  • Pulando para décadas de 80/90:
  • Proliferação dos PC's
  • Inicialmente linguagens (pp Fortran e C) e poucos softwares
  • Usual softwares comerciais, licenças/cópias pagas
  • Maioria para sistema operacional específico
  • Poucas alternativas gratuitas
  • Ainda menos em código aberto

Uma nova linguagem

  • Linguagem S (J. Chambers, Bell Labs)
  • A trilogia da linguagem em livros
  • S-Plus se estabelece
  • 90's: Emergência e maior abrangência de Linux e da filosofia de software livre

E de onde veio o R

  • de S para R: Sistema de Ross Ihaka e Robert Gentleman (94, Un. Auckland)
  • Inspirado por S (aparência) e Scheme (semântica)
  • mid 1997: Composição do R Core Team
  • Muitas dúvidas, incertezas e suspeitas
  • A estratégia de Ripley & Venables
  • Recursos: página, pacotes, listas, etc, etc, etc
  • e mais recursos foram surgindo
  • R-1.0.0 em 29 de Fevereiro de 2000
  • de algumas (poucas) dezenas de pacotes (entre eles a geoR) a 12585 (ontem, 21/05/2018)
  • Evolução, abrangência e adoção com crescimentos exponenciais

E hoje?

  • R é atualmente patrimônio "cultural" da comunidade estatística/científica
  • "lingua franca" da estatística
  • Da suspeição à integração
  • Transcende a comunidade estatística
  • Patrimônio da comunidade científica

Sempre bom lembrar:

R-FAQ:

2.1 What is R?

R is a system for statistical computation and graphics. It consists of a language plus a run-time environment with graphics, a debugger, access to certain system functions, and the ability to run programs stored in script files.

Uma visão pessoal

De onde vim…

  • Interesse por computação (UFLA e ESALQ)
  • UFPR: LABEST e necessidade de software para estatística
  • Programas comerciais e gratuitos no LABEST
  • Uso de servidores diversos e LINUX
  • Linux para internet/email/páginas
  • "Gap" de acesso a recursos computacionais

E para onde fui…

  • 97: Lancaster/UK: Unix e S-Plus
  • Estatística espacial, geoS (geoR) e necessidade/limitações de processamento
  • Mudanças em Lancaster: Unix –> Linux, S-Plus –> R
  • Não sem resistência!
  • gradativamente: cada vez mais linux e R
  • [Uma publicação: Review no ISBA-Bulletin] (http://www.mi.imati.cnr.it/isba/0103.html)
  • Arquivo da publicação
  • Diversas oportunidades de interação com elementos da comunidade
  • das DSC's às useR!

E aqui estamos

  • 2002: Retorno ao Brasil
  • Alguns usuários de S-Plus, poucos de R
  • Artigo do Prof. Francisco Cribari & Zargos
  • Surgimento da lista do R (R-STAT)
  • Retorno à UFPR: cursos e disciplinas
  • Mudança de cultura e oportunidade
  • Uma oportunidade marcante: o curso para Embrapa
  • Diversas oportunidades de cursos
  • Formação de alunos e um encontro talvez não casual
  • R-br
  • Filosofia: Disponibilização de conteúdos

… e a história continua

  • Adoção no curso de estatística da UFPR
  • Linguagem corrente
  • Ainda ensinamos R …
  • … mas cada vez mais aprendemos
  • adoção em outros cursos (grad. e pós) e programas
  • ainda há espaço para melhorar comunicação

Porque software livre?

Software Livre

  • Liberdade para usar
  • Liberdade para estudar e adaptar
  • Liberdade para alterar e melhorar
  • Liberdade para distribuir

OBS: software livre é diferente de domínio público

Software Livre (cont)

Considerações computacionais:

  • auditibilidade
  • desenvolvimento
  • integração
  • qualidade
  • reprodutibilidade
  • segurança

Software Livre (cont)

Considerações sobre filosofia de uso de SL

  • questão macroeconômica
  • autonomia tecnológica
  • (liberdade de) conhecimento e propriedade
  • financiamento
  • uso em orgãos públicos
  • independência de fornecedores

Software Livre (cont)

Sob recursos limitados ((quase) sempre são)

Investir em licenças ou em pessoas?

R é uma linguagem

Linguagem

  • Resgatando habilidades de programação
  • Modificando a forma de ver e interagir com recursos computacionais
  • Vantagens de linguagem interpretada
  • Integração com outras linguagens (inclusive compiladas)

"R"evolução no ensino e acesso à estatística

Ensino

  • Profundas implicações em ensino
  • Capacitação flexível para mercado
  • Estimulando criatividade
  • Participação eventos/troca de informações etc
  • De observadores passivos a protagonistas
  • Trabalhos de alunos de graduação
  • Exemplos UFPR
  • Programming is the best way to debug your ideas (Venables & Ripley)

"Equilibrando o jogo""

Liberté, Égualité, Fraternité

  • Acesso a usuários/comunidades com diferentes acesso à recursos
  • Pensamento do R Core Team desde o início
  • Maiores e melhores possibilidades para educação e pesquisa estatística
  • Toda estatística tem de ir aonde o povo está!

Pesquisa reproduzível

Reprodutibilidade

  • "Reproducible research" se tornou um "hot topic"
  • Transparência e validade científica
  • Auditibilidade, revisão
  • Evolução mais rápida e efetiva
  • Sweave, knitr, rmarkdown, etc
  • em especial integrações com LaTeX

Porque é alta e facilmente integrável

Integração

  • Com outros aplicativos
    • "cada macaco no seu galho" (ex: caso aRT)
  • Com sistemas gerenciadores de bancos de dados (SGBD)
  • aplicativos Web
  • Visualizações diversas
  • Como módulos em softwares/sistemas de outras áreas (ex. Sistema Embrapa, Monitoramento doenças)
  • Mesmo com outros softwares estatísticos!

R, estatística e ciência

O que é mesmo o R?

  • Grande laboratório de idéias e implementações
  • Por vezes com várias implementações de uma mesma idéia
  • A diversidade é uma "vantagem biológica"

Uma frase favorita

This is R. There is no if. Only how (Simon Blomberg)