====== RStudio ferramenta didática ====== Essa página é destinada a coleção de funções R para auxílio no ensino de estatística com o editor RStudio. O objetivo principal é reunir aqui implementações empregando a função ''manipulate::manipulate()'' para fazer gráficos interativos. Em segundo plano ficam dicas de como otimizar o uso desse editor. Lista de implementações a fazer: * Gráfico de densidade de probabilidade com controle nos parâmetros; * Histograma com controle no número de classes, intervalo de classe e tipo de frequência; * ✔ Gráfico de densidade controlando o bandwidth e tipo de função kernel (Walmes); * ✔ Boxplot com controle no critério de representação dos extremos (Walmes); * Gráfico para ilustrar poder do teste controlando a diferença entre as médias; * ✔ Gráfico da densidade normal padrão com destaque para área acumulada até o quantil (Walmes); * Gráfico da reta ajustada e pontos ilustrando alavancagem; * Gráfico para ilustrar obtenção de valores iniciais para usar no ajuste de modelos de regressão não linear; * Gráfico qqplot alterando o valor de lambda da tranformação boxcox; * ✔ Gráfico tridimensional variando o ângulo de observação (Walmes); * Aproximação da binomial pela normal controlando o valor de p; * ✔ Outras Aproximações pela normal; * Convergência da média de realizações binomial, Poisson, beta, etc, para uma distribuição normal controlando tamanho da amostra; * ✔ Gráfico para estudo de medidas de influência em modelos de regressão linear (Walmes); * ✔ Teste de normalidade aplicado aos dados e aos resíduos (Walmes); * ✔ Teste de correlação para dados e resíduos de experimentos (Walmes); * ✔ Taxa de erro tipo I e tipo II (Walmes). Dicas sobre o editor: * o atalho ''alt+-'' faz o sinal de atribuição ''<''''-''; ==== Gráfico tridimensional variando o ângulo de observação ====


# por Walmes ------------------------------------------------

require(manipulate) 
require(lattice)
da <- expand.grid(x=seq(0,10,l=30), z=seq(0,10,l=30))
da$y <- with(da, x+z+0.2*x*z) # gera dados

manipulate(
  ## faz o gráfico tridimensional
  wireframe(y~x+z, da,
            screen=list(z=z.angle, x=-60)),
  ## controla o valor do z.angle          
  z.angle=slider(0, 360, 10))

#------------------------------------------------------------

==== Gráfico da densidade normal padrão com destaque para área acumulada até o quantil ====


# por Walmes ------------------------------------------------

require(manipulate)

manipulate(
  {
  curve(dnorm(x, 0, 1), -5, 5, ylab="f(x)")
  x <- seq(-5, q, by=0.05)
  fx <- dnorm(x, 0, 1)
  polygon(c(x, rev(x)),
          c(fx, rep(0, length(fx))),
          col="gray90")
  Pr <- round(pnorm(q, 0, 1), digits=3)
  legend("topleft", bty="n",
         legend=substitute(P(X

==== Gráfico de densidade controlando o bandwidth e tipo de função kernel ====


# por Walmes ------------------------------------------------

require(manipulate)

x <- rgamma(300, 3, 7)
manipulate(
  {
  plot(density(x, bw=bw, kernel=kernel))
  if(show.rug==TRUE) rug(x)
  },
  kernel=picker("gaussian", "epanechnikov", "rectangular",
                "triangular", "biweight","cosine",
                "optcosine"),
  bw=slider(0.01, 0.15, step=0.003, initial=0.05),
  show.rug=checkbox(TRUE, "show rug")
  )

#------------------------------------------------------------


==== Aproximações pela normal ====

require(manipulate)
##
## Poisson e normal
##
manipulate(
  {
    XM <- floor(lam+4*sqrt(lam))
    curve(dpois(x, lambda=lam), 0, XM, n=XM+1,
          ylab="P[X=x] / f(x)", type="h")
    curve(dnorm(x, m=lam, sd=sqrt(lam)), 0, XM,
          add=T, col=2)
    legend("topright", c("Poisson", "Normal"), lty=1, col=1:2)
    title(substitute(lambda == l, list(l=lam)))
  },
  lam=slider(0.5, 30, step=0.5)
  )

##
## t e normal
##
manipulate(
    {
    curve(dt(x, df=df), -4, 4, ylim=c(0, 0.4), ylab="densidade f(x)")
    curve(dnorm(x), -4, 4, add=T, col=2)
    legend("topright", 
      c(substitute(t[nu == a], list(a=df)), expression(N(0,1))), 
      lty=1, col=1:2)
  },
    df = slider(1, 40)
  )

##
## Chi^2 e normal
##
manipulate(
  {
    curve(dchisq(x, df=df), 0, df+4*sqrt(2*df), 
          ylab="densidade f(x)")
    curve(dnorm(x, m=df, sd=sqrt(2*df)), 0, df+4*sqrt(2*df), 
          add=T, col=2)
    legend("topright", 
    leg=eval(substitute(c(expression(chi[nu==df]^2),
             expression(N(mu==df,sigma^2==df2))), 
             list(df2=2*df, df=df)),
),
          lty=1, col=1:2)
  },
  df=slider(1,50)
)


==== Gráfico de duas densidades normais com destaque para áreas acumuladas até o quantil ====
(Veja o enunciado deste exemplo em [[http://www.leg.ufpr.br/~silvia/CE055/node49.html]])


# por Silvia ------------------------------------------------

manipulate(
  {
  curve(dnorm(x, 1.25, 0.12), 0.8, 2, ylab="f(x)",xlim=c(0.8,2))
  x <- seq(0.8, q, by=0.01)
  fx <- dnorm(x, 1.25, 0.12)
  polygon(c(x, rev(x)),
          c(fx, rep(0, length(fx))),
          col="gray90")
  Pr1 <- round(pnorm(q, 1.25, 0.12), digits=3)
  legend("topleft", bty="n",
         legend=substitute(P(X1

==== Boxplot com controle no critério de representação dos extremos ====


# por Walmes ------------------------------------------------

require(manipulate)

manipulate(
  {
    x <- rep(1:10, 2)
    x[20] <- extreme
    gr <- gl(2, 10)
    bp <- boxplot(x~gr, outline=outline, range=range,
                  notch=notch, plot=FALSE)
    inf <- bp$stats[4,2]
    sup <- inf+range*diff(bp$stats[c(2,4),2])
    ylim <- extendrange(r=c(min(x), max(c(x,sup))), f=0.05)
    boxplot(x~gr, outline=outline, range=range,
            notch=notch, ylim=ylim)
    arrows(1.5, inf, 1.5, sup, angle=90, code=3, length=0.1)
  },
  extreme=slider(10, 30, step=0.5, initial=10),
  range=slider(1, 4, step=0.1, initial=1.5),
  outline=checkbox(TRUE, "show.outlier"),
  notch=checkbox(FALSE, "show.interval")
  )
  
#------------------------------------------------------------


==== Gráfico para estudo de medidas de influência em modelos de regressão linear ====


# por Walmes ------------------------------------------------

require(manipulate)
data(anscombe)
ans0 <- anscombe[,c("x1","y1")]
ans0 <- ans0[order(ans0$x1),]
rownames(ans0) <- NULL
ans1 <- ans0
rx <- 2*diff(range(ans1$x1))
ry <- 2*diff(range(ans1$y1))
cols <- rep(1,nrow(ans0))

layout(matrix(c(1,2,1,3,4,5),2,3))

manipulate({
  ans1[po,] <- ans0[po,]+c(dx,dy)
  plot(ans1)
  points(ans1[po,], col="red", pch=19)
  abline(a=3, b=0.5, col="gray50", lty=2)
  m1 <- lm(y1~x1, data=ans1)
  abline(m1, col=2)
  h <- hatvalues(m1)[po]
  r <- residuals(m1)[po]
  legend("topleft", bty="n",
         legend=c(substitute(h==ha, list(ha=round(h,3))),
                  substitute(r==re, list(re=round(r,3)))))
  legend("bottomright", legend=po, bty="n")
  plot(m1)
  },
  po=slider(1,nrow(ans0), step=1, initial=5),
  dx=slider(-rx+0.001, rx, initial=0),
  dy=slider(-ry, ry, initial=0))

#------------------------------------------------------------


==== Teste de normalidade aplicado aos dados e aos resíduos ====


# por Walmes ------------------------------------------------

par(mfrow=c(2,1))

manipulate({
  m <- rep(seq(0,by=h1,length.out=nlev), nrep)
  x <- rnorm(m, m, sd)
  xp <- qqnorm(x); qqline(x)
  rug(xp$x); rug(xp$y, side=2)
  legend("topleft", legend=shapiro.test(x)$p, bty="n")
  m0 <- lm(x~factor(m))
  xp <- qqnorm(residuals(m0)); qqline(residuals(m0))
  rug(xp$x);rug(xp$y, side=2)
  legend("topleft", bty="n",
         legend=shapiro.test(residuals(m0))$p)
  },
  h1=slider(0.001, 10, initial=1),
  nlev=slider(2, 15, initial=5),
  nrep=slider(2, 25, initial=5),
  sd=slider(0.01, 10, initial=1))
  
#------------------------------------------------------------


==== Teste de correlação para dados e resíduos de experimentos ====


# por Walmes ------------------------------------------------

require(MASS)
par(mfrow=c(2,1))

manipulate({
  m <- rep(seq(0,by=h1,length.out=nlev), nrep)
  x <- mvrnorm(length(m), mu=c(0,0),
               Sigma=matrix(c(1,cor,cor,1),2,2))
  x[,1] <- x[,1]+m; x[,2] <- x[,2]+m
  plot(x)
  legend("topleft", legend=cor.test(x[,1], x[,2])$est, bty="n")
  m0 <- aov(x~factor(m))
  r <- residuals(m0)
  plot(r)
  legend("topleft", legend=cor.test(r[,1], r[,2])$est, bty="n")
  },
  h1=slider(0,19.99,initial=0.01),
  nrep=slider(10,300,initial=20),
  nlev=slider(2,15,initial=5),
  cor=slider(-0.99,0.99,initial=0))

#------------------------------------------------------------


==== Taxa de erro tipo I e tipo II  ====


# por Walmes ------------------------------------------------

require(manipulate)

n <- 70
xx <- seq(qnorm(0.9), 4, l=n)
yy <- dnorm(xx, 0, 1)

area <- function(x,y){
  da <- rbind(cbind(x,y), c(x[1],y[1]))
  DA <- sapply(1:length(x),
               function(o){
                 dir <- da[o,1]*da[o+1,2]
                 esp <- da[o,2]*da[o+1,1]
                 c(dir, -esp)
               }
               )
  abs(sum(apply(DA, 1, sum)/2))
}

manipulate({
  curve(dnorm(x, 0, 1), -4, 9, col=1,
        ylim=c(-0.15,0.5), yaxt="n", ylab="f(x)")
  axis(2, at=seq(0,0.4,0.1))
  curve(dnorm(x, i, 1), col=2, add=TRUE)
  xx2 <- seq(-4+i, qnorm(0.9, i, 1)+2, l=n)
  yy2 <- dnorm(xx2, i, 1)
  xx2 <- c(min(xx2), xx2, max(xx2))
  yy2 <- c(0,yy2,0)
  yy2 <- pmin(yy2, dnorm(xx2, 0, 1))
  polygon(xx2, yy2, col="gray90")
  polygon(c(xx, rev(xx)),
          c(yy, rep(0, length(yy))), den=10)
  segments(i, 0, i, 0.4, col=2)
  segments(0, 0, 0, 0.4, col=1)
  tipo2 <- round(area(xx2,yy2), 3)
  text(2, -0.075, pos=1, label=expression(alpha==0.10))
  arrows(2, -0.075, 2, -0.01, length=0.1)
  text(i/2, 0.45, pos=3, label=substitute(beta==b, list(b=tipo2)))
  arrows(i/2, 0.45, i/2, max(yy2)+0.01, length=0.1)
  },
  i=slider(0, 6, step=0.01, initial=0)
  )

#------------------------------------------------------------