CE-223: Estatística Computacional

2a Prova, 01 de Junho de 2007

  1. (6,0 pontos) Considere o conjunto de dados a seguir onde são fornecidos o produto interno bruto (V1), população aproximada em milhões de habitantes (V2), inflação anual (V3), área do país (V4) e participação na comunidade européia (V5) e responda às questões formuladas, fornecendo os todos os comandos necessários para obter as respostas. (nota: dados fictícios)







    País V1V2V3 V4 V5






    Austria 197 82,2 84sim
    França 1355 581,7544sim
    Alemanha 2075 811,8358sim
    Suiça 265 71,8 41nao
    Dinamarca 302 101,6 28nao







      > dat <- data.frame(v1 = c(197, 1355, 2075, 265, 302), v2 = c(8, 58, 81, 7, 10),
      +     v3 = c(2.2, 1.7, 1.8, 1.8, 1.6), v4 = c(84, 544, 358, 41, 28), v5 = rep(1:2,
      +         c(3, 2)))
      > dat$v5 <- factor(dat$v5, lev = 1:2, lab = c("sim", "nao"))
      > rownames(dat) <- c("Austria", "Franca", "Alemanha", "Suiça", "Dinamarca")
      > dat

                  v1 v2  v3  v4  v5
      Austria    197  8 2.2  84 sim
      Franca    1355 58 1.7 544 sim
      Alemanha  2075 81 1.8 358 sim
      Suiça      265  7 1.8  41 nao
      Dinamarca  302 10 1.6  28 nao
    1. Qual a taxa de inflação média entre todos os países?

        > with(dat, mean(v3))

        [1] 1.82
    2. Qual a taxa de inflação média para membros e não membros da comunidade européia?

        > with(dat, tapply(v3, v5, mean))

        sim nao
        1.9 1.7
    3. Qual a proporção de membros e não membros da união européia?

        > with(dat, prop.table(table(v5)))

        v5
        sim nao
        0.6 0.4
    4. Adicione uma nova variável na estrutura de dados, o PIB per capta dada pela divisão do PIB pelo tamnho da população

        > dat <- transform(dat, v6 = v1/v2)
        > dat

                    v1 v2  v3  v4  v5       v6
        Austria    197  8 2.2  84 sim 24.62500
        Franca    1355 58 1.7 544 sim 23.36207
        Alemanha  2075 81 1.8 358 sim 25.61728
        Suiça      265  7 1.8  41 nao 37.85714
        Dinamarca  302 10 1.6  28 nao 30.20000
    5. Obtenha o coeficiente de variação do PIB per capta

        > with(dat, sd(v6)/mean(v6)) * 100

        [1] 20.88324
    6. Calcule a correlação entre o PIB per capta e a taxa de inflação

        > with(dat, cor(v6, v3))

        [1] -0.2518938
    7. Calcule o PIB per capta médio apenas para países com taxa de inflação inferior a 2,0

        > with(dat, mean(v6[v3 < 2]))

        [1] 29.25912
    8. Quantos países possuem área superior a 100

        > with(dat, sum(v4 > 100))

        [1] 2
    9. Obtenha o PIB per capta médio separadamente para países com área superior e inferior a 100

        > with(dat, tapply(v6, v4 > 100, mean))

           FALSE     TRUE
        30.89405 24.48968
    10. Suponha que o PIB da França está errado, e o valor adequado não é conhecido. Altere a estrutura de dados adequadamente.

        > dat["Franca", 1] <- NA
        > dat

                    v1 v2  v3  v4  v5       v6
        Austria    197  8 2.2  84 sim 24.62500
        Franca      NA 58 1.7 544 sim 23.36207
        Alemanha  2075 81 1.8 358 sim 25.61728
        Suiça      265  7 1.8  41 nao 37.85714
        Dinamarca  302 10 1.6  28 nao 30.20000

        > dat <- transform(dat, v6 = v1/v2)
        > dat

                    v1 v2  v3  v4  v5       v6
        Austria    197  8 2.2  84 sim 24.62500
        Franca      NA 58 1.7 544 sim       NA
        Alemanha  2075 81 1.8 358 sim 25.61728
        Suiça      265  7 1.8  41 nao 37.85714
        Dinamarca  302 10 1.6  28 nao 30.20000
    11. usando agora os dados corrigidos obtenha o PIB per capta médio

        > with(dat, mean(v6, na.rm = T))

        [1] 29.57486
    12. usando agora os dados corrigidos obtenha o PIB per capta médio para membros e não membros da União Européia.

        > with(dat, tapply(v6, v5, mean, na.rm = T))

             sim      nao
        25.12114 34.02857
  2. (2,0 pontos) Considere uma v.a. X com distribuição de Poisson de parâmetro 8. Há o interesse em conhecer o comportamento da estatística T = V ar(X)∕max(X). Em particular deseja-se saber, ainda que aproximadamente, o valor da média e variância desta estatística para amostras de tamanho 20. Monte um procedimento de simulação adequado e obtenha estes valores.

      > sim <- matrix(rpois(1000 * 20, lambda = 8), nc = 20)
      > T <- apply(sim, 1, function(x) var(x)/max(x))
      > mean(T)

      [1] 0.5731188

      > var(T)

      [1] 0.02073506
  3. (2,0 pontos) Seja X uma v.a. com distribuição Geométrica com função de massa de probabilidade P[X = x] = p(1 -p)x,x = 0,1,2, e parâmetro p = 0.3. Mostrar os comandos do R para calcular as probabilidades a seguir.
    1. P[X = 5]

        > dgeom(5, prob = 0.3)

        [1] 0.050421
    2. P[X 6]

        > pgeom(5, prob = 0.3, low = F)

        [1] 0.117649
    3. P[X < 7]

        > pgeom(6, prob = 0.3)

        [1] 0.9176457
    4. P[2 < X < 13]

        > diff(pgeom(c(2, 12), prob = 0.3))

        [1] 0.3333111
    5. P[X - 3> 2]

        > pgeom(0, prob = 0.3) + pgeom(5, prob = 0.3, low = F)

        [1] 0.417649