CE-223: Estatística Computacional

1a Prova, 02 de maio de 2007

  1. (3,0 pontos) Descreva o que está sendo feito em cada uma das sequências de comandos a seguir.
    1.    > x <- round(rnorm(26, m=14, sd=5), dig=2)
         > mean(x[x < 15])
         > mean(x[x >= 15])
         > sum(x<15)
         > sum(x>=15)
        

      Resposta:

      • é criado um vetor x de 26 elementos a partir do sorteio de valores aleatórios de uma distribuição normal de média=14 e desvio padrão=5,
      • calcula-se a média dentre os valores menores que 15
      • calcula-se a média dentre os valores maiores ao iguais a 15
      • conta-se o número de valores em x menores que 15
      • conta-se o número de valores em x maiores ou iguais a 15
    2.    > x <- rpois(31, lam=9)
         > p <- 2 * (0:5)
         > i <- 2 * (0:5) + 1
         > sum(x[p])
         > sum(x[i]^2)
        

      Resposta:

      • cria-se um vetor x a partir do sorteio de 31 valores de uma distribuição de Poisson de parâmetro λ = 9
      • cria-se um objeto p com valores (pares) 0,2,10
      • cria-se um objeto p com valores (ímpares) 1,3,11
      • obtém-se a soma dos valores nas posições pares indicadas por p em x, ou seja, x[2] + x[4] + ...+ x[10]
      • obtém-se a soma dos quadrados dos valores nas posições ímpares i em x, ou seja, x[1] + x[3] + ...+ x[11]
    3.    > xvals <- 0:20
         > plot(xvals, dgeom(xvals, p=0.7), type="h")
        

      Resposta: é feito um gráfico de uma v.a. discreta com distribuição geométrica de parâmetro p = 0.7, tomando-se os valores de x de 0 a 20.


        > xvals <- 0:20
        > pc

        [1] 0.7

        > plot(xvals, dgeom(xvals, p = pc), type = "h")

      pict

  2. (2,0 pontos) Seja a função de densidade de probabilidade:
    f(x) = exp{-2-∣x-∣}- I(-∞,∞)(x)
    Mostre comandos para obter:
    1. o gráfico da função;


        > fdp <- function(x) exp(-abs(x))/2
        > plot(fdp, -5, 5)

      pict

    2. mostrar que a integral de função no domínio de x é igual a 1;

        > integrate(fdp, -Inf, +Inf)$value

        [1] 1
    3. as seguintes probabilidades:
      1. P[-0.3 < X 0.3]
      2. P[X > 0.7]
      3. P[X> 1.7].

        > integrate(fdp, -n1, n1)$value

        [1] 0.2591818

        > integrate(fdp, n2, Inf)$value

        [1] 0.2482927

        > integrate(fdp, -Inf, -n3)$value + integrate(fdp, n3, Inf)$value

        [1] 0.1826835
  3. (2,0 pontos) A tabela a seguir mostra a distribuição de frequências de 499 trabalhadores do setor de serviços desempregados em função da idade sexo e duração do período de desemprego.

    duração
    Abaixo de 35 anos
    Acima de 35 anos




    (dias) FemininoMasculinoFemininoMasculino






    1-7 36 48 44 43
    8-30 48 42 38 49
    Mais de 30 30 43 42 36






    Mostre os comandos para:

    1. entrar com estes dados em uma estrutura adequada no R.

        > freqs

         [1] 36 48 48 42 30 43 44 43 38 49 42 36

        > dat <- array(freqs, dim = c(2, 3, 2))
        > dimnames(dat) <- list(c("F", "M"), c("1-7", "8-30", ">30"), c("<35", ">35"))
        > dat

        , , <35
        
          1-7 8-30 >30
        F  36   48  30
        M  48   42  43
        
        , , >35
        
          1-7 8-30 >30
        F  44   38  42
        M  43   49  36
    2. encontrar o número total de pessoas em cada faixa etária

        > apply(dat, 3, sum)

        <35 >35
        247 252
    3. encontrar a proporçao de homens e mulheres que ficou desempregada por mais de 30 dias

        > round(100 * apply(dat[, 3, ], 1, sum)/apply(dat, 1, sum), dig = 1)

           F    M
        30.3 30.3
    4. encontrar a probabilidade de uma pessoa sorteada ao acaso deste grupo ter menos de 35 anos e ser do sexo masculino

        > sum(dat[1, , 1])/sum(dat)

        [1] 0.2284569
  4. (1,0 pontos) Seja o objeto x com o conjunto de dados mostrado a seguir. Escreva a expressão a ser calculada e forneça o resultado das operações indicadas.

       [1] 14 15 13 18 16 13 16 16 16 14
    1. > sum((x[c(2, 5, 7)])^2)

          E = (x[2]+x[5]+x[7])^2 = (15+16+16)^2 = 225
        
    2. > sum(x[rev(c(1,3,6,10))]/(4:1))

          E = (x[10]/4 + x[6]/3 + x[3]/2 + x[1]/1) = (14/4 + 13/3 + 13/2 + 14/1) = 28.33
  5. (2,0 pontos) O exercício número 23 do Capítulo 1 de Magalhães e Lima (2006, 6a ed.) apresenta dados de 26 indivíduos que foram contaminados pelo veneno de um certo tipo de inseto e submetidos a tratamento (três diferentes tipos). O cabeçalho dos dados com os seis primeiros casos é mostrado a seguir e as variáveis são: Idade: idade do paciente (anos) , Diag: tempo entre o contato com o inseto e a administração do tratamento (horas), Recup: tempo entre administração do tratamento e recuperação (horas), Tratam: tipo de tratamento administrado, Coag: presença de coágulos no momento da admissão,

      > head(ex1.23)

        Num Idade Diag Recup Coag Tratam
      1  19    28    7     3  não     II
      2   4    15   52    45  não      I
      3  27    76   30    23  sim    III
      4   7    15   53    46  sim      I
      5  14    21    3     2  não     II
      6   5    11   46    42  não      I

    Mostre os comandos para se obter:

    1. um gráfico adequado para a variável Coag.
    2. um gráfico adequado para a variável Idade.
    3. a média de Idade em cada grupo de Coag.
    4. o cruzamento das variáveis de tipo de tratamento e presença de coágulo.

    Respostas:


      > par(mfrow = c(1, 2))
      > with(ex1.23, pie(table(Coag)))
      > title("Presença de Coágulos")
      > with(ex1.23, hist(Idade, main = "Idade"))

    pict