CE-003: Estatística II, turma O, 1a Prova - 1o semestre 2009 (08/04/2009)


  1. A tabela a seguir apresenta as notas de matemática no vestibular e na disciplina de cálculo de alguns alunos selecionados ao acaso. Pretende-se examinar se há relação entre os desepenhos nestas provas. Construa um gráfico adequado para representar os dados, calcule medidas de associação adequadas e discuta os resultados.







    AlunoVestibularCálculoAlunoVestibularCálculo






    1 37 65 7 35 50
    2 57 92 8 80 90
    3 34 56 9 65 88
    4 40 70 10 47 71
    5 21 52 11 28 52
    6 28 73 12 67 88







      > vest <- c(37, 57, 34, 40, 21, 28, 35, 80, 65, 47, 28, 67)
      > calc <- c(65, 92, 56, 70, 52, 73, 50, 90, 88, 71, 52, 88)
      > sapply(c("pearson", "kendall", "spearman"), function(m) cor(vest,
      +     calc, method = m))
        pearson   kendall  spearman
      0.8675085 0.6356780 0.7750451
      > plot(vest, calc)

    PIC


    O diagrama de dispersão mostra uma relação ligeiramente não linear, positiva e sem presença de dados discrepantes, embora com os dados dispostos em dois grupos separados de valores baixos e altos. Desta forma os diferentes coeficientes de correlação apresentam valores um pouco diferentes com o de Pearson mais elevado devido à posição dos grupos distintos e moderada associação.

  2. Com os dados da questão anterior:
    1. Construa um diagrama "ramo-e-folhas" com todas as notas (vestibular e cálculo) e marque (sublinhe) nas "folhas" os dados da prova de cálculo. Discuta os resultados.
    2. Calcule a mediana, quartis e amplitude interquartílica das notas de cálculo.
    3. Calcule o coeficiente de variação das notas do vestibular e de cálculo. Interprete e compare os resultados.
    4. Faça um gráfico com os diagramas "box-plot" das duas notas (um "boxplot" para cada). Compare e discuta os resultados.
    1.   > stem(c(vest, calc))
          The decimal point is 1 digit(s) to the right of the |
        
          2 | 188457
          4 | 0702267
          6 | 557013
          8 | 08802
        > stem(c(vest, calc), scale = 2)
          The decimal point is 1 digit(s) to the right of the |
        
          2 | 188
          3 | 457
          4 | 07
          5 | 02267
          6 | 557
          7 | 013
          8 | 088
          9 | 02
    2.   > c(mediana = median(vest), q1 = fivenum(vest)[2], q3 = fivenum(vest)[4],
        +     AIQ = diff(fivenum(vest)[c(2, 4)]))
        mediana      q1      q3     AIQ
           38.5    31.0    61.0    30.0
        > c(mediana = median(calc), q1 = fivenum(calc)[2], q3 = fivenum(calc)[4],
        +     AIQ = diff(fivenum(calc)[c(2, 4)]))
        mediana      q1      q3     AIQ
           70.5    54.0    88.0    34.0
    3.   > c(vestibular = 100 * sd(vest)/mean(vest), calculo = 100 * sd(calc)/mean(calc))
        vestibular    calculo
          40.94691   22.63165
    4. O CV permite comparar a variabilidade de grupos de diferentes médias, que é o caso neste exemplo. A medida mostra que as notas de cálculo são mais homogêneas do que as do vestibular, em relação às suas médias, embora as variabilidade absolutas sejam semelhantes.
        > boxplot(vest, calc, names = c("Vestibular", "Cálculo"))

      PIC Os gráficos mostram valores nitidamente mais elevados para notas de cálculo, com variabilidades absolutas semelhantes, uma leve assimetria nas notas do vestibular com maior concentração de valores baixos e sem presença de obbservações discrepantes.


  3. Uma pesquisa para verificar a tendência dos alunos a prosseguir os estudos segundo a classe social do respondente mostrou o seguinte resumo dos dados.






    Pretende
    Classe Social
    Continuar?AltaMédiaBaixaTotal





    Sim 200 220 380 800
    Não 200 280 720 1.200





    1. Faça um gráfico adequado para representar as respostas de intenção de continuar os estudos.
    2. Faça um gráfico adequado para representar o perfil de classes sociais dos entrevistados.
    3. Faça um gráfico adequado para representar conjuntamente a classe social e intenção de continuar os estudos.
    4. Com base nos dados voce diria que a intenção de continuar os estudos está associada à classe social do entrevistado? Justifique sua resposta. Use também alguma(s) medida de associação adequada para fundamentar a sua interpretação.
      > tab <- rbind(c(200, 220, 380), c(200, 280, 720))
      > dimnames(tab) <- list(c("Sim", "Não"), c("Alta", "Média", "Baixa"))
      > tab
          Alta Média Baixa
      Sim  200   220   380
      Não  200   280   720
      > prop.table(tab, mar = 1)
               Alta     Média Baixa
      Sim 0.2500000 0.2750000 0.475
      Não 0.1666667 0.2333333 0.600
      > prop.table(tab, mar = 2)
          Alta Média     Baixa
      Sim  0.5  0.44 0.3454545
      Não  0.5  0.56 0.6545455
    1.   > pie(apply(tab, 1, sum))

      PIC

    2.   > barplot(apply(tab, 2, sum))

      PIC

    3. Algumas alternativas (entre outras possibilidades):
        > par(mfrow = c(2, 2), mar = c(3, 3, 0.5, 0.5), mgp = c(1.7, 0.7,
        +     0))
        > barplot(tab)
        > barplot(t(tab))
        > barplot(prop.table(tab, mar = 2))
        > barplot(tab, beside = T)

      PIC

    4.   > chi2 <- chisq.test(tab)$stat
        > chi2
        X-squared
         33.63636
        > C <- sqrt(chi2/(chi2 + sum(tab)))
        > C
        X-squared
        0.1286080
        > T <- sqrt((chi2/sum(tab)/((2 - 1) * (3 - 1))))
        > T
        X-squared
        0.0917011

      As porcentagens calculadas, valores de χ2 e coeficientes de contingência mostra alguma associação, porém fraca entre as variáveis.