CE-009: Introdução à Estatística - Turma: A, 2a Prova (23/06/2017)

GRR: _________________ Nome: ________________________________________________ Turma: _________

1.
Os números abaixo mostram as notas de um grupo de alunos em duas avaliações




















Aluno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18



















Prova 1 35 39 50 47 33 17 17 80 23 51 2 21 20 12 81 98 47 34
Prova 2 65 63 80 72 65 35 62 72 50 60 32 59 40 68 79 85 80 55



















(a)
Calcule média, variância e coeficiente de variação das notas em cada avaliação
(b)
Calcule mediana, quantis, amplitude e amplitude interquartílica de cada avaliação
(c)
Faça um diagrama box-plot para comparar as notas das duas avaliações
(d)
Com as notas das duas provas juntas faça um único diagrama ramo-e-folhas sublinhando as notas da segunda prova.
(e)
Usando as medidas e gráficos acima compare o rendimento dos alunos nas duas provas.
(f)
Existe relação (associação) entre os resultados das duas provas? Faça um gráfico adequado para verificar. Qual(ias) a(s) medida(s) que poderia(m) ser utilizada(s) para quantificar a associação. Baseando-se apenas no gráfico que valor (aproximado) voce espera encontrar para esta medida.

Solução:

(a)
x1 = 39, 28s12 = 670, 68CV 1 = 65, 93%
x2 = 62, 33s22 = 237, 53CV 2 = 24, 73%
(b)
md1 = 34, 5Q11 = 20Q31 = 50A1 = 96AI1 = 30
md2 = 64Q12 = 55Q32 = 72A2 = 53AI2 = 17
(c)


PIC

Figura 1: Gráfico box-plot (esquerda) e diagrama de dispersão (direita) das notas da turma na primera e segunda provas.


(d)
    The decimal point is 1 digit(s) to the right of the |
  
    0 | 2
    1 | 277
    2 | 013
    3 | 234559
    4 | 077
    5 | 00159
    6 | 023558
    7 | 229
    8 | 00015
    9 | 8
(e)
Comentários sobre: valores centrais, variabilidade, assimetria e dados discrepantes
(f)
Coeficientes de correlação: Pearson rP = 0, 75 e Spearman rS = 0, 732
Comentários: …

________________________________________________________________________________________________________________________________________ 2. Suponha aogra que as notas das provas são consideradas como uma amostra aleatórias de uma grande população de notas. Suponha que as notas possuem distribuição normal com média e variâncias desconhecidas. Tomando apenas as notas da Prova 1 :

(a)
Obtenha um intervalo de confiança (90%) para a média das notas.
(b)
Obtenha um intervalo de confiança (90%) para o desvio padrão das notas.

População:

X : nota de cada aluno
X N(μ,σ2)
μ,σ2 : parâmetros desconhecidos

Amostra:

Dados:
Prova1 : (35, 39, 50, 47, 33, 17, 17, 80, 23, 51, 2, 21, 20, 12, 81, 98, 47, 34)
n = 18
Estimadores:
ˆμ = x = ∑500 x
--i=1-i-
   n; ˆσ2 = S2 = ∑500 (x  − x)2
---i=1--i------
    n −  1
Estimativas:
x = 39, 3; S2 = 25, 9
Distribuições amostrais:
x t(μ,S2∕n); S2 χ2(ν = n 1)

(a)
x ± t0.90,17   √S--
     n
39, 3 ± 1, 74 6, 1
39, 3 ± 10, 6
(28, 7; 49, 9)
(b)
(                     )
  (n − 1)S2  (n − 1)S2
  ---χ2-----;---χ2-----
      sup        inf
(                             )
  (18 − 1)25,92 (18 − 1)25, 92
  -------------;--------------
      27,6           8,67
(413;1315 )
E para o desvio padrão teríamos:
(√ ---- √----)
   413;  413−→(20,3;36,3)

________________________________________________________________________________________________________________________________________ 3. Foi feita uma pesquisa junto a proprietários rurais para verificar o conhecimento sobre uma determinada legislação ambiental. Para isto foi selecionada uma amostra aleatória de 800 proprietários e vamos considerar aqui simplesmente que cada um deles era classificado como 0 - sem conhecimento ou 1 - com conhecimento. Feita a pesquisa, 504 foram classificados como com conhecimento.

(a)
Obtenha a estimativa pontual e intervalar (95% de confiança) para a proporção de proprietários com conhecimento da legislação.
(b)
Antes da pesquisa tabalhava-se com a hipótese de que o nível de conhecimento era da 60% dos proprietários. Há evidências estatísticas baseadas no estudo de que o o conhecimento seja diferente deste? Justifique sua resposta.
(c)
Após a pesquisa e uma campanha publicitária decidiu-se refazê-la porém deseja-se uma margem de erro de no máximo 1,5%. Qual deveria ser o tamanho da nova amostra?

Solução:

X : conhecimento sobre a legislação
X B(p); E[X] = pVar[X] = p(1 p)
ˆp N(p,p(1 p)∕n)
(a)
ˆp = 504-
800 = 0, 63
I.C.assintótico :
IC95% : ˆp± z∘ ---------
  ˆp(1 − ˆp)
  ---n----−→(0, 597; 0, 663)
I.C.conservador :
IC95% : ˆp± z∘ ---
  -1-
  4n−→(0, 595; 0, 665)
(b)
Resposta e justificativa baseada no valor estar ou não contido no I.C..
(c)
ME = z95%∘ ---------
  p-(1-−-p)
      n
0.015 = 1, 96∘ ---------------
   0,63(1 −-0,63)-
         n
n =  1,962
0,0152-0, 63(1 0, 63)
n = 3980

________________________________________________________________________________________________________________________________________ 4. Os tempos de atendimento e solução de problemas foram medidos em três call-centers distintos de uma mesma empresa e os dados foram representados no gráfico a seguir. Baseando-se no gráfico, avalie cada uma das afirmações a seguir, dizendo se está certa ou errada, justificando sua resposta e corrigindo as afirmações erradas.

PIC

(  )
Os valores no local C possuem uma distribuição simétrica.
(  )
Os dados discrepantes do local A afetam (aumentam) a mediana do local.
(  )
Os locais B e C possuem médias e desvios padrão semelhantes.
(  )
O local B possui o menor coeficiente de variação.
(  )
As médias dos três locais devem ser semelhantes.