CE-003: Estatística II - Turma: K/O, 2a Prova (24/11/2014)

GRR: ______________________ Nome: _____________________________________________________________ Turma: ________________________________________________________________

1.
O tempo para processamento e análise de determinado tipo de imagem médica possui distribuicão normal de média 5,2 segundo e variância de 0,64 segundos2.
(a)
Se 1000 imagens serão analisadas, em quantas delas espera-se um tempo de processamento acima da 5,5 segundos?
(b)
Se as imagens forem agrupadas em lotes de 10, em quantos lotes espera-se um tempo de processamento acima da 55 segundos?
(c)
Considere agora que deseja-se determinar o número k de imagens para compor os lotes. Quantas imagens dever haver em um lote para que a probabilidade do tempo médio de processamento das k imagens de um lote ultrapassar 5,5 segundos seja de no máximo 0,02?

Solução:

X  ∼ N(μ = 5,2;σ2 = 0,64)

(a)
1000 P[X > 5,5] = 1000 P[Z > 5,5−5,2-
 0,8] = 1000 P[Z > 0,375] = 1000 [0,5 0,14617] = 354
(b)
X N(μX = 5,2;σX2 = 0,64
----
 10)
100 P[ i=110 > 55] = 100 P[X > 5,5] = 100 P[Z > 5,5− 5,2
----√---
0,8∕  10] = 100 P[Z > 1,19] = 100 [0,5 0,38216] = 12
(c)
P[Xk > 5,5] = P[ i=1k > 55] 0,02
P[Z > 5,5-−√5,2
0,8∕  k] 0,02
z = 5,5− 5,2
-0,8∕√k- 2,05
k     2    2
-0,8-2,05--
(5,5− 5,2)2
k 30

_________________________________________________________________________________________________________________________________________________________________ 2. Um laboratório tomou uma amostra de 1500 materiais contaminados com uma determinada bactéria a fim de estimar a proporção θ de resistência na população a um determinado antibiótico;. Nos testes laboratoriais encontrou-se que 260 das amostras apresentavam resistência.

(a)
Identifique no contexto deste problema a população ("informal" e estatística), a amostra, o parâmetro de interesse o estimador e a estimativa.
(b)
Obtenha os intervalos de confiança (assintótico e conservador) para a proporção de resistência na população.
(c)
Qual a suposição que foi feita a respeito da amostragem para o cálculo do intervalo de confiança. Discuta a adequação da suposição no contexto do problema.

Solução:

(a)
População: materiais (contaminações) com a bactéria
População estatística: X : bactéria resistente nos materiais contaminados,X B(θ)
Amostra: os 260 materiais colhidos e testados para resistência
Parâmetro: θ (proporção de materiais com bactérias resistêntes na população)
Estimador: ˆθ = x = ∑
--Xi
  n (proporção de materiais contaminados e com bactérias resistentes)
Estimativa : ˆθ = 260-
1500 = 0,173
(b)
IC (95%)
conservador: ˆθ± z∘ --------
  ˆθ(1− ˆθ)
  ---n---
0,173 ± 1,96∘---------------
  0,173(1−-0,173)-
       1500
0,173 ± 0,0191
assintótico: ˆθ± z∘ -----------
  0,5(1− 0,5)
  -----n-----
0,173 ± 1,96∘-------
  --1----
  4⋅1500
0,173 ± 0,0253
(c)
Suposição de que foi tomada uma amostra aleatória simples, portanto as observações são independentes. (DISCUTIR NO CONTEXTO DO PROBLEMA)

_________________________________________________________________________________________________________________________________________________________________ 3. Considere contexto da questão sobre o tempo de processamento e análise das imagens. Um novo algorítmo foi proposto para o processamento e análise das imagens e testado no processamento de 25 imagens. Os tempos de processamento são dados a seguir.

4,29   4,12   6,09   4,09   4,96   5,70   4,49   4,20   5,30   4,55   6,33   4,97   5,03  
4,66   6,15   4,82   4,17   5,18   7,94   4,10   5,19   5,75   4,36   4,70   5,28

(a)
Obtenha a média, desvio padrão e coeficiente de variação dos dados.
(b)
Obtenha a mediana, quartis, amplitude e amplitude interquartílica.
(c)
Obtenha o diagrama box-plot e comente sobre a distribuição dos dados.
(d)
Faça suposições adequadas e teste a hipótese de que o tempo médio com o novo algorítmo é inferior ao que vinha sendo utilizado.

Solução:

(a)
x = 5,0568;Sx = 0,901178487685246;CV x = 17,821121809944%
(b)
md(x) = Q2 = 4,96;Q1 = 4,36;Q3 = 5,3;Ax = 3,85;AIx = 0,94
(c)

PIC

Comentar sobre: valor central, dispersão, assimetria e presença (ou não) de dado discrepante.

(d)
Teste de hipótese sobre média com variância conhecida
  • H0 : μ = 5,2 vs H1 : μ < 5,2 (unilateral)
  • α = 0,05
    Com todas as observações :
  • zc = xσ−∕μ√0n = 5,005,86∕8−√25,52 = 0,895
  • zt = 1,64, ou então p valor = 0,185
  • Conclusão: |zc| < zt ou, equivalentemente, pvalor > α(0,05), portanto não se rejeita H0 ou seja não há evidência (com estes dados) de que o tempo tenha sido reduzido, para o nível de significância de 5%. Excluindo a observaçâo discrepante:
  • zc = x∗−√μ0
 σ∕ n = 4,937−√5,2
0,8∕ 24 = 1,61
  • zt = 1,64, ou então p valor = 0,0534
  • Conclusão: |zc| > zt ou, equivalentemente, p valor < α = 0,05, portanto não rejeita-se H0, ou seja, não há evidência (com estes dados, excluindo-se a observação atípica) de que o tempo tenha sido reduzido, para o nível de significância de 5%.

_________________________________________________________________________________________________________________________________________________________________ 4. Um estudo foi conduzido entrevistando uma amostra de 300 estudantes sobre aspectos de sua vida acadêmica. Separamos a seguir algumas das questões (variáveis) anotadas:

(a)
Classifique cada variável quanto a seu tipo e esboçe como seria um gráfico adequado a cada uma delas.
(b)
Suponha que o cruzamento das variáveis "sexo" e "satisfação" produziu a seguinte tabela:





Satisfação



Sexo 1 2 3




Fem 80 45 25
Masc 55 50 45




Produza tabelas comparativas, gráficos adequados e avalie por alguma medida/procedimento estatístico se a os sexos diferem quanto a satisfação com o curso.

(c)
Indique mais dois "cruzamentos" envolvendo diferentes tipos de variáveis de possível interesse entre duas variáveis e esboçe como os resultados dos cruzamentos poderiam ser representados graficamente e como seriam analizadas as relações entre as variáveis.