(1,5) Seja uma variável aleatória \(Y\) com f.d.p. \(f(y) = 2 - 2y\) e \(0 \leq y \leq 1\).
(2,0) Identifique e descreva o que está sendo simulado nos códigos a seguir. Esboce o gráfico das variáveis simuladas. Em todos os casos considere \(N = 10000\).
Código 1
u <- runif(N)
v <- runif(N)
z1 <- sqrt(-2*log(u)) * cos(2*pi*v)
z2 <- sqrt(-2*log(u)) * sin(2*pi*v)
t <- z1^2 + z2^2Código 2
x1 <- matrix(-log(runif(5*N))/1.5, ncol = 5)
x2 <- matrix(-log(runif(3*N))/1.5, ncol = 3)
x3 <- rowSums(x1)
x4 <- rowSums(x2)
x5 <- x3/(x3+x4)Código 3
y1 <- rgamma(N, 5, 2)
y2 <- rpois(N, lambda = y1)
mean(y2)
mean(y2[y2 > 0])
mean(y2 > 0)Código 4
y1 <- rnorm(N, 175, 3)
y2 <- rnorm(N, 165, 3)
y3 <- y1 + y2
y4 <- (y1 + y2)/2
u <- runif(N)
y5 <- ifelse(u < 0.4, y1, y2)(1,0) Considere o problema de tomar uma amostra de tamanho 10 da distribuição exponencial (\(Y \sim {\rm Exp}(\theta)\)). Vai ser utilizado o intervalo de confiança para fazer inferência sobre o parâmetro da distribuição. Para obter o intervalo de confiança para estimativa considera-se três possibilidades: a) intervalo de Wald (assintótico), b) intervalo baseado na razão de verossimilhança e c) intervalo de verossimilhança a partir da transformação do parâmetro, por exemplo \(\phi = \log(\theta)\). Descreva como os métodos para obter os intervalos podem ser comparados fornecendo um passo a passo e (pseudo-)código.
(2,0) Simulações de Monte Carlo podem ser usadas para estimar/aproximar quantidades relacionadas a distribuições de probabilidades. Os comandos a seguir ilustram tal fato com diversas aproximações. Em cada item fornecer:
yg <- rgamma(1e4, 15, 5)
mean(yg) ## 1a.
mean(yg > 6) ## 1b.
mean(yg > 2.5 & yg < 4.5) ## 1c.
mean(yg[yg < 3] > 1.5) ## 1d.
mean(yg[yg > 3]) ## 1e.
100*sd(yg)/mean(yg) ## 1f.
quantile(yg, prob = 0.95) ## 1g.
diff(quantile(yg, prob = c(0.25, 0.75))) ## 1h.
temp <- yg[yg < 4]
mean(temp > 1.5 & temp < 3) ## 1i.
var(yg[yg > 3 & yg < 10]) ## 1j.
##
x <- rnorm(1e4, m = 70, sd = 5) ## 2a.
mean(x) ## 2b.
mean(x > 80) ## 2c.
mean(x[x > 70]) ## 2d.
##
mus <- rnorm(1e4, 70, 3) ## 2e.
y <- rnorm(1e4, m = mus, sd = 5) ## 2f. (difere de 2a? justifique.)
mean(y) ## 2g. (difere de 2b? justifique.)
mean(y > 80) ## 2h. (difere de 2c? justifique.)
mean(y[y > 70]) ## 2i. (difere de 2d? justifique.)(1,0) Explique a diferença entre o bootstrap paramétrico e não paramétrico. Use um exemplo em comum entre os métodos. Forneça explicações e código/pseudocódigo ou algoritmo.
(1,0) Um corretor de seguros fecha em média 2,5 contratos por dia e é razoável assumir que o número diário de contratos fechados possui distribuição Poisson. Os contratos possuem valores, em milhares de reais, que seguem uma distribuição gama de parâmetros \(\alpha = 3\) e \(\beta = 0,5\). Deseja-se obter informações sobre a receita, tais como: receita esperada diária, semanal (considerar 5 dias úteis) e mensal (considerar 20 dias úteis) e os respectivos desvios padrão. Também há interesse em saber a proporção de semanas a receita não ultrapassa 20 mil reais, a probabilidade da receita ultrapassar o valor de 50000 e receita que deve ser atingida em pelo menos 80% dos dias, semanas e meses. Explique como uma simulação poderia ser utilizada para obter estimativas de interesse mencionadas e forneça (pseudo-)código/algoritmo para simulação.
(1,5) Considere a densidade \(f(y) = 1.5 y^2\) com \(-1 < y < 1\). Deseja-se obter simulações desta densidade utilizando o método da amostragem por rejeição. Escolha uma distribuição “proposal” conveniente. Forneça os passos do algorítmo deduzindo/mostrando como calcular as expressões e valores envolvidos. Explique, comparativamente, como seria um algorítmo MCMC (Metrópolis) para este caso.
Seja uma variável aleatória \(Y\) com densidade de probabilidade \(f(y)\) e distribuição acumulada \(F(y)\) e seja Prove que: