Simulações de Monte Carlo podem ser usadas para estimar/aproximar quantidades relacionadas a distribuições de probabilidades. Os comandos a seguir ilustram tal fato com diversas aproximações. Em cada item fornecer:
yb <- rbeta(1e6, 2, 6)
mean(yb > 0.63) ## a.
mean(yb) ## b.
mean(yb > 0.25 & yb < 0.50) ## c.
mean(yb[yb < 0.8] > 0.45) ## d.
mean(yb[yb > 0.3]) ## e.
##
y1 <- rexp(1e5, rate = 1/2)
y2 <- rexp(1e5, rate = 1/2)
y3 <- rexp(1e5, rate = 1/5)
var(y3) ## f.
mean(y1) + mean(y2) + mean(y3) ## g.
mean(y1 + y2 > 0) ## h.
I2 <- (y2 > 2)
mean(I2) ## i.
mean(y1[y1 + y2 > 3]) ## j.
##
yg <- rgamma(1e5, 2, 0.5)
100*sd(yg)/mean(yg) ## k.
quantile(yg, prob = 0.95) ## l.
diff(quantile(yg, prob = c(0.25, 0.75))) ## m.
temp <- yg[yg < 7.5]
mean(temp > 3.5 & temp < 6) ## n.
var(yg[yg > 3 & yg < 10]) ## o.
##
x <- rpois(1e5, lam = 5.2)
mean(x > 3) ## p.
mean(x[x > 0] > 3) ## q.
##
lam <- rgamma(1e5, 3, 1)
y <- rpois(1e5, lam = lam)
mean(y) ## r.
mean(y > 3) ## s. (difere de p.?)
mean(y[y > 0] > 3) ## t. (difere de q.?)
##
plot(density(lam)) ## u.
plot(density(lam[y == 2])) ## v.
mean(lam) ## y.
mean(lam[y = 2]) ## w.
mean(lam[y = 2] > 3.5) ## x.
Seja uma variável \(Y\) com distribuição exponencial de parâmetro \(\lambda\) tal que tal que a \(P[Y < 2] = 0,20\). Conduza um estudo de simulação de Monte Carlo para estimar a probabilidade de eventos considerados de risco, definidos por $P[Y > 10] para uma amostra de tamanho \(n = 50\). Deve-se avaliar o erro da estimativa.
Explique como conduzir estudo de simulação descrevendo, passo a passo, como obter a estimativa e suas propriedades de estimação. Forneça um (pseudo-)código. Discuta como avaliar se o tamanho \(n\) da amostra está adequado ou se precisa ser alterado.
Considere o modelo de regressão linear simples \(Y_i = \beta_0 + \beta_1 x_i + \epsilon_i\) com \(\epsilon_i \sim {\rm N}(0, \sigma_2)\).
Deseja-se conduzir um estudo para verificar o efeito da não normalidade dos erros em inferências no modelos de regressão linear simples.
Vamos considerar tomar erros com uma distribuição \(t\) de Student que possui caudas mais pesadas que a normal, e portanto, maior chance de gerar valores discrepantes. Considere gerar dados de uma distribuição \(t(\nu = 3)\). O estudo deve avaliar o impacto de não normalidade no intervalo de confiança do parâmetro \(\beta_1\) e nos erros tipo I e II do teste de hipótese da igualdade do parâmetro \(\beta_1\) ao valor verdadeiro usado na simulação.
Descreva o que e como seriam avaliadas as questões de interesse e os passos do estudo de simulação.
O intervalo de confiança para uma variância é usualmente computado por \(\left(\frac{(n-1)S^2}{\chi^2_{1 - \alpha/2, n-1}} ; \frac{(n-1)S^2}{\chi^2_{\alpha/2, n-1}} \right)\). em que \(S^2\) é a variância amostral e \(\chi^2_{\alpha/2, n-1}\) e \(\chi^2_{1-\alpha/2, n-1}\) são quantis da distribuição qui-quadrado e \(n\) é o número de observações. Suspeita-se que este intervalo não seja robusto à suposição de normalidade dos dados.
Considere o problema de estimar a seguinte integral \[ \theta = \int_0^2 \frac{e^{-x}}{1+x^2} dx \] Essa integral não possui solução fechada, sendo necessário algum método de aproximação numérica para resolvê-la. Usando uma destas técnicas, chega-se ao resultado aproximado de \(0.605326\). No entanto, sabemos que, alternativamente, essa integral pode ser aproximada pelo método de integração de Monte Carlo.
Explique como seria implementada a estimação da integral:
Explique com notação adequada o fundamento de cada um destes métodos.
As seguintes funções de importância que poderiam ser consideradas: \[ f_0(x) = 1/2, \, 0<x<2; \qquad f_1(x) = e^{-x}, \, 0 < x < \infty . \] Comente os resultados que seriam obtidos e como poderiam ser avaliados e comparados.