Questão 1

(1,5) Seja uma variável aleatória \(Y\) com f.d.p. \(f(y) = 2 - 2y\) e \(0 \leq y \leq 1\).

Explique, deduzindo expressões, como podem ser geradas amostras desta variável aleatória pelo método da inversa da distribuição acumulada, fornecendo ainda código ou algoritmo.
Mostre como calcular analiticamente e por simulação:
- a probabilidade de que \(Y\) seja maior que 0.6.
- a média da v.a.

Questão 2

(2,0) Identifique e descreva o que está sendo simulado nos códigos a seguir. Esboce o gráfico das variáveis simuladas. Em todos os casos considere \(N = 10000\).

Código 1

u <- runif(N)
v <- runif(N)
z1 <- sqrt(-2*log(u)) * cos(2*pi*v)
z2 <- sqrt(-2*log(u)) * sin(2*pi*v)
t <- z1^2 + z2^2

Código 2

x1 <- matrix(-log(runif(5*N))/1.5, ncol = 5)
x2 <- matrix(-log(runif(3*N))/1.5, ncol = 3)
x3 <- rowSums(x1)
x4 <- rowSums(x2)
x5 <- x3/(x3+x4)

Código 3

y1 <- rgamma(N, 5, 2)
y2 <- rpois(N, lambda = y1)
mean(y2)
mean(y2[y2 > 0])
mean(y2 > 0)

Código 4

y1 <- rnorm(N, 175, 3)
y2 <- rnorm(N, 165, 3)
y3 <- y1 + y2
y4 <- (y1 + y2)/2
u <- runif(N)
y5 <- ifelse(u < 0.4, y1, y2)

Questão 3

(1,0) Considere o problema de tomar uma amostra de tamanho 10 da distribuição exponencial (\(Y \sim {\rm Exp}(\theta)\)). Vai ser utilizado o intervalo de confiança para fazer inferência sobre o parâmetro da distribuição. Para obter o intervalo de confiança para estimativa considera-se três possibilidades: a) intervalo de Wald (assintótico), b) intervalo baseado na razão de verossimilhança e c) intervalo de verossimilhança a partir da transformação do parâmetro, por exemplo \(\phi = \log(\theta)\). Descreva como os métodos para obter os intervalos podem ser comparados fornecendo um passo a passo e (pseudo-)código.

Questão 4

(2,0) Simulações de Monte Carlo podem ser usadas para estimar/aproximar quantidades relacionadas a distribuições de probabilidades. Os comandos a seguir ilustram tal fato com diversas aproximações. Em cada item fornecer:

a quantidade sendo calculada, utilizando notação adequada;
resultados teóricos ou comandos (no caso de probabilidades ou quantis) para cálculos sem aproximação por simulação;
respostas a comentários (quando solicitado).

yg <- rgamma(1e4, 15, 5)                
mean(yg)                           ## 1a.
mean(yg > 6)                       ## 1b.
mean(yg > 2.5 & yg < 4.5)          ## 1c.
mean(yg[yg < 3] > 1.5)             ## 1d.
mean(yg[yg > 3])                   ## 1e.
100*sd(yg)/mean(yg)                ## 1f.
quantile(yg, prob = 0.95)          ## 1g. 
diff(quantile(yg, prob = c(0.25, 0.75))) ## 1h. 
temp <- yg[yg < 4] 
mean(temp > 1.5 & temp < 3)        ## 1i. 
var(yg[yg > 3 & yg < 10])          ## 1j.
##
x <- rnorm(1e4, m = 70, sd = 5)    ## 2a.
mean(x)                            ## 2b.
mean(x > 80)                       ## 2c.
mean(x[x > 70])                    ## 2d.
##
mus <- rnorm(1e4, 70, 3)           ## 2e. 
y <- rnorm(1e4, m = mus, sd = 5)   ## 2f. (difere de 2a? justifique.)    
mean(y)                            ## 2g. (difere de 2b? justifique.)
mean(y > 80)                       ## 2h. (difere de 2c? justifique.)
mean(y[y > 70])                    ## 2i. (difere de 2d? justifique.)

Questão 5

(1,0) Explique a diferença entre o bootstrap paramétrico e não paramétrico. Use um exemplo em comum entre os métodos. Forneça explicações e código/pseudocódigo ou algoritmo.

Questão 6

(1,0) Um corretor de seguros fecha em média 2,5 contratos por dia e é razoável assumir que o número diário de contratos fechados possui distribuição Poisson. Os contratos possuem valores, em milhares de reais, que seguem uma distribuição gama de parâmetros \(\alpha = 3\) e \(\beta = 0,5\). Deseja-se obter informações sobre a receita, tais como: receita esperada diária, semanal (considerar 5 dias úteis) e mensal (considerar 20 dias úteis) e os respectivos desvios padrão. Também há interesse em saber a proporção de semanas a receita não ultrapassa 20 mil reais, a probabilidade da receita ultrapassar o valor de 50000 e receita que deve ser atingida em pelo menos 80% dos dias, semanas e meses. Explique como uma simulação poderia ser utilizada para obter estimativas de interesse mencionadas e forneça (pseudo-)código/algoritmo para simulação.

Questão 7

(1,5) Considere a densidade \(f(y) = 1.5 y^2\) com \(-1 < y < 1\). Deseja-se obter simulações desta densidade utilizando o método da amostragem por rejeição. Escolha uma distribuição “proposal” conveniente. Forneça os passos do algorítmo deduzindo/mostrando como calcular as expressões e valores envolvidos. Explique, comparativamente, como seria um algorítmo MCMC (Metrópolis) para este caso.

Questão 8 (bônus)

Seja uma variável aleatória \(Y\) com densidade de probabilidade \(f(y)\) e distribuição acumulada \(F(y)\) e seja Prove que:

\(F(y) \sim U(0, 1)\).
\(F^{-1}(u)\) é uma simulação \(y\) da variável \(Y\), em que \(u\) é uma simulação de \(U \sim U(0,1)\).

CE-312: Estatística Computacional

Prova Final

09 Julho 2025