MCIE - Métodos Computacionais para Inferência Estatística

Exercícios para fixação, recomendo que usem o \(\texttt{R}\) e/ou o \(\texttt{wxMaxima}\) para auxiliar e verificar suas respostas.

1 Derivadas e aproximação em séries de Taylor

  1. Use o \(\texttt{R}\) para desenhar o gráfico das seguintes funções. Identifique o que o parâmetro controla da função. Tenha cuidado com o domínio de cada função. Em todos os casos x deve ser uma constante fixa. O gráfico deve ser feito em função de \(\theta\).
  1. \(f(x; \theta) = 2 \left ( x \log \frac{x}{\theta} - x + \theta \right )\).
  2. \(f(x; \theta) = \binom{100}{x} \exp \left \{ x \log \frac{\theta}{1-\theta} + 100 \log (1 - \theta) \right \}\).
  3. \(f(x; \theta) = 2\left ( \frac{x}{\theta} - \log \left \{ \frac{x}{\theta} \right \} -1 \right )\).
  4. \(f(x; \theta, p) = 2\left \{ \frac{x^{(2-p)}}{(1-p)(2-p)} - \frac{x \theta^{(1-p)}}{1-p} + \frac{\theta^{(2-p)}}{2-p} \right \}\).
  5. \(f(x; \theta, p) = 2\left \{ 1- \cos(x - \theta) \right \}\).
  1. Calcule a derivada analitica e numericamente das seguintes funções:
  1. \(f(x) = x^4\).
  2. \(f(x) = x^3\).
  3. \(f(x) = x^{-3}\).
  4. \(f(x) = \frac{1}{x^5}\).
  5. \(f(x) = \sqrt{x}\).
  6. \(f(x) = \sqrt[3]{x}\).
  7. \(f(x) = x^{1/3}\).
  8. \(f(x) = \frac{1}{x}\).
  9. \(f(x) = \sqrt[8]{x}\).
  10. \(f(x) = \frac{1}{x^2}\).
  11. \(f(x) = 4 x^3 + x^2\).
  12. \(f(x) = 5x^4 + 4\).
  13. \(f(x) = \frac{2x + 3}{x^2 + 1}\).
  14. \(f(x) = (3x^2 + 1)\exp^{x}\).
  15. \(f(x) = \sqrt[3]{x}\).
  16. \(f(x) = 5 x^4 + 6 x^3 + x^2 + 2\).
  17. \(f(x) = \exp{3x}\).
  18. \(f(x) = \sin{x^2}\).
  19. \(f(x) = (3x^2 + 1)^3\).
  20. \(f(x) = \log{(x^2 + 3)}\).
  21. \(f(x) = x^2 \exp^{3x}\).
  22. \(f(x) = \log{(x^2 + 3x + 9)}\).
  23. \(f(x) = \sqrt{x + \exp^{x}}\).
  1. Determine a reta tangente ao gráfico de \(f(x)\) no ponto requisitado e esboce o gráfico.
  1. \(f(x) = \frac{1}{x}\) no ponto de abscissa 2.
  2. \(f(x) = x^3\) nos pontos de abscissa -3 e 3.
  3. \(f(x) = \exp{x}\) no ponto de abscissa 0.
  4. \(f(x) = \log{x}\) no ponto de abscissa 2.
  1. Aproxime as seguintes funções usando a expansão de Taylor de segunda ordem. Esboce o gráfico da função e da aproximação.
  1. \(\sum_{i=1}^n (y_i - \mu)^2\). Fixe \(y_i = 2.09;-1.32;-0.20;0.05;-0.07\).
  2. \(\sum_{i=1}^n 2 \left ( y_i \log \frac{y_i}{\mu} + \mu - y_i \right )\). Fixe \(y_i = 7;4;4;6;5\).
  3. \(\sum_{i=1}^n 2 \left ( \frac{y_i}{\mu} - \log \frac{y_i}{\mu} - 1 \right )\). Fixe \(y_i = 2.35;0.16;0.56;1.05;0.51\).
  4. \(\sum_{i=1}^n 2 \left ( y_i \log \frac{y_i}{\mu} + (1- y_i) \log \frac{1-y_i}{1-\mu} \right )\). Fixe \(y_i = 1;0;1;1;1\).
  5. \(\sum_{i=1}^n 2 \left ( y_i \log \frac{y_i}{\mu} + (m + y_i) \log \frac{m + \mu}{m + y_i} \right)\). Fixe \(m = 1\) e \(y_i = 7;4;4;6;5\).
  1. Considerando as funções do exercício 4 encontre a reta tangente e esboce o gráfico da função com a reta em pelo menos três pontos que julgue adequado.

  2. Considerando as funções apresentadas no exercício 4 identifique o ponto de inflexão e verique se é um ponto de máximo ou mínimo.

  3. Sejam \(y_i\) valores observados para \(i = 1, \ldots, n\). Considere a função perda absoluta dada por \[ f(\mu) = \sum_{i=1}^n | y_i - \mu|.\]

  1. Usando o \(\texttt{R}\) ou qualquer outro software conveniente, simule um conjunto de valores adequado para \(y_i\).
  2. Esboce o gráfico da função perda para este conjunto de dados e diferente valores de \(\mu\).
  3. Encontre o valor de \(\mu\) que miniza a função perda absoluta.
  4. Discuta quando a funçao perda absoluta pode ser mais conveniente do que a função perda quadrática.
  1. Sejam \(y_i\) e \(x_i\) valores observados para \(i = 1, \ldots, n\). Considere o problema de ajustar uma reta relacionando \(y_i\) com \(x_i\), usando a função perda absoluta \[ f(\beta_0,\beta_1) = \sum_{i=1}^n | y_i - (\beta_0 + \beta_1 x_i)|.\]
  1. Usando o \(\texttt{R}\) ou qualquer outro software conveniente, simule um conjunto de valores adequado para \(y_i\) fixado um vetor para \(x_i\) .
  2. Esboce o gráfico da função perda para este conjunto de dados e diferentes valores de \(\beta_0\) e \(\beta_1\).
  3. Encontre o valor de \(\beta_0\) e \(\beta_1\) que miniza a função perda absoluta.
  4. Discuta quando a função perda absoluta pode ser mais conveniente do que a função perda quadrática.

2 Verossimilhança (Parte I)

  1. Seja \(X\) uma v.a. de uma distribuiçãoo de Poisson (\(X \sim P(\lambda)\)) para a qual foi obtida a seguinte amostra aleatória: (3, 1, 0, 2, 1, 1, 0, 0).
  1. Obtenha a função de verossimilhança, sua aproximação quadrática e intervalos de confiança (pelo menos duas formas) para \(\lambda\).
  2. Repita a questão anterior para a reparametrização \(\theta = \log(\lambda)\).
  3. Obtenha ainda (por pelo menos dois métodos diferentes) intervalos de confiança para o parâmetro \(\lambda\) a partir da função de verossimilhança (aproximada ou não) de \(\theta\).
  1. Seja \(X\) uma v.a. com distribuição binomial com \(n=12\). Obtenha a função de verossimilhança para cada uma das observações a seguir e desenhe todas em um mesmo gráfico, escalonado se necessário.
  1. \(x = 5\)
  2. \(x \leq 10\)
  3. \(3 \leq x \leq 7\)
  1. A fim de se obter uma estimativa do público de um jogo sem utilizar dados de venda de ingressos ou registros das roletas do estádio, foram distribuídas camisas especiais para 300 torcedores sob a condição que estes a utilizassem durante um jogo. Durante o jogo foram selecionados ao acaso 250 torcedores verificando-se que 12 destes possuiam a camisa.
  1. Obtenha a função de verossimilhança para o número total de torcedores.
  2. Obtenha a estimativa pontual e a intervalar, esta última por pelo menos dois métodos diferentes.
  3. Repita e compare os resultados caso fossem 500 camisas e 20 com camisas dentre os 250.
  1. Sejam os dados a seguir provenientes de uma amostra aleatória de \(X \sim N(\mu, \sigma^2)\), onde vamos assumir que \(\sigma^2\) é conhecido e com valor igual a da variância amostral. Considere as seguintes observações \[73 \;\;\; 75 \;\;\; 84 \;\;\; 76 \;\;\; 93 \;\;\; 79 \;\;\; 85 \;\;\; 80 \;\;\; 76 \;\;\; 78 \;\;\; 80. \] Denote os valores ordenados por \(x_{(1)}, x_{(1)}, x_{(2)}, \ldots x_{(11)}\) Obtenha e compare os gráficos da função de verossimilhança de \(\mu\) para os seguintes casos:
  1. O conjunto completo dos dados \(x_1, \ldots, x_{11}\) está disponível;
  2. Apenas a média amostral \(\bar{x}\) é fornecida;
  3. Apenas a mediana \(x_{(5)}\) é fornecida;
  4. Apenas os valores mínimo \(x_{(1)}\) e máximo \(x_{(n)}\) são fornecidos;
  5. Os quartis (\(Q_1\), \(Q_2\) e \(Q_3\)) são fornecidos.
  6. Apenas os dois menores valores \(x_{(1)}\) e \(x_{(2)}\) são fornecidos.
  1. O rendimento, \(X_i\), de um campo \(i\) de trigo é considerado como sendo normalmente distribuído com média \(\theta z_i\) onde \(z_i\) é uma quantidade conhecida de fertilizante aplicado no campo. Para um novo campo a quantidade de fertilizante pode ser escolhida, mas o rendimento é aleatório para uma dada quantidade de fertilizante. Presumindo-se que os rendimentos em diferentes campos são independentes (mas não identicamente distribuídos como mudanças no rendimento com a quantidade de fertilizante usada) uns dos outros. Deseja-se estimar o rendimento para uma proporção de fertilizante, isto é, a estimativa de \(\theta\). Especificamente, \(X_1, \ldots, X_n\) são variáveis aleatórias independentes com distribuição \[X_i \sim {\rm N}(\theta x Z_i, 1)\] para \(i = 1, \ldots,n\), onde \(z_1, \ldots, z_n\) são conhecidos (possivelmente diferentes) constantes positivas.
  1. Encontre \(\hat{\theta}\).
  2. Mostre que \(\hat{\theta}\) é um estimador não viesado, isto é, \(E(\hat{\theta})=\theta\) (lembre-se que os valores de \(z_i\) são constantes). Verifique suas respostas pegando \(z_i = 1\) para \(i=1, ...,n\).
  3. Suponha que o rendimento tenha a seguinte propriedade, \(X_1, ..., X_n\) são variáveis aleatórias independentes com distribuição \[ X_i{\sim} N(\theta Z_i, Z{_i}^2)\] para \(i = 1, ...,n\), onde \(z_i, ..., z_n\) são constantes conhecidas positivas. Encontre \(\hat{\theta}_l\), \(\hat{\theta}\) e \(\hat{\theta}_u\) com \(c^*=3,84\).
  4. Explique em palavras por que \(\hat{\theta}\) é diferente dos encontrados anteriormente.
  1. Considere um modelo exponencial de parâmetro \(\theta\). Encontre um intervalo de confiança para \(\theta\) por pelo menos dois métodos e faça um estudo de simulação para verificar a taxa de cobertura de cada método.

  2. Considere o modelo do exercício e uma reparametrização onde \(\lambda = 1/\theta\). Encontre o intervalo de confiança para \(\lambda\) por pelo menos três métodos e avalia a taxa de cobertura de cada um via simulação. Qual método você considera o melhor? Justifique.

3 Verossimilhança (Parte II)

  1. Foram tomadas as seguintes observações independentes de uma v.a. \(X \sim N(\mu, \sigma^2)\).
    • \(56,4 54,2 65,3 49,2 50,1 56,9 58,9 62,5 70,0 61,0.\)
    • Sabe-se que outras 5 observações são menores que 50.
    • Sabe-se que outras 3 observações são maiores que 65.
  1. Escrever a função de verossimilhança;
  2. Obter as estimativas de máxima verossimilhança;
  3. Obter as verossimilhanças perfilhadas;
  4. Obter os erro-padrão das estimativas.
  5. Obter a aproximação quadrática da verossimilhança.
  6. Obter intervaloes de confiança (verossimilhança e Wald) para os parâmetros.
  1. Seja \((x_1, y_1), \ldots, (x_n, y_n)\) uma amostra aleatória de uma distribuição normal bivariada com média zero e matriz de covariância: \[ \Sigma = \left[\begin{array}{ccc} 1 & \rho \\ \rho & 1 \end{array} \right] \]
  1. Mostrar que a matriz de informação de Fisher é dada por: \[\left(\begin{array}{cc} \frac{n}{\sigma^4} & -\frac{n\rho}{\sigma^2(1-\rho^2)} \\ -\frac{n\rho}{\sigma^2(1-\rho^2)} & \frac{n(1+\rho^2)}{(1-\rho^2)} \end{array}\right) \]
  2. Considere os dados a seguir assumindo que a média é conhecida no valor observado de forma que os valores podem ser centrados. Obtenha a verossimilhança conjunta de \((\sigma^2, \rho)\). Compare \(I_{22}\) com \(I^{-1}_{22}\) e comente os resultados.
x y x y
109 116 88 77
96 95 96 79
109 113 116 122
114 109 96 94
85 91 100 88
113 115 117 119
107 100 104 115
101 95 81 90
  1. Investigue como a aproximação quadrática se comporta neste problema. Tente transformações de \(\rho\) e \(\sigma^2\) para obter uma função de verossimilhança mais regular.
  2. A chamada transformação \(z\) de Fisher da correlação amostral \[ z = \frac{1}{2} \log \frac{1 + \hat{\rho}}{1 - \hat{\rho}} \] é aproximadamente normal com \[ E[Z] = \frac{1}{2} \log \frac{1 + \hat{\rho}}{1 - \hat{\rho}} \;\;\; \mbox{e} \;\;\; {\rm Var}[Z] \frac{1}{n-3}. \]
  3. Compare a verossimilhança de \(\rho\) baseada na transformação \(z\) de Fisher com a verossimilhança perfilhada.
  1. Considere os dados da tabela a seguir (adaptados/modificados de Montgomery & Runger, 1994) aos quais deseja-se ajustar um modelo de regressão linear simples relacionando a variável resposta \(Y\) (pureza em %) a uma variável explicativa \(X\) (nível de hidrocarbonetos).
x y x y
0.99 90.01 1.19 93.54
1.02 89.05 1.15 92.52
1.15 91.43 0.98 90.56
1.29 93.74 1.01 89.54
1.46 96.73 1.11 89.85
1.36 94.45 1.20 90.39
0.87 87.59 1.26 93.25
1.23 91.77 1.32 93.41
1.55 99.42 1.43 94.98
1.40 93.65 0.95 87.33
  1. Encontre a função de verossimilhança.
  2. Encontre as estimatívas de máxima verossimilhança.
  3. Obtenha a verossimilhança conjunta para os parâmetros \(\beta_0\) e \(\beta_1\):
    • Considerando \(\sigma\) fixo com valor igual à sua estimativa,
    • Obtendo a verossimilhança (conjunta - 2D) perfilhada em relação a \(\sigma\)
  4. Obtenha a verossimilhança perfilhada para os parâmetros \(\beta_0\) e \(\beta_1\) individualmente.
  1. Repetir o exercício anterior porém considerando os dados modificados como indicado na da tabela a seguir.
x y x y
0.99 90.01 1.19 >92.5
1.02 <90 1.15 92.52
1.15 91.43 0.98 90.56
1.29 [91, 95] 1.01 89.54
1.46 96.73 1.11 89.85
1.36 94.45 1.20 [89, 93]
0.87 87.59 1.26 93.25
1.23 91.77 1.32 93.41
1.55 [96, 100] 1.43 >93
1.40 93.65 0.95 87.33
25px