====== Exercícios recomendados da CE-223 Estatística computacional, 2008 ====== O [[http://leg.ufpr.br/~paulojus/ce223/ce223/|material de apoio do curso]] possui vários exercícios ao final de cada seção. Os exercicios a seguir são //complementos// aos do material. ==== Aula 25/02 ==== - Fazer um gráfico da função de probabilidade de uma v.a. X \sim Bin(n=10, p=0.03) - Fazer um gráfico da função de densidade de probabilidade de uma v.a. X \sim N(70, 10^2) ==== Aula 27/02 ==== - Mostrar o comando para obter uma sequência dos múltiplos de 10 até 200. - Criar um vetor ''a1'' com os elementos ''(23, 45, 21, 29, 40, 22, 29, 37, 44, 37, 31, 33, 36)'' - Extrair os elementos de ''a1'' que sejam maiores que 30. - Extrair os elementos de ''a1'' que sejam menores que 25 ou maiores que 40. Guardar estes valores em um vetor ''a2'' - Extrair os elementos de ''a1'' que sejam maiores que 30 e menores que 40. - Obter as posições dos elementos de ''a1'' que sejam menores que 30 - Obter a posição do maior elemento da ''a1'' - Obter a posição do menor elemento da ''a1'' - Criar um vetor ''a3'' com os elementos de ''a1'' para os quais o resto da divisão por 3 seja igual a 2. (Dica: o operador ''% %'' fornece o resto da divisão, veja exemplo a seguir). > 14 %% 3 [1] 2 > 18 %% 3 [1] 0 > 22 %% 3 [1] 1 - Extrair os elementos de ''a1'' que sejam múltiplos de 4 - Substituir em ''a1'' os elementos iguais a 37 pelo valor 36 - Substituir em ''a1'' os elementos maiores que 40 pelo código de //valor perdido// ''NA'' - Obter as posições de ''a1'' onde estão os valores perdidos - Crie um vetor chamado ''sexo'' com os comandos a seguir: sexo <- c(1, 2, 2, 2, 1, 2, 1, 1, 1, 2, 2, 1, 2) sexo <- factor(sexo, lev=1:2, lab=c("M","F")) - Obter as posições em ''sexo'' que possuem o valor ''“M“'' - Obter os valores de ''a1'' para os quais o valor correspondente em ''sexo'' é ''“M“'' - Obter os valores de ''a1'' para os quais o valor correspondente em ''sexo'' é ''“F“'' - Descrever o resultado de cada um dos comandos a seguir: sort(a1) order(a1) a1[order(a1)] sort(a1, dec = TRUE) - Criar um objeto ''a1.ord'' com os elementos de ''a1'' em ordem crescente - Ordenar os objetos de ''a1'' de forma a exibir primeiro todos os elementos correpondentes a ''“M“'' e depois os correspondentes a ''“F“'' - Criar um objeto chamado ''notas'' que possua os elementos de ''a1'' com valores correspondentes de ''sexo'' sendo ''“M“'' ordenados de forma crescente, seguidos pelos correspondentes a ''“F“'' também ordenados de forma crescente. Em outras palavras, o objeto notas deverá ter as notas dos homes ordenadas seguidas pelas das mulheres também ordenadas. - Criar um vetor com os seguinte elementos: ''(1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500)'' - Adicionar o valor ''55'' entre os valores ''50'' e ''60'' do vetor criado acima ==== Aula 25/02 ==== A //função Gamma// é uma função importante em várias áreas da matemática e com diversas aplicações em estatística, sendo dada por:\\ \Gamma(\alpha) = \int_0^{\infty} e^{-x} x^{\alpha -1} dx com \alpha > 0. Da definição decorrem as seguintes propriedades: * \Gamma(\alpha+1) = \alpha \Gamma(\alpha) * Se \alpha = n é um número inteiro, então \Gamma(n) = (n-1)! * \Gamma(1) = 1 * \Gamma(1/2) = \sqrt{\pi} - Obtenha usando o R o resultado da combinação de 10 elementos tomados 4 a 4 de três formas diferentes: * usando a função ''choose()'' * usando a função ''factorial()'' * usando a função ''gamma()'' - digite na linha de comando do R: factorial desta forma será mostrado o código da função. Note que a função ''factorial()'' na verdade utiliza a função ''gamma()'' e a segunda propriedade mencionada acima para processar os cálculos. - Obtenha um gráfico da função de densidade de probabilidade da distribuição \chi^2, três graus de liberdade, de duas formas diferentes: * utilizando operações algébricas com a expressão da f.d.p. * utilizando a função ''dchisq()'' - Obtenha um gráfico de formas análogas às do exercício anterior para a distribuição ''t'' com 9 graus de liberdade. - Considere o exercício da distribuição binomial da primeira aula do curso e discutido na aula desta semana. Experimente utilizar o comando ''plot()'' com o uso do argumento ''type'' com cada uma das opções: ''type = “p“'', ''type = “l“'', ''type = “b“'', ''type = “c“'', ''type = “o“'', ''type = “h“'', ''type = “s“'', ''type = “S“'', ''type = “n“''. Verifique os resultados produzidos e: * descreva o tipo de gráfico produzido com cada opção * discuta exemplos de situações onde o uso de cada um destes tipos de gráficos seria adequado ==== Aula 30/04 ==== - Ilustre via simulação o seguinte resultados, * Se $Z \sim N(0,1)$ então $Z^2 \sim\chi^2_1$. * Se $Z_1,\dots,Z_n\sim N(0,1)$ então \sum Z_i^2 \sim\chi^2_n$. * Se $Y_1,\dots,Y_n\sim N(\mu,\sigma^2)$ então $(1/n)\sum Y_i\sim N(\mu,\sigma^2/n)$. * Se $Y_1,\dots,Y_n\sim N(\mu,\sigma^2)$ e $S2 = \sum(Y_i-\bar{Y})^2/(n-1)$ então $V = (n-1)S2 ∕ \sigma^2\sim\chi^2_{n-1}$. Compare os valores teóricos $E[S2] = \sigma^2$ e $Var[S2] = 2\sigma^2 / (n-1)$ com os valores obtidos na simulação. - Considere uma distribuição N(0,1) e amostras de tamanho n = 20 desta distribuição. Sejam dois estimadores: T1, a média amostral e T2 a mediana amostral. Avalie e compare através de simulações a eficiência dos dois estimadores. É possível identificar o mais eficiente? Qual a eficiência relativa? Repita o procedimento com diferentes tamanhos de amostra e verifique o efeito do tamanho da amostra na eficiência relativa. - Ilustrar o resultado que diz que o quociente de duas variáveis independentes com distribuição qui-quadrado tem distribuição F. ==== Aula 07/05 ==== Este exercício tem como objetivo treinar o uso do \LaTeX na confecção de um relatório de análise estatística. Considere o conjunto de dados {{disciplinas:milsa.dat|''milsa''}} do livro de Bussab e Moretin. Confeccione um texto com um relatório de análise destes dados que contenha: - estatísticas descritivas de cada uma das variáveis. Colocar as medidas resumo ao longo do texto tal como em: ... na amostra de 200 pessoas observou-se que 134 (67%) eram do sexo masculino e 66 (33%) do sexo feminino ... - pelo menos duas figuras sendo que uma deve conter apenas um gráfico e outra deve conter dois gráficos lado a lado, - uma tabela de frequências para uma variável quantitativa - pelo uma tabela de associação entre duas variáveis qualitativas, bem como a medida de \chi^2 associada a essa tabela. - pelo menos três formulas referentes ao que está sendo calculado para o relatório. As análises devem ser feitas no programa R. Guarde o arquivo com código/comandos utilizado para gerar os resultados incluídos no relatório.