CE 083 - Estatística Computacional I

Sumário

Probabilidades.

Autores e licença

Paulo Justiniano Ribeiro Jr., Fernando de Pol Mayer, Walmes Marques Zeviani

Este obra está licenciado com uma Licença Creative Commons Atribuição-NãoComercial-CompartilhaIgual 4.0 Internacional.

Probabilidade no R

Conceitos básicos sobre distribuições de probabilidade

O objetivo desta sessão é mostrar o uso de funções do R em problemas de probabilidade. Exercícios que podem (e devem!) ser resolvidos analiticamente, serão utilizados para ilustrar o uso do programa e alguns de seus recursos para análises numéricas.

Os problemas desta sessão foram retirados do livro de Bussab e Morettin (2003).

Exemplo 1. (Adaptado de Bussab e Morettin, página 166, exercício 1)

Dada a função

$$ \ f(x) = \left\{ \begin{array}{ll} 2 e^{-2x} & \mbox{ , se $ \; x \geq 0$} \cr 0 & \mbox{ , se $ \; x < 0$} \end{array} \right. \ $$

Mostre que está função é uma f.d.p.
Calcule a probabilidade de que X > 1
calcule a probabilidade de que 0.2 < X < 0.8

Para ser f.d.p. a função não deve ter valores negativos e deve integrar 1 em seu domínio. Vamos começar definindo esta função como uma função no R para qual daremos o nome de f1.

R source

f1 <- function(x){
    fx <- ifelse(x < 0, 0, 2 * exp(-2 * x))
    return(fx)
}

A seguir fazemos o gráfico da função. Como a função tem valores positivos para x no intervalo de zero a infinito, temos que definir um limite em x até onde vai o gráfico da função. Vamos achar este limite tentando vários valores, conforme mostram os comandos abaixo.

R source

par(mfrow = c(2, 2))
plot(f1)
plot(f1, from = 0, to = 5)
plot(f1, from = 0, to = 7)
plot(f1, from = 0, to = 10)
par(mfrow = c(1, 1))

Para verificar que a a integral da função é igual a 1 podemos usar a função integrate(), que efetua integração numérica. A função recebe como argumentos o objeto com a função a ser integrada e os limites de integração. Neste exemplo o objeto é f1 definido acima, e o domínio da função é [0, ∞]. A saída da função mostra o valor da integral acima, e o erro máximo da aproximação numérica.

R source

integrate(f1, lower = 0, upper = Inf)

R output

1 with absolute error < 5e-07

Para fazer cálculos pedidos nos itens (b) e (c) lembramos que a probabilidade é dada pela área sob a curva da função no intervalo pedido. Desta forma as soluções seriam dadas pelas expressões

$$ \begin{eqnarray*} p_b & = & P(X > 1) = \int_1^\infty f(x) dx = \int_1^\infty 2\,e^{-2x} dx \\ p_c & = & P(0,2 < X < 0,8) = \int_{0,2}^{0,8} f(x) dx = \int_{0.2}^{0.8} 2\,e^{-2x} dx \, \end{eqnarray*} $$

cuja representação gráfica é mostrada na abaixo.

Os comandos a seguir mostram como fazer o gráfico dessas funções. O comando plot() desenha o gráfico principal, e para destacar as áreas que correspondem às probabilidades pedidas vamos usar a função polygon(). Esta função adiciona a um gráfico um polígono que é definido pelas coordenadas de seus vértices. Para sombrear a área usa-se o argumento density. Finalmente, para escrever um texto no gráfico usamos a função text() com as coordenadas de posição do texto.

R source

plot(f1, from = 0, to = 5)
polygon(x = c(1, seq(1, 5, length.out = 20)),
        y = c(0, f1(seq(1, 5,length.out = 20))),
        density = 10) 
polygon(x = c(0.2, seq(0.2, 0.8, length.out = 20), 0.8),
        y = c(0, f1(seq(0.2, 0.8, length.out = 20)), 0),
        col = "gray") 
text(x = c(1.2, 0.5), y = c(0.1, 0.2),
     c(expression(p[b], p[c])))

E para obter as probabilidades pedidas usamos integrate().

R source

integrate(f1, lower = 1, upper = Inf)

R output

0.1353353 with absolute error < 2.1e-05

R source

integrate(f1, lower = 0.2, upper = 0.8)

R output

0.4684235 with absolute error < 5.2e-15

Distribuições de Probabilidade

O R inclui funcionalidade para operações com distribuições de probabilidades. Para cada distribuição há 4 operações básicas indicadas pelas letras:

d calcula a densidade de probabilidade f(x) no ponto
p calcula a função de probabilidade acumulada F(x) no ponto
q calcula o quantil correspondente a uma dada probabilidade
r retira uma amostra aleatória da distribuição

Para usar os funções deve-se combinar uma das letras acima com uma abreviatura do nome da distribuição. Por exemplo, para calcular probabilidades usamos: pnorm() para normal, pexp() para exponencial, pbinom() para binomial, ppois() para Poisson e assim por diante.

Vamos ver com mais detalhes algumas distribuições de probabilidades.

Distribuição Normal

A funcionalidade para distribuição normal é implementada por argumentos que combinam as letras acima com o termo norm. Vamos ver alguns exemplos com a distribuição normal padrão. Por default as funções assumem a distribuição normal padrão N(μ = 0, σ² = 1).

R source

dnorm(-1)

R output

[1] 0.2419707

R source

pnorm(-1)

R output

[1] 0.1586553

R source

qnorm(0.975)

R output

[1] 1.959964

R source

rnorm(10)

R output

 [1] -0.7143903 -0.1722713  0.9316568 -0.5312347 -0.4321843  0.2112648
 [7] -1.2954443 -1.3060764 -0.9986754 -1.9102844

O primeiro valor acima, de dnorm(-1), corresponde ao valor da densidade da normal

$$ f(x) = \frac{1}{\sigma\sqrt{2 \pi}}\exp \left[ -\frac{1}{2} \left( \frac{x - \mu}{\sigma} \right)^2 \right] $$

com parâmetros (μ = 0, σ² = 1) no ponto x = −1. Portanto, o mesmo valor seria obtido substituindo x por −1 na expressão da normal:

R source

mu <- 0
sigma <- 1
x <- -1
(1/(sigma * sqrt(2*pi))) * exp((-1/2) * ((x - mu)/sigma)^2)

R output

[1] 0.2419707

A função pnorm(-1) calcula a probabilidade P(X ≤ −1). O comando qnorm(0.975) calcula o valor de a tal que P(X ≤ a)=0.975. Finalmente, o comando rnorm(10) gera uma amostra aleatória de 10 elementos da normal padrão. Note que os valores que você obtém rodando este comando podem ser diferentes dos mostrados acima.

As funções acima possuem argumentos adicionais, para os quais valores padrão (default) foram assumidos, e que podem ser modificados. Usamos args() para ver os argumentos de uma função e help() para visualizar a documentação detalhada:

R source

args(rnorm)

R output

function (n, mean = 0, sd = 1) 
NULL

As funções relacionadas à distribuição normal possuem os argumentos mean e sd para definir média e desvio padrão da distribuição que podem ser modificados como nos exemplos a seguir. Note nestes exemplos que os argumentos podem ser passados de diferentes formas.

R source

qnorm(0.975, mean = 100, sd = 8)

R output

[1] 115.6797

R source

qnorm(0.975, m = 100, s = 8)

R output

[1] 115.6797

R source

qnorm(0.975, 100, 8)

R output

[1] 115.6797

Observação: na segunda linha de comando acima, foi utilizado um recurso do R chamado partial matching. Isso significa que nomes de argumentos de funções podem ser especificados pelo seu nome parcial, ou seja, com apenas o início do nome, desde que não haja ambiguação com outros argumentos.

Para informações mais detalhadas pode-se usar help(). O comando

R source

help(rnorm)

irá exibir em uma janela a documentação da função que pode também ser chamada com ?rnorm. Note que ao final da documentação são apresentados exemplos que podem ser rodados pelo usuário e que auxiliam na compreensão da funcionalidade. Note também que as 4 funções relacionadas à distribuição normal são documentadas conjuntamente, portanto help(rnorm), help(qnorm), help(dnorm) e help(pnorm) irão exibir a mesma documentação.

Cálculos de probabilidades usuais, para os quais utilizávamos tabelas estatísticas podem ser facilmente obtidos como no exemplo a seguir.

Seja X uma VA com distribuição N(100, 100). Calcular as probabilidades:

P[X < 95]
P[90 < X < 110]
P[X > 95]

Calcule estas probabilidades de forma usual, usando a tabela da normal. Depois compare com os resultados fornecidos pelo R. Os comandos do para obter as probabilidades pedidas são:

R source

## P[X < 95]
pnorm(95, 100, 10)

R output

[1] 0.3085375

R source

## P[90 < X < 110]
pnorm(110, 100, 10) - pnorm(90, 100, 10)

R output

[1] 0.6826895

R source

## P[X > 95] = 1 - P[X < 95]
1 - pnorm(95, 100, 10)

R output

[1] 0.6914625

R source

pnorm(95, 100, 10, lower.tail = FALSE) # melhor

R output

[1] 0.6914625

Note que a última probabilidade foi calculada de duas formas diferentes, a segunda usando o argumento lower.tail que implementa um algorítmo de cálculo de probabilidades mais estável numericamente, e essa forma é preferida no lugar de usar o complementar.

A seguir vamos ver comandos para fazer gráficos de distribuições de probabilidade. Vamos fazer gráficos de funções de densidade e de probabilidade acumulada. Estude cuidadosamente os comandos abaixo e verifique os gráficos por eles produzidos.

A figura abaixo mostra gráficos da densidade (esquerda) e probabilidade acumulada (direita) da normal padrão, produzidos com os comandos a seguir. Para fazer o gráfico consideramos valores de X entre -3 e 3 que correspondem a +/- três desvios padrões da média, faixa que concentra 99,73% da massa de probabilidade da distribuição normal.

R source

par(mfrow = c(1, 2))
plot(dnorm, from = -3, to = 3)
plot(pnorm, from = -3, to = 3)
par(mfrow = c(1, 1))

VEJA a página de ajuda da função plot.function() para entender os argumentos e demais funcionalidades desta função gráfica para plotar gráficos de funções

A seguinte figura mostra gráficos da densidade (esquerda) e probabilidade acumulada (direita) da N(100, 64). Para fazer estes gráficos tomamos uma sequência de valores de X entre 70 e 130 e para cada um deles calculamos o valor das funções f(x) e F(x). Depois unimos os pontos (x, f(x)) em um gráfico e (x, F(x)) no outro.

R source

par(mfrow = c(1, 2))
x <- seq(70, 130, length.out = 100)
fx <- dnorm(x, 100, 8)
plot(x, fx, type = "l")
Fx <- pnorm(x, 100, 8)
plot(x, Fx, type = "l")
par(mfrow = c(1, 1))

Note que, alternativamente, os mesmos gráficos poderiam ser produzidos com os comandos a seguir, onde fazemos usa da função plot.function().

R source

par(mfrow = c(1, 2))
plot(function(x) dnorm(x, 100, 8), from = 70, to = 130)
plot(function(x) pnorm(x, 100, 8), from = 70, to = 130)
par(mfrow = c(1, 1))

Comandos usuais do R podem ser usados para modificar a aparência dos gráficos. Por exemplo, podemos incluir títulos e mudar texto dos eixos conforme mostrado abaixo.

R source

plot(dnorm, from = -3, to = 3,
     xlab = "Valores de X",
     ylab = "Densidade de probabilidade")
title("Distribuicão Normal\nX ~ N(100, 64)")

Os demais comandos abaixo mostram como colocar diferentes densidades em um mesmo gráfico, usando o argumento add = TRUE.

R source

plot(function(x) dnorm(x, 100, 8), 60, 140, ylab = 'f(x)')
plot(function(x) dnorm(x, 90, 8), 60, 140, add = TRUE, col = 2)
plot(function(x) dnorm(x, 100, 15), 60, 140, add = TRUE, col = 3)
legend(120, 0.05, fill = 1:3,
       legend = c("N(100,64)", "N(90,64)", "N(100,225)"))

Distribuição Binomial

Cálculos para a distribuição binomial são implementados combinando as letras básicas vistas acima com o termo binom. Vamos primeiro investigar argumentos e documentação com args() e help().

R source

args(dbinom)

R output

function (x, size, prob, log = FALSE) 
NULL

R source

help(dbinom)

Seja X uma VA com distribuição Binomial, com n = 10 e p = 0.35. Vamos ver os comandos do R para:

Fazer o gráfico da função de densidade
Idem para a função de probabilidade
Calcular P[X = 7]
Calcular P[X ≤ 7]
Calcular P[X > 7]
Calcular P[3 < X ≤ 6]

Note que sendo uma distribuição discreta de probabilidades os gráficos são diferentes dos obtidos para distribuição normal e os cálculos de probabilidades devem considerar as probabilidades nos pontos. Os gráficos das funções de densidade e probabilidade são mostrados abaixo.

R source

par(mfrow = c(1, 2))
x <- 0:10
fx <- dbinom(x, size = 10, prob = 0.35)
plot(x, fx, type = "h")
Fx <- pbinom(x, size = 10, prob = 0.35)
plot(x, Fx, type = "s")
par(mfrow = c(1, 1))

As probabilidades pedidas são obtidas com os comandos a seguir.

R source

## P[X = 7]
dbinom(7, size = 10, prob = 0.35)

R output

[1] 0.02120302

R source

## P[X <= 7]
pbinom(7, size = 10, prob = 0.35)

R output

[1] 0.9951787

R source

# OU
sum(dbinom(0:7, size = 10, prob = 0.35))

R output

[1] 0.9951787

R source

## P[X > 7]
1 - pbinom(7, size = 10, prob = 0.35)

R output

[1] 0.004821265

R source

pbinom(7, size = 10, prob = 0.35, lower.tail = FALSE) # melhor

R output

[1] 0.004821265

R source

## P[3 < X <= 6]
pbinom(6, 10, 0.35) - pbinom(3, 10, 0.35)

R output

[1] 0.4601487

R source

# OU
sum(dbinom(4:6, 10, 0.35))

R output

[1] 0.4601487

Distribuição de Poisson

Definição: Seja um experimento realizado nas seguintes condições: i. As ocorrências são independentes ii. As ocorrências são aleatórias iii. A variável aleatória X é o número de ocorrências de um evento ao longo de algum intervalo} (de tempo ou espaço)

Denominamos esse experimento de processo de Poisson. Vamos associar a V.A. X o número de ocorrências em um intervalo. Portanto X poderá assumir os valores 0, 1, …, (sem limite superior).

A distribuição de Poisson é utilizada para descrever a probabilidade do número de ocorrências em um intervalo contínuo (de tempo ou espaço). No caso da distribuição binomial, a variável de interesse era o número de sucessos em um intervalo discreto (n ensaios de Bernoulli). A unidade de medida (tempo ou espaço) é uma variável contínua, mas a variável aleatória, o número de ocorrências}, é discreta.

Uma V.A. X segue o modelo de Poisson se surge a partir de um processo de Poisson, e sua função de probabilidade} for dada por

$$ P[X = x] = \frac{e^{-\mu} \mu^x}{x!}, \quad \quad x = 0, 1, \ldots $$

onde

μ = λ ⋅ t

O parâmetro μ indica a taxa de ocorrência (λ) por unidade de medida (t), ou seja,

λ = taxa de ocorrência e t = intervalo de tempo ou espaço

Notação: X ∼ Pois(μ)
Esperança e variância: E(X)=μ = Var(X)

Alguns exemplos de gráficos da distribuição de Poisson com diferentes valores do parâmetro μ.

R source

par(mfrow=c(2,2))
plot(0:30, dpois(x = 0:30, lambda = 1), type = "h",
     xlab = "X", ylab = "P[X = x]", main = expression(mu == 1),
     ylim = c(0,.4))
plot(0:30, dpois(x = 0:30, lambda = 5), type = "h",
     xlab = "X", ylab = "P[X = x]", main = expression(mu == 5),
     ylim = c(0,.4))
plot(0:30, dpois(x = 0:30, lambda = 10), type = "h",
     xlab = "X", ylab = "P[X = x]", main = expression(mu == 10),
     ylim = c(0,.4))
plot(0:30, dpois(x = 0:30, lambda = 15), type = "h",
     xlab = "X", ylab = "P[X = x]", main = expression(mu == 15),
     ylim = c(0,.4))

Exemplo: As chamadas telefônicas chegam a uma delegacia de polícia à uma taxa de 8 chamadas por hora, em dias úteis.
1. Quantas chamadas de emergência são esperadas em um período de 15 minutos?
2. Qual a probabilidade de nenhuma chamada em um período de 15 minutos?
3. Qual a probabilidade de ocorrer pelo menos duas chamadas no período de 15 minutos?
4. Qual a probabilidade de ocorrer exatamente duas chamadas em 20 minutos?
  R source
```
## a) E(X) = mu = lambda . t
lambda <- 8/60 # 8 chamadas/60 minutos
t <- 15 # 15 minutos
(mu <- lambda * t)
```
  R output
```
[1] 2
```
  R source
```
## b) P[x = 0]
ppois(0, mu)
```
  R output
```
[1] 0.1353353
```
  R source
```
dpois(0, mu)
```
  R output
```
[1] 0.1353353
```
  R source
```
## c) P[X >= 2] = 1 - P[X < 2]
1 - ppois(1, mu)
```
  R output
```
[1] 0.5939942
```
  R source
```
ppois(1, mu, lower.tail = FALSE)
```
  R output
```
[1] 0.5939942
```
  R source
```
## d) P[X = 2]
t <- 20
(mu <- lambda * t)
```
  R output
```
[1] 2.666667
```
  R source
```
dpois(2, mu)
```
  R output
```
[1] 0.2470523
```

Exemplo: Suponha que 150 erros de impressão são distribuídos aleatoriamente em um livro de 200 páginas. Encontre a probabilidade de que em 2 páginas contenham:

nenhum erro de impressão
três erros de impressão

um ou mais erros de impressão

R source

## lambda = taxa de ocorrência por página
lambda <- 150/200
## intervalo de interesse
t <- 2
## Parâmetro mu = lambda . t
(mu <- lambda * t)

R output

[1] 1.5

R source

## a) P[X = 0]
dpois(0, mu)

R output

[1] 0.2231302

R source

## b) P[X = 3]
dpois(3, mu)

R output

[1] 0.1255107

R source

## c) P[X >= 1] = 1 - P[X < 1]
1 - ppois(0, mu)

R output

[1] 0.7768698

R source

ppois(0, mu, lower.tail = FALSE)

R output

[1] 0.7768698

Distribuição Uniforme

Uniforme Contínua

Para a distribuição uniforme contínua usa-se as funções *unif() onde * deve ser p, q, d ou r como mencionado anteriormente. Nos comandos a seguir inspecionamos os argumentos, sorteamos 5 valores da U(0, 1) e calculamos a probabilidade acumulada até 0,75.

R source

args(runif)

R output

function (n, min = 0, max = 1) 
NULL

R source

runif(5)

R output

[1] 0.64731315 0.07294168 0.70453000 0.47245211 0.90341242

R source

punif(0.75)

R output

[1] 0.75

Portanto, o default é uma distribuição uniforme no intervalo [0, 1] e os argumentos opcionais são min e max. Por exemplo, para simular 5 valores de X ∼ U(5, 20) usamos:

R source

runif(5, min = 5, max = 20)

R output

[1] 16.947705  6.263517 12.201244  6.117142  9.282737

Uniforme Discreta

Não há entre as funções básicas do R uma função específica para a distribuição uniforme discreta com opções de prefixos r, d, p e d, provavelmente devido a sua simplicidade, embora algumas outras funções possam ser usadas. Por exemplo para sortear números pode-se usar sample(), como no exemplo a seguir onde são sorteados 15 valores de uma uniforma discreta com valores (inteiros) entre 1 e 10 (X ∼ U_d(1, 10)).

R source

sample(1:10, size = 15, replace = TRUE)

R output

 [1] 10  5  4  7  7  9 10  7  7  7  1  5  3  4  4

A função `sample()`

A função sample() não é restrita à distribuição uniforme discreta, podendo ser usada para sorteios, com ou sem reposição (argumento replace, que por padrão é FALSE, ou seja, sem reposição), com a possibilidade de associar diferentes probabilidades a cada elemento (argumento prob, que por padrão associa probabilidades iguais para todos os elementos).

R source

args(sample)

R output

function (x, size, replace = FALSE, prob = NULL) 
NULL

Vejamos alguns exemplos:

Sorteio de 3 números entre os inteiros de 0 a 20
R source
```
sample(0:20, size = 3)
```
R output
```
[1] 10  4  9
```

Sorteio de 5 números entre os elementos de um certo vetor x

R source

x <- c(23, 34, 12, 22, 17, 28, 18, 19, 20, 13, 18)
sample(x, size = 5)

R output

[1] 13 17 18 18 19

Sorteio de 10 números entre os possíveis resultados do lançamento de um dado, com reposição
R source
```
sample(1:6, size = 10, replace = TRUE)
```
R output
```
 [1] 6 5 6 1 6 3 5 4 1 1
```
Idem ao anterior, porém agora com a probabilidade de cada face proporcional ao valor da face.
R source
```
sample(1:6, size = 10, replace = TRUE,  prob = 1:6)
```
R output
```
 [1] 1 5 5 6 5 5 3 4 3 4
```

Este último exemplo ilustra ainda que os valores passados para o argumento prob não precisam ser probabilidades, são apenas entendidos como pesos. A própria função trata isto internamente fazendo a ponderação adequada.

Complementos sobre distribuições de probabilidade

Agora que já nos familiarizamos com o uso das distribuições de probabilidade vamos ver alguns detalhes adicionais sobre seu funcionamento.

Probabilidades e integrais

A probabilidade de um evento em uma distribuição contínua é uma área sob a curva da distribuição. Vamos reforçar esta idéia revisitando um exemplo visto na distribuição normal.

Seja X uma VA com distribuição N(100, 100). Para calcular a probabilidade P[X < 95] usamos o comando:

R source

pnorm(95, mean = 100, sd = 10)

R output

[1] 0.3085375

Vamos agora "esquecer" o comando pnorm() e ver uma outra forma de resolver usando integração numérica. Lembrando que a normal tem a função de densidade dada por

$$ f(x) = \frac{1}{\sigma\sqrt{2 \pi}}\exp \left[ -\frac{1}{2} \left( \frac{x - \mu}{\sigma} \right)^2 \right] $$

Podemos então definir uma função no R para calcular qualquer densidade em x

R source

fn <- function(x, mu, sigma){
    (1/(sigma * sqrt(2*pi))) * exp((-1/2) * ((x - mu)/sigma)^2)
}

Para obter o gráfico desta distribuição, usamos o fato que a maior parte da função está no intervalo entre a média +/- três desvios padrões, portanto entre 70 e 130. Podemos então fazer como nos comandos que se seguem. Para marcar no gráfico a área que corresponde a probabilidade pedida criamos um polígono com coordenadas ax e ay definindo o perímetro desta área.

R source

x <- seq(70, 130, length.out = 200)
fx <- fn(x, mu = 100, sigma = 10)
plot(x, fx, type = "l")
ax <- c(70, 70, x[x < 95], 95, 95)
ay <- c(0, fn(70, 100, 10), fx[x < 95], fn(95, 100, 10),0)
polygon(ax, ay, density = 10)

Para calcular a área pedida sem usar a função pnorm() podemos usar a função de integração numérica. Note que esta função, diferentemente da pnorm() reporta ainda o erro de aproximação numérica.

R source

integrate(fn, mu = 100, sigma = 10, lower = -Inf, upper = 95)

R output

0.3085375 with absolute error < 2.1e-06

Portanto para os demais ítens do problema, P[90 < X < 110], e P[X > 95] fazemos:

R source

integrate(fn, mu = 100, sigma = 10, lower = 90, upper = 110)

R output

0.6826895 with absolute error < 7.6e-15

R source

integrate(fn, mu = 100, sigma = 10, lower = 95, upper = +Inf)

R output

0.6914625 with absolute error < 8.1e-05

e os resultados acima evidentemente coincidem com os obtidos anterioriormente usando pnorm(),

R source

pnorm(110, 100, 10) - pnorm(90, 100, 10)

R output

[1] 0.6826895

R source

pnorm(95, 100, 10, lower.tail = FALSE)

R output

[1] 0.6914625

Note ainda que na prática não precisamos definir e usar a função fn(), pois ela fornece o mesmo resultado que a função dnorm().

Exercícios

Nos exercícios abaixo iremos também usar o R como uma calculadora estatística para resolver alguns exemplos/exercícios de probabilidade tipicamente apresentados em um curso de estatística básica.

Para X ∼ N(90, 100), obtenha:
1. P(X ≤ 115)
2. P(X ≥ 80)
3. P(X ≤ 75)
4. P(85 ≤ X ≤ 110)
Sendo X uma variável seguindo o modelo Binomial com parâmetros n = 15 e p = 0.4, pergunta-se:
1. P(X ≥ 14)
2. P(8 < X ≤ 10)
Uma empresa informa que 30% de suas contas a receber de outras empresas encontram-se vencidas. Se o contador da empresa seleciona aleatoriamente 5 contas, determine a probabilidade de:
1. Nenhuma conta estar vencida
2. Exatamente duas contas estarem vencidas
3. Três ou mais contas estarem vencidas
Uma empresa recebe 720 emails em um intervalo de 8 horas. Qual a probabilidade de que:
1. Em 6 minutos receba pelo menos 3 emails?
2. Em 4 minutos não receba nenhum email?
O processo de empacotamento de uma fábrica de cereais foi ajustado de maneira que uma média de μ = 13, 0 kg de cereal seja colocado em cada caixa. Sabe-se que existe uma pequena variabilidade no enchimento dos pacotes devido à fatores aleatórios, e que o desvio-padrão do peso de enchimento é de σ = 0, 1 kg. Assume-se que a distribuição dos pesos tem distribuição normal. Com isso, determine as probabilidades de que uma caixa escolhida ao acaso:
1. Pese entre 13,0 e 13,2 kg.
2. Tenha um peso maior do que 13,25 kg.
3. Pese entre 12,8 e 13,1 kg.
4. Pese entre 13,1 e 13,2 kg.
Faça os seguintes gráficos:
1. da função de densidade de uma variável com distribuição de Poisson com parâmetro λ = 5
2. da densidade de uma variável X ∼ N(90, 100)
3. sobreponha ao gráfico anterior a densidade de uma variável Y ∼ N(90, 80) e outra Z ∼ N(85, 100)
4. densidades de distribuições χ² com 1, 2 e 5 graus de liberdade.

Última atualização: 2015-12-08 01:20:37

CE 083 - Estatística Computacional I

http://www.leg.ufpr.br/ce083

Sumário

Autores e licença

Probabilidade no R

Conceitos básicos sobre distribuições de probabilidade

Exemplo 1. (Adaptado de Bussab e Morettin, página 166, exercício 1)

R source

R source

R source

R output

R source

R source

R output

R source

R output

Distribuições de Probabilidade

Distribuição Normal

R source

R output

R source

R output

R source

R output

R source

R output

R source

R output

R source

R output

R source

R output

R source

R output

R source

R output

R source

R source

R output

R source

R output

R source

R output

R source

R output

R source

R source

R source

R source

R source

Distribuição Binomial

R source

R output

R source

R source

R source

R output

R source

R output

R source

R output

R source

R output

R source

R output

R source

R output

R source

R output

Distribuição de Poisson

R source

R source

R output

R source

R output

R source

R output

R source

R output

R source

A função `sample()`