Considere o problema do teste diagnóstico de uma doença rara, que afeta 2% da população. Um teste diagnóstico para a doença tem sensibilidade de 90% e especificidade de 80%. Ou seja, se uma pessoa tem a doença, o teste dá positivo com probabilidade 90%, e se a pessoa não tem a doença, o teste dá negativo com probabilidade 80%. O objetivo é determinar a probabilidade de uma pessoa ter ou não a doença dado que o teste deu positivo.
Definindo notação:
Redefinindo notação:
Priori: \(P(\theta)\)
Para teste POSITIVO:
Verossimilhança: \(P(Y = 1 | \theta)\)
ex01.1 <- tibble::tibble(
theta = c(0,1),
priori = c(0.98, 0.02),
vero = c(0.20, 0.90),
produto = priori * vero,
posteriori = produto/sum(produto)
)
knitr::kable(ex01.1)| theta | priori | vero | produto | posteriori |
|---|---|---|---|---|
| 0 | 0.98 | 0.2 | 0.196 | 0.9158879 |
| 1 | 0.02 | 0.9 | 0.018 | 0.0841121 |
Para teste NEGATIVO:
Verossimilhança: \(P(Y = 0 | \theta)\)
ex01.2 <- tibble::tibble(
theta = c(0,1),
priori = c(0.98, 0.02),
vero = c(0.80, 0.10),
produto = priori * vero,
posteriori = produto / sum(produto)
)
knitr::kable(ex01.1)| theta | priori | vero | produto | posteriori |
|---|---|---|---|---|
| 0 | 0.98 | 0.2 | 0.196 | 0.9158879 |
| 1 | 0.02 | 0.9 | 0.018 | 0.0841121 |
Agora suponha que a pessoa fez o teste duas vezes, e ambos os testes deram positivo. Qual as probabilidade de a pessoa ter ou não a doença dado que ambos os testes deram positivo?
ex01.3 <- tibble::tibble(
theta = c(0,1),
priori = c(0.98, 0.02),
vero1 = c(0.20, 0.90),
vero2 = c(0.20, 0.90),
produto = priori * vero1 * vero2,
posteriori = produto / sum(produto)
)
knitr::kable(ex01.3)| theta | priori | vero1 | vero2 | produto | posteriori |
|---|---|---|---|---|---|
| 0 | 0.98 | 0.2 | 0.2 | 0.0392 | 0.7075812 |
| 1 | 0.02 | 0.9 | 0.9 | 0.0162 | 0.2924188 |
Agora suponha que a pessoa fez o teste três vezes, e os resultados foram: positivo,negativo e positivo. Qual as probabilidade de a pessoa ter ou não a doença dado que os testes deram esses resultados?
ex01.4 <- tibble::tibble(
theta = c(0,1),
priori = c(0.98, 0.02),
vero1 = c(0.20, 0.90),
vero2 = c(0.80, 0.10),
vero3 = c(0.20, 0.90),
produto = priori * vero1 * vero2 * vero3,
posteriori = produto / sum(produto)
)
knitr::kable(ex01.4)| theta | priori | vero1 | vero2 | vero3 | produto | posteriori |
|---|---|---|---|---|---|---|
| 0 | 0.98 | 0.2 | 0.8 | 0.2 | 0.03136 | 0.9508793 |
| 1 | 0.02 | 0.9 | 0.1 | 0.9 | 0.00162 | 0.0491207 |
Estima-se que um estudante tem uma chance de 40% de dominar um determinado assunto. O estudante faz uma questão de múltipla escolha (com cinco alternativas) para avaliar seu conhecimento. O estudante tem 85% de chance de acertar a questão se domina o assunto.
Notação:
Vamos chamar de Porta 1 a escolhida pelo jogador, de Porta 2 a revelada e Porta 3 a restante. A revelada é escolhida com probabilidade \(p\) se houver opção. Vamos considerar que \(p = 1/2\).
p <- 0.5
ex03.1 <- tibble::tibble(
theta = c(1,2,3),
priori = c(1/3, 1/3, 1/3), ## P(θ)
vero = c(p, 0, 1), ## P(Y=2|θ)
produto = priori * vero,
posteriori = produto / sum(produto) ## P(θ|Y=2)
)
knitr::kable(ex03.1)| theta | priori | vero | produto | posteriori |
|---|---|---|---|---|
| 1 | 0.3333333 | 0.5 | 0.1666667 | 0.3333333 |
| 2 | 0.3333333 | 0.0 | 0.0000000 | 0.0000000 |
| 3 | 0.3333333 | 1.0 | 0.3333333 | 0.6666667 |
Seja uma urna com uma bola branca. Bola(s) pretas são adicionadas à urna em quantidade definida pelo resultado do lançamento de um dado com resultado não revelado. Retira-se uma bola da urna e observa-se que ela é preta.
Suponha que o número de ocorrências de um determinado evento em um intervalo de tempo segue uma distribuição de Poisson com parâmetro \(\theta\). Considera-se dez possíveis valores para \(\theta\): \(1, 2, 3, \ldots 10.\)