Modelos Ocultos de Markov


Introdução


Última atualização: 31 de maio de 2023.

Os Modelos Ocultos de Markov (HMMs) são uma classe de modelos em que a distribuição que gera uma observação depende do estado de uma Cadeia de Markov subjacente e não observada. Eles se mostram promissores como modelos genéricos de propósito geral para séries temporais univariadas e multivariadas, especialmente para séries de valor discreto, incluindo séries categóricas e séries de contagens (Zucchini & MacDonald, 1998).

Considere, por exemplo, uma série de vendas semanais de um produto específico de sabão em um supermercado. As unidades semanais inteiras de um sabonete de cóodigo 3700031165 foram fornecidos pelo Kilts Center for Marketing da Escola de Pós-Graduação em Administração da Universidade de Chicago. O produto é Zest White Water 15 oz. Uma onça, abreviada oz, é uma unidade de medida de massa, uma onça equivale a 28.349523125 gramas. Os dados são mostrados na Figura 1.

Figura 1: Série de vendas semanais de um produto de sabão específico.
Dados fornecidos pelo Grupo de Marketing da Universidade de Chicago.

Comnados R para gerarmos o gráfico acima.
> soap = c(1, 6, 9, 18, 14, 8, 8, 1, 6, 7, 3, 3, 1, 3, 4, 12, 8, 10, 8, 2, 17, 15, 7, 12, 22, 10, 4, 7, 5, 0, 2, 5, 3, 4, 4, 7, 5, 6, 1, 3, 4, 5, 3, 7, 3, 0, 4, 5, 3, 3, 4, 4, 4, 4, 4, 3, 5, 5, 5, 7, 4, 0, 4, 3, 2, 6, 3, 8, 9, 6, 3, 4, 3, 3, 3, 3, 2, 1, 4, 5, 5, 2, 7, 5, 2, 3, 1, 3, 4, 6, 8, 8, 5, 7, 2, 4, 2, 7, 4, 15, 15, 12, 21, 20, 13, 9, 8, 0, 13, 9, 8, 0, 6, 2, 0, 3, 2, 4, 4, 6, 3, 2, 5, 5, 3, 2, 1, 1, 3, 1, 2, 6, 2, 7, 3, 2, 4, 1, 5, 6, 8, 14, 5, 3, 6, 5, 11, 4, 5, 9, 9, 7, 9, 8, 3, 4, 8, 6, 3, 5, 6, 3, 1, 7, 4, 9, 2, 6, 6, 4, 6, 6, 13, 7, 4, 8, 6, 4, 4, 4, 9, 2, 9, 2, 2, 2, 13, 13, 4, 5, 1, 4, 6, 5, 4, 2, 3, 10, 6, 15, 5, 9, 9, 7, 4, 4, 2, 4, 2, 3, 8, 15, 0, 0, 3, 4, 3, 4, 7, 5, 7, 6, 0, 6, 4, 14, 5, 1, 6, 5, 5, 4, 9, 4, 14, 2, 2, 1, 5, 2, 6, 4) > semanas = seq(as.Date("1992-09-21"), length = 242, by = "week") > dados1= data.frame(semanas, soap) > library(ggplot2) > ggplot(data = dados1, aes(x = semanas, y = soap)) + geom_line(color = "#00AFBB", size = 1) + labs(x = "Semanas", y = "Unidades vendidas")

Nesse caso a aplicação de modelos de séries temporais padrão, como os modelos ARMA, é restrita pois eles são baseados na distribuição normal. Em vez disso, o modelo básico para contagens ilimitadas é a distribuição Poisson. No entanto, o modelo Poisson padrão não é apropriado neste caso uma vez que, como será demonstrado mais tarde, a série apresenta considerável superdispersão em relação à distribuição Poisson e forte dependência serial positiva. Além disso, parecem existir alguns períodos com baixa taxa de vendas semanais e outros períodos com uma taxa relativamente alta de vendas semanais.

A classe de modelos de séries temporais Ocultas de Markov, que modelam a distribuição de probabilidade \(S_t\) na dependência do estado não observado, ou seja, oculto \(C_t\) de uma Cadeia de Markov com \(m\) estados e que pode acomodar tanto a superdispersão quanto a dependência serial, parece ser uma ferramenta útil para modelar esta série e tentando entender sua estrutura. O ajuste de um Modelo Oculto de Markov Poisson à série de vendas semanais de sabão constituirá parte integrante desta nota, ou seja, a maioria dos aspectos dos HMMs introduzidos aqui será demonstrada por meio desta série.

Os HMMs têm sido utilizados há mais de duas décadas em aplicações de processamento de sinais, especialmente no contexto do reconhecimento automático de voz, mas o interesse na teoria e nas aplicações de HMMs está se expandindo rapidamente para outros campos, por exemplo:

A bibliografia aqui apresentada lista vários artigos e monografias que lidam com a aplicação dos HMMs nesses campos e podem ser de interesse para leitura adicional: Durbin et al. (1998), Elliott, Aggoun e Moore (1995), Koski (2001), Rabiner (1989) e Ephraim e Merhav (2002).

Entre as características atrativas dos HMMs estão sua versatilidade, sua facilidade matemática e o fato de que a probabilidade é relativamente direta (Zucchini e MacDonald, 2001). Em detalhe, os HMMs são caracterizados pelas seguintes propriedades:

Além disso, os HMMs são interpretáveis em muitos casos e podem facilmente acomodar covariáveis adicionais. Além disso, eles são moderadamente parcimoniosos, ou seja, um modelo simples de dois estados geralmente fornece um ajuste razoável.

Os principais objetivos ao lidar com Modelos Ocultos de Markov são os seguintes:

Esta nota basicamente pretende dar uma introdução simples ao Modelo Oculto de Markov (HMM). É simples no sentido de que é restrito a séries temporais estacionárias, ou seja, sem tendência ou variação sazonal. As observações podem ser de valor discreto ou contínuo, mas neste curso vamos supor que elas sejam univariadas e iremos ignorar qualquer informação que possa estar disponível nas covariáveis. Apenas no final desta nota, daremos uma breve visão geral das possíveis extensões do Modelo Oculto de Markov.

A ênfase estará na aplicação dos modelos, em particular na especificação de modelos, na estimação de parâmetros, na seleção de modelos, na verificação de diagnósticos e na previsão.

Como suporte computacional utilizamos a linguagem de programação e ambiente de desenvolvimento integrado para cálculos estatísticos e gráficos R, última versão 3.5.2, Eggshell Igloo de 20 de dezembro de 2018.


Referências