7 Simulando dados com padrão espacial


pict

Figura 6: Vizualização de dados simulados segundo três diferentes modelos (colunas) com variação dos parâmetros em dada modelo (linhas)


Um procedimento importante na estatística moderna é a simulação. Simular dados de um modelo ajustado é muito utilizado para avaliar o desempenho de metodologias de análise e na verificação de pressupostos. Simular um conjunto de plantas doentes com padrão aleatório é bastante simples. Porém, quando se deseja simular um conjunto de dados com padrão não aleatório, temos infinitas possibilidades de padrões espaciais.

O modelo geoestatístico considera que os dados são uma realização de um processo estocástico multivariado. Toda a informação sobre a dependência espacial nesse modelo é dada pela matriz de covariância. Porém se temos apenas uma realização do processo, devemos modelar a matriz de covariância de forma a utilizar poucos parâmetros. Os modelos adotados para a covariância são funções da distância entre os pontos, em que as observações mais próximas são mais correlacionadas (Diggle & Ribeiro Jr. 2000).

A partir de um conjunto de dados de um processo gaussiano S com dependência espacial, podemos obter dados binários com dependência espacial. Foram considerados três procedimentos para simular dados binários utilizando o modelo geoestatístico: 1) Simular amostras bernoulli a partir dos valores gaussianos simulados, 2) truncar os valores gaussianos simulados ou 3) efetuar uma transformação quantílica.

Os métodos de simulação apresentados foram implementados na função sim.citrus(). Como exemplo, para cada um dos cinco métodos apresentados, vamos simular três conjunto de dados, cada um com parâmetros diferentes. Na Figura 6 observamos esses dados.