UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE CIÊNCIAS EXATAS E DA TERRA
BACHARELADO EM METEOROLOGIA
RAFAELA DOS SANTOS GOMES
MODELO ESTOCÁSTICO DE SÉRIE SINTÉTICA DE PRECIPITAÇÃO VIA
AMOSTRADOR DE GIBBS
NATAL
2017
Rafaela dos Santos Gomes
MODELO ESTOCÁSTICO DE SÉRIE SINTÉTICA DE PRECIPITAÇÃO VIA
AMOSTRADOR DE GIBBS
NATAL
2017
Monografia apresentada à Coordenação do Curso de Meteorologia da Universidade Federal do Rio Grande do Norte, como requisito parcial à obtenção do Título de Bacharel em Meteorologia. Orientador: Prof. Dr. Paulo Sergio Lúcio
Universidade Federal do Rio Grande do Norte - UFRN
Sistema de Bibliotecas - SISBI
Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial Prof. Ronaldo Xavier de Arruda - CCET
Gomes, Rafaela dos Santos.
Modelo estocástico de série sintética de precipitação via Amostrador de Gibbs / Rafaela dos Santos Gomes. - 2017.
54f.: il.
Monografia (Bacharelado em Meteorologia) - Universidade
Federal do Rio Grande do Norte. Centro de Ciências Exatas e da
Terra. Departamento de Ciências Atmosféricas e Climáticas. Natal, RN, 2017.
Orientador: Paulo Sérgio Lucio.
1. Meteorologia - Monografia. 2. Precipitação - Monografia. 3.
Séries sintéticas - Monografia. 4. Simulação - Monografia. 5.
Amostrador de Gibbs - Monografia. I. Lucio, Paulo Sérgio. II.
Título.
RN/UF/CCET CDU 551.5
Rafaela dos Santos Gomes
MODELO ESTOCÁSTICO DE SÉRIE SINTÉTICA DE PRECIPITAÇÃO VIA
AMOSTRADOR DE GIBBS
Trabalho de conclusão de curso de graduação apresentado ao Departamento
de Ciências Atmosféricas e Climáticas da Universidade Federal do Rio Grande
do Norte como requisito para a obtenção do título de Bacharel(a) em
Meteorologia.
Aprovado em:_____de_____de_____.
BANCA EXAMINADORA
_________________________________________________
Paulo Sergio Lucio (DCAC/UFRN)
(Orientador)
_________________________________________________
Cláudio Moisés Santos e Silva (DCAC/UFRN)
_________________________________________________
Marconio Silva dos Santos (DMAT/UFRN)
Is this the real life?
Is this just fantasy?
Bohemian Rhapsody-Queen
Agradecimentos
À Deus.
À minha família.
Aos meus amigos.
À Marlúcia Elias de Farias, grande amiga e grande conselheira.
Aos integrantes da Gerência de Meteorologia da EMPARN.
Aos meus orientadores de Iniciação Científica, Bergson e Paulo.
À todos que compõem o Departamento de Ciências Atmosféricas e Climáticas.
LISTA DE TABELAS
Tabela 1. Erros da precipitação simulada para o mês de janeiro. .................. 26
Tabela 2. Erros da precipitação simulada para o mês de março. ................... 31
Tabela 3. Estatística descritivas para as séries observadas e simuladas. ...... 31
LISTA DE FIGURAS
Figura 1. Série temporal da precipitação pluvial diária do mês de janeiro e março
observada para a cidade de Natal-RN no período 1992-2017. .......................... 4
Figura 2. Simulação da precipitação gerada por: A) modelos estocástico Holt-
Winters. B) modelo numérico dinâmico hidrostático Reg-CM.4.6. ..................... 6
Figura 3. Exemplo de uma simulação utilizando o amostrador de Gibbs com
......... 9
Figura 4. Função densidade de probabilidade da distribuição Binomial Negativa.
......................................................................................................................... 11
Figura 5. Exemplo de Função densidade de probabilidade da distribuição Beta
com assimetria e simetria. ................................................................................ 13
Figura 6. Área de estudo englobando a localização do pluviômetro dentro da
cidade de Natal-RN .......................................................................................... 14
Figura 7. Histograma da série de precipitação diária para todos os dias de
janeiro e de março. ........................................................................................... 17
Figura 8. Histograma dos dados gerados pela distribuição binomial com n = 806
e p = para o mês de janeiro. ...................................................................... 18
Figura 9. Histograma dos dados gerados pela distribuição binomial com
e para o mês de março. ............................................................. 19
Figura 10. Histograma dos dados gerados pela distribuição de Poisson para
para o mês de janeiro ........................................................................ 20
Figura 11
0,39 para o mês de março................................................................................ 20
Figura 12. A) Histograma dos dados gerados pela distribuição Beta para o mês
de janeiro e B) Função de densidade de probabilidade de uma distribuição Beta.
......................................................................................................................... 21
Figura 13. Histograma dos dados gerados pela distribuição Beta para o mês de
março. .............................................................................................................. 21
Figura 14. Gráfico de séries de tempo sintética, de autocorrelação amostral para
as distribuições Beta, Binomial e Poisson para o mês de janeiro. ................... 23
Figura 15. Série temporal sintética combinada da amostra gerada pelo
Amostrador de Gibbs para 161 meses de janeiro. ........................................... 24
Figura 16. Histograma da série temporal sintética combinada da amostra
Gerada pelo Amostrador de Gibbs para 161 meses de janeiro. O histograma e a
densidade foi obtido a partir da soma dos amostras geradas com distribuição
Beta e Possion. ................................................................................................ 25
Figura 17. Gráfico da série de tempo sintética com a distribuição Binomial
gerada pelo Amostrador de Gibbs. ................................................................... 25
Figura 18. Diagrama de dispersão entre a precipitação simulada e a observada
para o mês de janeiro. ...................................................................................... 26
Figura 19. Gráfico de séries de tempo sintética, de autocorrelação amostral para
as distribuições Beta, Binomial e Poisson para o mês de março. .................... 27
Figura 20. Série temporal sintética combinada da amostra gerada pelo
Amostrador de Gibbs para 161 meses de março. ............................................ 28
Figura 21. Histograma da série temporal sintética combinada da amostra
Gerada pelo Amostrador de Gibbs para 161 meses de março. O histograma e a
densidade foi obtido a partir da soma dos amostras geradas com distribuição
Beta e Possion. ................................................................................................ 29
Figura 22. Gráfico da série de tempo sintética para a distribuição Binomial
gerada pelo Amostrador de Gibbs. ................................................................... 30
Figura 23. Diagrama de dispersão entre a precipitação simulada e a observada
para o mês de março. ...................................................................................... 30
RESUMO
O avanço da computação e da estatística tem permitido o surgimento de novos
métodos de previsão de tempo e clima com uso em diversas áreas, bem como
a combinação de algum deles, sempre buscando a melhor estimativa,
minimizando os erros. Esse avanço deve-se principalmente ao número cada vez
maior de informações disponíveis. Porém, ainda existe limitações quanto ao uso
de ferramentas para a previsão ou simulação da variável precipitação
pluviométrica. Ultimamente, vários métodos para simular a precipitação tem sido
desenvolvidos com base em diferentes metodologias. A precipitação pluvial é
uma variável dicífil de ser prevista devido o seu comportamento variante no
espaço e no tempo. Diante disso, propõe-se desenvolver um modelo de
simulação de séries sintéticas de precipitação, via Amostrador de Gibbs
considerando as distribuições Beta, Binomial e Poisson, de forma que as séries
geradas apresentem as mesmas características das séries históricas.
Comparou-se o desempenho do modelo simulando o mês de janeiro e o mês de
março. Na aplicação prática feita neste trabalho pode-se constatar a eficiência
do Algoritmo de Gibbs. As estimativas simuladas para precipitação diária foram
muito próximas dos valores observados, os menores erros, bem como a a maior
correlação foram encontrados na simulação para o mês de março.
ABSTRACT
The advancement of computing and statistics with the use of weather and climate
forecasting methods with use in several areas, as well as a combination of them,
always seeking a better estimate, minimizing errors. This advancement develops
more and more and more of the available information. However, there are still
limitations to the use of tools for a rainfall forecast or simulation. Lately, several
methods to simulate a precipitation have been developed based on different
methodologies. A rainfall and a variable of information on the supply of its variant
behavior in space and time. Therefore, it is proposed to develop a simulation
model of synthetic precipitation series, using Gibbs Sampler considering Beta,
Binomial and Poisson distributions, in the same way as generated series present
as own property of the historical series. The performance of the model was mod-
eled simulating the month of January and the month of March. In the practice
practiced in the work one can verify the efficiency of the Gibbs Algorithm. The
simulated estimates for the daily precipitation were very close to the observed
values, the smaller errors, as well as a greater fortified correlation in the simula-
tion for the month of March.
.
SUMÁRIO
1 INTRODUÇÃO ............................................................................................ 1
1.2 Objetivo Geral ........................................................................................... 3
1.3 Objetivos Específicos ................................................................................ 3
1.4 FUNDAMENTAÇÃO TEÓRICA ................................................................. 3
1.4.1 Séries Temporais ................................................................................ 3
1.4.2 Simulações ......................................................................................... 5
1.4.3 Simulação de dados meteorológicos sintéticos .................................. 7
1.1.4 Inferência Bayesiana .......................................................................... 7
1.4.5 Amostrador de Gibbs .......................................................................... 9
1.4.6 Distribuições de Probabilidades utilizadas ........................................ 10
2 MATERIAL E MÉTODOS .......................................................................... 14
3 RESULTADOS .......................................................................................... 17
4 DISCUSSÕES ........................................................................................... 33
5 CONCLUSÕES ......................................................................................... 34
6 REFERÊNCIAS ......................................................................................... 36
7 ANEXOS .................................................................................................... 39
1. INTRODUÇÃO
O avanço da computação e da estatística tem permitido o surgimento de
novos métodos de previsão com uso em diversas áreas, bem como a
combinação de algum deles, sempre buscando a melhor estimativa,
minimizando os erros. Esse avanço deve-se principalmente ao número cada vez
maior de informações disponíveis. Porém, ainda existem limitações quanto ao
uso de ferramentas para a previsão ou simulação da variável precipitação
pluviométrica.
O conhecimento das precipitações prováveis é de extremo interesse para
o dimensionamento de vertedouros de barragens, de canais, galerias pluviais,
bueiros e barragens de abastecimento de água (VILLELA e MATTOS, 1975) e
para o planejamento agrícola e dimensionamento de sistema de irrigação
complementar (BERNARDO, 1995). A precipitação provável é a precipitação
pluviométrica que apresenta probabilidade específica de ocorrência, baseada
em uma longa série de dados (FRIZZONE, 1979).
A cidade de Natal, apesar de ter um balanço hídrico mais regular devido
à maior e melhor distribuição de chuvas e sua composição geológica que permite
o armazenamento subterrâneo da água, também está vulnerável à escassez
hídrica (ANDRADE NETO, 2017). Isso fica evidente ao se observar o longo
período de baixas precipitações nos últimos anos que afetou o sistema de
abastecimento do município e levou à adoção de um sistema de rodízio na Zona
Norte da cidade, devido ao rebaixamento do nível da Lagoa de Extremoz,
principal manancial da região (CAERN, 2017).
O regime hídrico da cidade de Natal depende da ocorrência de diversos
fenômenos de escala global, sinótica e de mesoescala que variam sozonalmente
no espaço e no tempo, no qual se destaca o deslocamento para sul da Zona de
Convergência Intertropical - ZCIT, sistema destacado por Ferreira (1996) como
o principal sistema gerador de precipitação na região norte do nordeste brasileiro
(NNEB).
Dentro do conjunto das variáveis meteorológicas, a precipitação tem sido
a mais difícil de ser prevista com precisão através dos diversos modelos
numéricos e estatísticos existentes. Espinosa (2011) relata que um dos
principais motivos da baixa previsibilidade da precipitação é devido ao seu
comportamento episódico, ou seja, altamente variável no espaço e no tempo,
além da sua descontinuidade espacial e temporal.
Sendo a precipitação uma variável aleatória, ou seja, seu valor numérico não
pode ser predito com certeza, antes que o evento ocorra (BENJAMIN &
CORNELL, 1970), a modelagem do seu valor pode ser feita estocasticamente.
Segundo WHEATER et al. (2000), nesse tipo de modelagem, o comportamento
determinístico detalhado é substituído por suposições estocásticas simples,
onde um pequeno número de parâmetros com interpretação física do processo
modelado é utilizado para a representação deste.
A escolha de modelar séries temporais de chuva de maneira estocástica,
deve-se à complexidade e forte dependência das condições iniciais que
desencadeiam o processo de precipitação (CALENDA e NAPOLITANO, 1999).
A forma estocástica tradicional de modelar a precipitação utiliza cadeias
de Markov para simular a ocorrência da precipitação. De acordo com
HUTCHINSON (1990) a quantidade de chuva precipitada é simulada, nesse
caso, através de uma distribuição de probabilidade.
A inferência foi feita adotando-se a abordagem Bayesiana e, como a
distribuição a posteriori não é analiticamente tratável, usou-se o Método de
Monte Carlo via Cadeias de Markov (Markov Chain Monte Carlo, MCMC), em
especial, o Algoritimo do Amostrador de Gibbs.
1.2 Objetivo Geral
O principal objetivo desse trabalho é desenvolver um modelo de
simulação de séries sintéticas de precipitação, via Amostrador de Gibbs
considerando as distribuições Beta, Binomial e Poisson, de forma que as séries
geradas apresentem as mesmas características das séries históricas.
1.3 Objetivos Específicos
Verificar o desempenho do modelo para um mês seco e um mês chuvoso.
Desenvolver uma ferramenta acessível para gerar séries sintéticas de
precipitação diária de forma mais genérica, baseando-se nas condições
pluviométricas observadas.
Contribuir para o desenvolvimento e para o aperfeiçoamento de
metodologias que auxiliem na previsão climática, na gestão dos recursos
hídricos e na agricultura de forma geral.
1.4 FUNDAMENTAÇÃO TEÓRICA
1.4.1 Séries Temporais
Oliveira (2003), desenvolvedor do modelo CLIMABR, definiu série
temporal como qualquer conjunto de observações ordenadas no tempo ou
também como um conjunto de observações geradas sequencialmente no tempo,
podendo ser discretas, contínuas ou ambas, dependendo do conjunto de
observações. A precipitação é uma variável contínua, pois pode assumir
qualquer valor de um determinado intervalo.
Para uma definição formal de série temporal necessita-se primeiramente
conceituar um processo estocástico. Um processo estocástico é qualquer
fenômeno estatístico que evolui no tempo de acordo com leis probabilísticas.
Pode-se entendê-lo como um modelo que descreve a estrutura probabilística de
uma sequência de observações (BOX, JENKINS e REINSEL, 1994).
Dessa forma, assume-se que cada valor de uma série
é extraído aleatoriamente de uma distribuição de probabilidade. Assim, se fosse
possível especificar a função de distribuição de probabilidade de uma
determinada série temporal, seria possível determinar também a probabilidade
de um resultado futuro da série.
Figura 1. Série temporal da precipitação pluvial diária do mês de janeiro e março
observada para a cidade de Natal-RN no período 1992-2017.
Fonte: Elaborado pela autora.
A Figura 1 apresenta a série temporal de precipitação pluvial mensal para
a cidade de Natal, para os anos de 1988 a 2016, onde observa-se claramente
um comportamento sazonal definido como período chuvoso e seco. A maioria
dos métodos de previsão estatística é baseada na utilização de dados históricos
a partir de uma série de temporal. Se os dados passados são indicativos do que
se esperar no futuro, pode-se postular um modelo matemático que é
representativo do processo. O modelo pode então ser usado para gerar
previsões. Em situações reais, geralmente não se tem conhecimento da forma
exata do modelo que gera a série temporal. Assim, faz-se necessário escolher
um modelo aproximado ou um modelo que combine as previsões, por meio de
somas, médias ou médias ponderadas.
1.4.2 Simulações
representação do funcionamento de um processo, fenômeno ou sistema
relativamente complexo, por meio de um outro, gerado para fins científicos de
observação, análise e predição, ou para treinamento,
O significado e a utilização da simulação vão além de semelhanças
visuais ou sensoriais, representando ainda, ideias ou conceitos análogos. Dessa
forma, um estudo simulado pode fornecer novos conhecimentos sobre o objeto
que inspira o estudo. Esta é a aplicação científica da simulação. A simulação
contribui significativamente tanto para a teoria como para a prática (BARTON,
1973). De uma forma geral, entende-se que o ato de simular significa elaborar,
empregar e explorar modelos para reprodução, representação ou imitação de
fenômeno, situação ou processo concreto.
Simas (2003) dividiu os modelos de simulações em dois tipos:
1.4.2.1 Simulação determinística:
O sistema não depende de nenhuma variável probabilística (aleatória).
A única forma de obter diferentes saídas da simulação é por intermédio
da modificação das variáveis de entrada.
1.4.2.2 Simulação estocástica:
O sistema depende de variáveis probabilísticas (aleatórias). É possível
obter diferentes saídas da simulação a partir de um mesmo conjunto de
variáveis de entrada. Nesse tipo de simulação é possível avaliar o
comportamento do modelo e das variáveis aleatórias (investigação da
distribuição amostral).
As simulações estocásticas são largamente utilizadas em tomadas de
decisões.
A Figura 2 representa a simulação da precipitação pluvial a partir de dois
métodos distintos: o primeiro é considerado pela classificação de SIMAS (2003)
como simulação estocástica e o segundo pode ser considerado como simulação
determinística.
A base científica para as previsões numéricas de clima deriva
principalmente da previsibilidade das condições de contorno, sobretudo da
temperatura da superfície do mar (TSM) e da grande influência desta na
determinação das condições atmosféricas futuras (PALMER e ANDERSON,
1994; SHUKLA, 1998, 2000b). Contudo, a maior limitação das simulações ou
previsões decorre da natureza caótica da atmosfera e independe do modelo ou
das variáveis de entrada (SAMPAIO e DIAS, 2014).
De modo geral, algumas simulações estocásticas utilizam realizações das
distribuições de probabilidades das variáveis de entrada, processam essas
informações dentro do modelo específico, e obtém como saída os valores da
distribuições de probabilidade da variável resultante, o que ocorre, por exemplo,
com os métodos de Monte Carlo via Cadeia de Markov.
Figura 2. Simulação da precipitação gerada por: A) modelos estocástico Holt-
Winters. B) modelo numérico dinâmico hidrostático Reg-CM.4.6.
A) B)
Fonte: Elaborado pela autora.
1.4.3 Simulação de dados meteorológicos sintéticos
Os simuladores climáticos são modelos que representam a ocorrência de
variáveis climáticas e têm por objetivo a simulação de um conjunto de valores
numéricos, denominado série sintética, com as mesmas características
estatísticas da série histórica (BAENA, 2004).
Um exemplo de simulador climático é o modelo CLIGEN-CLImate
GENeratior, que foi desenvolvido por NICKS el al. (1995) e usa estatística de
dados climáticos históricos observados para estação com o objetivo de gerar
uma série temporal de dados diários de precipitação, temperatura do ar, radiação
solar, temperatura do ponto do orvalho, além de direção e velocidade do vento.
Virgens Filho (1997) idealizou o modelo GEPAC Gerador Estocástico de
Parâmetros Climáticos, para geração de dados diários de precipitação, radiação
solar global, temperatura do ar e umidade relativa do ar. Para tal feito, o autor
utilizou as distribuições de probabilidade Gama, Normal e Exponencial Negativa.
Oliveira (2003) desenvolveu o CLIMABR - Gerador de Série Sintética de
Precipitação, que permite a obtenção de informações sobre precipitação
estruturada de tal forma para que se obtenha, para cada dia chuvoso, o total
precipitado, a duração do evento, além dos parâmetros necessários para a
representação de perfil de precipitação instantânea.
1.1.4 Inferência Bayesiana
Primeiramente, para entender alguns conceitos a seguir, é importante
deixar claro a definição de dois termos:
Distribuição de Probabilidade a priori
A utilização de informação a priori em inferência Bayesiana requer a
especificação de uma distribuição a priori para a quantidade de interesse . Esta
distribuição deve representar (probabilisticamente) o conhecimento que se tem
sobre antes da realização do experimento.
Distribuição de Probabilidade a posteriori
A probabilidade a posteriori de um evento aleatório ou uma proposição
incerta é a probabilidade condicional que é atribuída quando a evidência
relevante é levada em conta. Ela pode ser calculada com o teorema de Bayes,
multiplicando-se a distribuição da probabilidade a priori pela função de
verossimilhança e depois dividindo-a pela constante de normalização.
A diferença fundamental entre a inferência estatística e a Bayesiana é que
a última utiliza as chamadas distribuições de probabilidade a priori. Em suma,
tais distribuições buscam implementar informações subjetivas sobre o processo
em questão, através de funções de probabilidades. A inferência Bayesiana utiliza
as distribuições a priori, e pondera tais informações com os dados observados
amostralmente na busca dos valores mais adequados dos parâmetros. A
Estatística Bayesiana, porém, permite a atualização dessa distribuição com base
em informações fornecidas pela amostra.
Silveira (2008) destaca que, atualmente, há duas correntes de inferência
estatística: a frequentista e a Bayesiana. A principal diferença entre elas é que
na inferência Bayesiana, informações prévias sobre a variável de interesse
podem ser incorporadas às análises. As informações a priori, para serem
devidamente incorporadas na análise, devem ser traduzidas em uma distribuição
de probabilidade. Tal distribuição do parâmetro populacional é chamada de
distribuição a priori. Caso seja interessante considerar informações subjetivas,
estas devem ser devidamente traduzidas em funções de distribuição de
probabilidade, para que possam ser incorporadas na análise. A distribuição de
densidade a priori, portanto, denota o grau de conhecimento acumulado sobre o
processo, antes da observação dos dados amostrais.
Em inferência Bayesiana, a distribuição a posteriori dos parâmetros,
frequentemente é desconhecida, portanto uma alternativa é um método que
simule esta distribuição. Os métodos de Monte Carlo baseados na simulação de
variáveis aleatórias de uma Cadeia de Markov, são, atualmente, a maneira usual
de fazer uma análise Bayesiana dos dados, chamados de Métodos de Monte
Carlo via Cadeias de Markov (MCMC).
Em casos que os modelos apresentam uma distribuição a priori não-
conjugada, deve-se utilizar outros métodos para o cálculo das distribuições a
posteriori. Entre os algoritmos MCMC mais aplicados estão o Amostrador de
Gibbs e Metropolis-Hastings. As descrições de ambos podem ser encontradas,
mais detalhadamente, em MIGON e GAMERMAN (1999).
1.4.5 Amostrador de Gibbs
O método de amostragem Gibbs, foi proposto por Geman e Geman em
1984, no âmbito do problema de reconstrução de imagens, e tornado popular
entre os Estatísticos, após a publicação do trabalho seminal de Gelfand e Smith
(1990). Seu objetivo é chegar à distribuição conjunta a posteriori.
O algoritmo de simulação proposto define uma cadeia de Markov que, sob
condições muito gerais, tem como distribuição limite a distribuição conjunta que
se pretende simular. Assim, simulando-se os estados da cadeia por um longo
período de tempo de modo a garantir que o equilíbrio seja atingido, pode-se
construir uma amostra da distribuição multivariada à custa dos estados da cadeia
assim gerada (TURKMAN, 2000).
A Figura 3 apresenta um exemplo de uma amostra gerada pelo
Amostrador de Gibbs com a distribuição Beta com parâmetros
1, respectivamente e a sua função de autocorrelação correspondente.
Figura 3. Exemplo de uma simulção utilizando o amostrador de Gibbs com
distribuição Beta para gerar amostras com 50000 iterações, =3 e =1.
Fonte: Elaborado pela autora.
A ideia básica do Amostrador de Gibbs é tornar um problema multivariado
numa sequência de problemas univariados, entre os quais itera-se para produzir
uma cadeia de Markov. O Amostrador pode ser visualizado como uma
implementação prática do fato de que o conhecimento das distribuições
condicionais é suficientes para determinação da distribuição conjunta se ela
existir.
1.4.6 Distribuições de Probabilidades utilizadas
1.4.6.1 Distribuição Binomial
Uma variável aleatória com distribuição Binomial representa o número de
sucessos obtidos em experimentos com probabilidade p de sucesso. Em que
pode ser o número de ocorrências de chuva em um mês e a probabilidade
de ocorrência desse evento em um determinado mês para qualquer ano. O
número total de sucessos é uma variável aleatória com distribuição binomial
com parâmetros e e é denotada por .
Então a probabilidade de X=x, pode ser obtida a partir da seguinte equação:
Eq. (1)
A média de um variável aleatória binomial é e a variância é
Uma Função de densidade de probabilidade (FDP) é uma função que
descreve a probabilidade relativa de uma variável aleatória, ou seja, ajuda a
identificar regiões de probabilidades superiores e inferiores para os valores de
uma variável aleatória. A Figura 4 mostra um exemplo de FDP da distribuição
Binomial Negativa, que é definida pela Sequência de ensaios Bernoulli
independentes (generaliza a geométrica) com 100 ensaios.
Figura 4. Função densidade de probabilidade da distribuição Binomial Negativa.
Fonte: Elaborado pela autora.
1.4.6.2 Distribuição de Poisson
Uma outra distribuição comum é a distribuição Poisson, e é
frequentemente usada para modelar o número de ocorrências de um evento por
um certo período de tempo ou por um certo volume ou por uma certa área.
A distribuição Poisson tem apenas um parâmetro , que é interpretado como
uma taxa média de ocorrência do evento, e a probabilidade de ocorrerem
exatamente x eventos é dada por:
Eq. (2)
1.4.6.3 Distribuição Beta
A distribuição Beta é uma distribuição de probabilidade contínua, com dois
parâmetros positivos e , cuja função de densidade para valores é
Eq. (3)
No modelo, os parâmetros e definem a forma da distribuição. Se
, a distribuição é simétrica; se , a assimetria é negativa e, no caso de
, sua assimetria é positiva.
Nesse exemplo da Figura 5, o ponto mais importante é se os parâmetros
são maiores ou menores a 1. A função fica em formato de U quando e são
frações positivas e simétricas. Se a = b = 1, obtemos a distribuição uniforme em
[0,1].
Figura 5. Exemplo de Função densidade de probabilidade da distribuição Beta
com assimetria e simetria.
Fonte: CRAWLEY (2013).
2 MATERIAIS E MÉTODOS
Os dados em análise referem-se às séries históricas de precipitação
acumulada diária da cidades de Natal, capital do estado do Rio Grande do Norte.
Os dados foram captados por pluviômetro e disponibilizados no site da Empresa
de Pesquisa Agropecuária do Rio Grande do Norte-EMPARN. O pluviômetro
encontra-se localizado dentro da estação climatológica do Instituto Nacional de
Meteorologia-INMET, sob as seguintes coordenadas geográficas, latitude
5,916667ºS e longitude 35,2°W, conforme está apresentado na Figura 6.
Figura 6. Área de estudo englobando a localização do pluviômetro dentro da
cidade de Natal-RN
Fonte: Elaborado pela autora.
A série de dados utilizada nesse trabalho abrange ao todo 25 anos de
dados históricos (1992-2017). Para dar continuidade a metodologia, os dados
foram separados por meses, agrupando apenas os dias. Os meses escolhidos
foram os meses de janeiro e março, ambos meses de 31 dias, sendo janeiro o
escolhido para representar o mês seco e março para o mês chuvoso. Em posse
dos dados, foi definida os parâmetros das distribuições para ser inseridas no
Algoritmo de Gibbs.
A distribuição Poisson possui apenas um parâmetro , que é interpretado
como uma taxa média de ocorrência do evento. Logo, aplicou-se a distribuição
Poisson em dias que ocorreram eventos extremos, para exemplificação do
modelo, considerou-se qualquer valor de precipitação abaixo de 5 mm.
A distribuição Beta é uma distribuição de probabilidades contínua, com
. A distribuição beta pode ser usada na análise bayesiana
para descrever conhecimentos iniciais sobre a probabilidade de sucesso. Por
exemplo, a probabilidade de ter ocorrido uma precipitação em um certo mês.
Em seguida, as probabilidades e os parâmetros da distribuição foram
inseridas no Algoritmo de Gibbs, descrito a seguir:
Para descrever o algoritmo suponha que a distribuição de interesse é em
que Cada uma das componentes pode ser um escalar ou
um vetor.
1. Inicialize o contador de iterações da cadeia e especifique valores
iniciais ;
2. Obtenha os novos valores de através de
gerações sucessivas de valores;
. . .
3. Atualize o contador para e volte ao passo 2 até a convergência ser
alcançada.
Após a convergência, os valores resultantes formam uma amostra de
. Este algoritmo é extremamente útil quando a forma das distribuições
condicionais completas são conhecidas.
Todos as rotinas foram implementados usando funções pré-existentes do
software estatístico R, na versão 3.3.2 e no Rstudio, podendo ser encontrados
no Anexo. Para organizar os dados, utilizou-se o software Excel 2013, editor de
planilhas do Office. E por fim, para a confecção do mapa da área de estudo,
utilizou-se o Software de geoprocessamento Quantum GIS 2.16.3.
De posse dos dados da série sintética de precipitação, foi feita uma
análise estatística de erros utilizando para avaliar o nível de concordância
existente as referidas metodologias. A referida análise estatística constou do
cálculo do Erro Médio de Bias (MBE) e do Erro Relativo do Quadrado Médio
(RMSE) (WIilks, 2006).
A partir dos cálculos dos erros será possível inferir a qualidade do modelo
para gerar amostras de precipitação sintéticas.
3 RESULTADOS
A figura abaixo mostra o histograma da precipitação diária durante os
meses de janeiro e março, para a cidade de Natal/RN. Um histograma é a
representação gráfica de uma distribuição de frequência. Para ambos meses, o
valor que ocorre com mais frequência é o zero, porém, para o mês de janeiro o
valor zero ocorreu aproximadamente 500 vezes, enquanto que para o mês de
março, o zero ocorreu em aproximadamente 350 vezes. O que caracteriza o mês
de março como chuvoso, nesse caso, é a ocorrência em maior frequência dos
valores de precipitação acima de 30 mm por dia.
Figura 7. Histograma da série de precipitação diária para todos os dias de
janeiro e de março.
Fonte: Elaborado pela autora.
Tendo em vista que os valores abaixo de 20 mm ocorrem com mais
frequência definiu-se esse valor como limiar para a realização das séries
sintéticas. Em seguida, definiu-se os parâmetros das distribuições Binomial,
Poisson e Beta.
Os parâmetros foram escolhidos com base nos critérios de aplicação de
cada probabilidade, em que:
Para gerar valores da distribuição Binomial durante o mês de janeiro,
considerou-se a não ocorrência de chuva ou . A média de dias que
não choveu nos últimos 25 anos é de 21 dias por mês. Logo, para cada mês de
janeiro na cidade de Natal a probabilidade de não ocorrência de chuva é em
torno de .
Figura 8. Histograma dos dados gerados pela distribuição binomial com n = 806
e p = para o mês de janeiro.
Fonte: Elaborado pela autora.
Para gerar valores da distribuição Binomial durante o mês de março,
considerou-se a não ocorrência de chuva ou . A média de dias que
não choveu nos últimos 25 anos é de 17 dias por mês. Logo, para cada mês de
janeiro na cidade de Natal a probabilidade de não ocorrência de chuva é em
torno de .
Figura 9. Histograma dos dados gerados pela distribuição binomial com
e para o mês de março.
Fonte: Elaborado pela autora.
Aplicou-se a distribuição de Poisson para dias que ocorreram eventos
extremos, raros. Aqui vamos considerar, para exemplificação, considerou-se
valores de precipitação abaixo de 5 mm. O parâmetro foi definido de modo
que para o mês de janeiro seja igual a e para o mês de março seja igual
a
Geralmente, os valores extremos, raros de precipitação testado nesse
modelo deveriam ser com base nos maiores valores observados, porém, caso
fosse utilizados os maiores valores observados, a série sintética poderia capitiar
esse comportamento e aumentar todos os valores gerados, causando um
discrepância em relação a série histórica. Então, procurou-se modelar os valores
que ocorrem com mais frequências.
Figura 10. Histograma dos dados gerados pela distribuição de Poisson para
para o mês de janeiro
Fonte: Elaborado pela autora.
Figura 11. Histograma dos dados gerados pela
0,39 para o mês de março.
Fonte: Elaborado pela autora.
Para a distribuição Beta, considerou-se que durante os meses de janeiros
a precipitação que ocorre com maior frequência está toda concentrada abaixo
de 10 mm, temos que a probabilidade de ocorrência desses valores é alta. Os
parâmetros na média e variância da série
de precipitação diária do mês de janeiro e do mês março. A probabilidade de ter
ocorrido a precipitação abaixo de 10mm em um mês de janeiro é apresentada
pela Figura 12A. A Figura 13 mostra o histograma dos dados de precipitação
para o mês de março gerados pela distribuição Beta.
Fonte: A) Elaborado pela autora. B) CRAWLEY (2013).
Figura 13. Histograma dos dados gerados pela distribuição Beta para o mês de
março.
Fonte: Elaborado pela autora.
para o mês de janeiro foram
respectivamente e , o
definem a forma da distribuição, se , a distribuição é simétrica. A Figura
Figura 12. A) Histograma dos dados gerados pela distribuição Beta para o mês
de janeiro e B) Função de densidade de probabilidade de uma distribuição Beta.
12B mostra um exemplo de uma distribuição Beta simétrica obtida
CRAWLEY (2013), para uma função f(x) em que seus parâmetros
. Para o mês de março os parâmetros foram
os seguintes: e .
Em seguida, implementou-se o algoritmo de Gibbs no software R para
simular as precipitações diárias de 161 janeiros, ou seja, 5000 iterações ,
considerando as distribuições e condições citadas anteriormente. Em um
computador com processador Intel Core i5 o código copilado demorou cerca de
30 segundos para gerar as amostras. Aumentando-se para 50000 interações, a
copilação do código demoraria 1 minuto, e assim sucessivamente.
Aplicando-se o esquema iterativo do algoritmo de Gibbs para as
distribuições, Beta, Binomial e Poisson, gerou-se uma sequência de
e as funções de autocorrelação (ACF).
3.1 SIMULAÇÃO PARA O MÊS DE JANEIRO
De acordo com a Figura 14 observa-se que as amostras geradas não
estão muito correlacionadas, pois os valores da série de tempo sintética não
permanecem no mesmo ponto, ou seja, não apresenta estacionariedade.
Gerados os valores dessas distribuições foi possível obter as estatísticas de
interesse para a precipitação sintética gerada com as distribuições, Beta,
Binomial e Poisson.
Figura 14. Gráfico de séries de tempo sintética, de autocorrelação amostral para
as distribuições Beta, Binomial e Poisson para o mês de janeiro.
Fonte: Elaborado pela autora.
A Figura 15 mostra a série temporal sintética da amostra gerada pelo
amostrador de Gibbs para 5000 iterações (m), combinando as distribuições Beta
e Poisson. Nota-se, que as amostras geradas não ultrapassam 25 mm, pois esse
modelo não busca simular os extremos e sim os valores que ocorrem com maior
frequência.
Figura 15. Série temporal sintética combinada da amostra gerada pelo
Amostrador de Gibbs para 161 meses de janeiro.
Fonte: Elaborado pela autora.
O histograma da Figura 16 da série temporal sintética combinada da
amostra gerada pelo Amostrador de Gibbs para as 5000 interações (
apresenta uma forma distinta, em que é possível notar tanto as características
da distribuição Beta quantos as características da distribuição de Poisson. As
maiores frequências estão centradas no acumulado diário de chuva abaixo de
10 mm.
Figura 16. Histograma da série temporal sintética combinada da amostra
Gerada pelo Amostrador de Gibbs para 161 meses de janeiro. O histograma e a
densidade foi obtido a partir da soma dos amostras geradas com distribuição
Beta e Possion.
Fonte: Elaborado pela autora.
A Figura 17 mostra a série temporal sintética para a distribuição Binomial
e a função de autocorrelação (ACF) das amostras geradas pelo Amostrador de
Gibbs. Os valores da série variam de 0 a 1, de forma que esse valores
representam a ocorrência de chuva para a série sintética gerada pelo
Amostrador de Gibbs. Assim, para o dia considerado chuvoso é adotado o
modelo com as distribuições Beta e Poisson para a quantidade precipitada.
Figura 17. Gráfico da série de tempo sintética com a distribuição Binomial
gerada pelo Amostrador de Gibbs.
Fonte: Elaborado pela autora.
De acordo com a Figura 18, a dispersão entre a precipitação simulada e
a observada é alta, ou seja, não estão associados entre si, mesmo apresentando
uma tendência positiva entre as estimativas.
Figura 18. Diagrama de dispersão entre a precipitação simulada e a observada
para o mês de janeiro.
Fonte: Elaborado pela autora.
Para testar a eficiência do modelo foi calculado o Erro Relativo do
Quadrado Médio (RMSE), o Erro Médio de Bias (MBE), índice de concordância
de Willmott (d) e o Coeficiente de Correlação de Pearson (R). Pela Tabela 1
temos que os valores de precipitação simulados pelo modelo superestimaram o
observado em quase 9 mm e que não apresentam uma boa correlação, pois o
coeficiente de correlação é baixo, cerca de 0,20.
Tabela 1. Erros da precipitação simulada para o mês de janeiro.
RMSE (mm) M B E ( mm) d R (Pearson)
8,79 -0,68 0,85 0,20
Fonte: Elaborado pela autora.
3.2 SIMULAÇÃO PARA O MÊS DE MARÇO
De acordo com a Figura 19 observa-se que as amostras geradas com a
distribuição Poisson e Binomial e não estão muito correlacionadas, pois os
valores da série de tempo sintética não permanecem no mesmo ponto, ou seja,
não apresenta estacionariedade. Porém, as amostras geradas com a distribuição
beta apresentam uma boa correlação.
Figura 19. Gráfico de séries de tempo sintética, de autocorrelação amostral para
as distribuições Beta, Binomial e Poisson para o mês de março.
Fonte: Elaborado pela autora.
A Figura 20 mostra a série temporal sintética da amostra gerada pelo
amostrador de Gibbs para 5000 iterações (m), combinando as distribuições Beta
e Poisson. Nota-se, que as amostras geradas não ultrapassam 50 mm, pois esse
modelo não busca simular os extremos e sim os valores que ocorrem com maior
frequência.
Figura 20. Série temporal sintética combinada da amostra gerada pelo
Amostrador de Gibbs para 161 meses de março.
Fonte: Elaborado pela autora.
O histograma da Figura 20 da série temporal sintética combinada da
amostra gerada pelo Amostrador de Gibbs para as 5000 interações (
apresenta uma forma distinta, em que é possível notar tanto as características
da distribuição Beta quantos as características da distribuição de Poisson. As
maiores frequências estão centradas no acumulado diário de chuva abaixo de
10 mm.
Figura 21. Histograma da série temporal sintética combinada da amostra
Gerada pelo Amostrador de Gibbs para 161 meses de março. O histograma e a
densidade foi obtido a partir da soma dos amostras geradas com distribuição
Beta e Possion.
Fonte: Elaborado pela autora.
A Figura 22 mostra a série temporal sintética para a distribuição Binomial
e a função de autocorrelação (ACF) das amostras geradas pelo Amostrador de
Gibbs. Os valores da série variam de 0 a 1, de forma que esse valores
representam a ocorrência de chuhva para a série sintética gerada pelo
Amostrador de Gibbs. Assim, para o dia considerado chuvoso é adotado o
modelo com as distribuições Beta e Poisson para a quantidade precipitada.
Figura 22. Gráfico da série de tempo sintética para a distribuição Binomial
gerada pelo Amostrador de Gibbs.
Fonte: Elaborado pela autora.
De acorodo com a Figura 23, a dispersão entre a precipitação simulada e
a observada é alta próximo ao eixo 0, ou seja, não estão associados entre si. As
estimativas apresentam uma tendência linear positiva.
Figura 23. Diagrama de dispersão entre a precipitação simulada e a observada
para o mês de março.
Fonte: Elaborado pela autora.
Para testar a eficiência do modelo foi calculado o Erro Relativo do
Quadrado Médio (RMSE), o Erro Médio de Bias (MBE), índice de concordância
de Willmott (d) e o Coeficiente de Correlação de Pearson (R). Pela Tabela 2
temos que os valores de precipitação simulados pelo modelo superestimaram o
observado em quase 3 mm e que apresentam uma boa correlação, pois o
coeficiente de correlação é de 0,60.
Tabela 2. Erros da precipitação simulada para o mês de março.
RMSE (mm) M B E ( mm) d R (Pearson)
3,41 -0,75 0,78 0,60
Fonte: Elaborado pela autora.
Em seguida foi feita uma estatística descritiva do comportamento da
precipitação durantes os dias de janeiro e de março, bem como os valores
estimados para os respectivos meses afim de comparar o comportamento de
ambas séries. Os valores da estatística descritivas encontra-se na Tabela 3.
Tabela 3. Estatística descritivas para as séries observadas e simuladas.
JAN MAR
Simulada Observada Simulada Observada
Média (mm) 1,93 2,62 3,42 6,80
Erro padrão (mm) 0,14 0,34 0,37 0,55
Mediana (mm) 0 0 0 0,3
Moda (mm) 0 0 0 0
Desvio padrão (mm) 4,04 9,79 10,75 15,63
Variância (mm) 16,38 95,90 115,60 244,37
Curtose (mm) 33,87 62,25 39,79 13,98
Assimetria (mm) 4,48 7,07 5,59 3,51
Alcance (mm) 50,36 115,6 49,08 111,4
Minimo (mm) 0 0 0 0
Máximo (mm) 50,3 115,6 50,0 111,4
Somatório (mm) 1563 2112 2755 5479
Count 806 806 806 806
Nível de confiança (95%) 0,27 0,67 0,744 1,08
Fonte: Elaborado pela autora.
As séries simuladas devem gerar com boa representatividade uma série
sintética, os valores mínimos foram iguais em todas as séries observadas e
simuladas e a média do simulado foi o dobro do observado para os dois meses.
4 DISCUSSÕES
Uma série sintética é o resultado da associação de séries de dados reais
com número aleatório produzidos por algoritmos computacionais, a fim de gerar
sequências de números aleatórios que se assemelham aos dados climáticos
reais (WILKS, 1999).
Há poucos relatos na literatura nacional da utilização do algoritmo do
Amostrador de Gibbs para simular série sintética de precipitação. Basicamente,
a maioria dos geradores de série sintética de precipitação utilizam modelos
estocásticos clássicos como ARIMA, Holt-Winters e Box-Jenkins, modelos
computacionais como as Redes Neurais Artificiais, além de distribuições de
probabilidades, como o modelo desenvolvido por Baena (2004).
Santos (2010) utilizou um modelo estocástico para a geração de série
climática via Redes Neurais Artificiais (RNAs), um método computacional que
processa modelos matemáticos a fim de reconhecer padrões de dados
adquirindo conhecimento através da experiência. A partir disso é possível que a
série sintética apresente características mais significativas e representativas. O
autor mostrou que o modelo apresentou um bom desempenho, mas que havia
necessidades de buscar novas arquiteturas em busca de melhorar os resultados.
A dificuldade em simular extremos também foi encontrado por Santos
(2010), em que o autor descreve que os pontos de picos/extremos foram os
maiores problemas da rede.
Contudo, o modelo de simulação de precipitação via Amostrador de Gibbs
apresentou-se como adequado para a série de precipitação diária acumulada da
cidade de Natal, já que as diferenças encontradas não foram tão significativas,
uma vez que o observado e a série sintéticas tendem para a mesma conclusão.
5 CONCLUSÕES
O Algoritmo de Gibbs apresenta-se como uma técnica de simulação
conceitualmente simples, mas de grande poder e aplicabilidade a diversas áreas
do conhecimento. Na aplicação prática feita neste trabalho pode-se constatar a
eficiência do Algoritmo de Gibbs. As estimativas simuladas para precipitação
diária foram muito próximas dos valores observados.
As séries sintéticas são fundamentais para o conhecimento das
características da precipitação em locais onde a precipitação observada
apresenta falhas, essas características são a intensidade, o total precipitado e a
duração, além da sua distribuição temporal e espacial, que favorece o
planejamento e a gestão dos recursos hídricos.
O Amostrador de Gibbs é restrito a problemas onde as distribuições a
posteriori condicionais são disponíveis, ou seja, a geração de variáveis aleatórias
destas distribuições é possível. Esta restrição pode ser removida se utilizar o
algoritmo de Metropolis-Hastings para a geração as distribuições condicionais
que tem formas intratáveis. O Amostrador de Gibbs é um método essencialmente
simples de se implementar, mesmo com limitados recursos computacionais.
O modelo de forma geral, apresentou um comportamento bastante
semelhante com o observado, com as mesmas características estatísticas da
série histórica, as médias foram próximas, os extremos foram bem
representados na série sintética.
Os erros ficaram centrados em torno de zero, isso é um grande indicativo
de que as diferenças encontradas na série como subestimação e
superestimação de valores foram pequenas. E essa superestimação já era
esperada, pois a média da precipitação diária sintética era o dobro da média da
precipitação diária observada.
As série sintéticas foram geradas com um software livre e de código
aberto, disponível para download no seu repositório, com baixo desempenho
computacional, dessa forma será possível qualquer usuário utilizar esse modelo
para gerar séries sintética de precipitação diária de forma mais genérica,
baseando-se nas condições pluviométricas observadas.
Concluo esse trabalho citando um trecho de Ehlers (2007) que trata da
propagação de erros em simulações:
Apesar da sua grande utilidade, os métodos de simulação devem
ser aplicados com cautela. Devido à facilidade com que os recursos
computacionais podem ser utilizados hoje em dia, corremos o risco
de apresentar uma solução para o problema errado ou uma solução
ruim para o problema certo. Assim, os métodos computacionalmente
intensivos não devem ser vistos como substitutos do pensamento
critico sobre o problema por parte do pesquisador.
6 REFERÊNCIAS
ANDRADE NETO, JULIO V. DE. Determinação de séries sintéticas de
precipitação no Rio Grande do Norte: considerando os cenários de
mudanças climáticas. XXVIII CICT Congresso de Iniciação Científica da UFRN.
Natal, Rio Grande do Norte, 2017.
BENJAMIN, J.R.; CORNELL, C.A. Probability, statistics, and decision theory
for civil engineers. New York: McGraw-Hill, 1970. 685p.
BOX, G. E. P.; JENKINS, G. M. & REINSEL, G. C. Time Series Analysis: Fore-
casting and Control. New Jersey, Prentice Hall, 1994.
CAERN. Zona Norte terá rodízio no abastecimento a partir desta quarta-feira
(08). 2017. Disponível em:
<http://www.caern.rn.gov.br/Conteudo.asp?TRAN=ITEM&TARG=140006&ACT;
=&PAGE;=&PARM;=&LBL=MAT%C9RIA>. Acesso em: 21 nov. 2017.
CALENDA, G.; NAPOLITANO, F. Parameter estimation of Neyman-Scott pro-
cesses for temporal point rainfall simulation. Journal of Hydrology, Rome,
v.225, n.1-2, p.45-66, 1999.
EHLERS, R. S. Introdução à Inferência Bayesiana. Curitiba: Universidade
Federal do Paraná, Departamento de Estatística. 2007.
ESPINOSA, A. M.. : Previsão quantitativa por conjunto da precipitação do
verão 2007/2008 na bacia de Rio Grande.2011. 172 f. Tese (Doutorado) -
Curso de Pós-graduação em Meteorologia, Instituto de Astronomia Geofísica e
Ciências Atmosféricas, Universidade de São Paulo, São Paulo, 2011.
FERREIRA, N. S., 1996. Zona de Convergência Intertropical. Climanálise
Especial. Edição Comemorativa de 10 anos. FUNCEME. 136 139.
FRIZZONE, J. A. Análise de cinco modelos para o cálculo da distribuição
de frequência de precipitações na região de Viçosa, MG. 1979. 100 f.
Dissertação (Mestrado em Irrigação e Drenagem) Universidade Federal de
Viçosa, Viçosa, 1979.
GAMERMAN, D. Simulação Estocástica Via Cadeias de Markov. ABE -
Associação Brasileira de Estatística. 1996.
HUTCHINSON, M.F. A point rainfall model based on a three - state continuous
Markov occurrence process. Journal of Hydrology, Rome, v.114, n. 1-2, p.125-
148, 1990.
OLIVEIRA, V. P. S. Modelo para geração de séries sintéticas de
precipitação. 2003. 156 f. Tese (Doutorado) - Curso de Pós-Graduação em
Recursos Hídricos e Ambientais, Universidade Federal de Viçosa, Viçosa, 2003.
MIGON, H. S. e GAMERMAN, D. Statistical Inference - an integrated approach.
Arnold. 1999.
PALMER, T. N.; ANDERSON, D. L. T. The Prospects for Seasonal Forecasting
a Review Paper. Q. J. R. Meteorol. Soc., 117, pp. 91-106, 1994.
SIMAS, H. S.. Aspectos metodológicos em análise de séries temporais
epidemiológicas do efeito da poluição atmosférica na saúde pública: Uma
revisão bibliográfica e um estudo comparativo via simulação. 2003. 103 f.
Dissertação (Mestrado) - Curso de Pós-graduação em Saúde Coletiva, . Instituto
de Medicina Social, Universidade Estadual do Rio de Janeiro, Rio de Janeiro,
2003. Disponível em: <http://site.ims.uerj.br/pesquisa/ares-
rio/download/hugo_ims2003_tese.pdf>. Acesso em: 10 set. 2017.
SANTOS, Carlos A. S; LUCIO, Paulo Sério. STOCK-WEATHER: Um modelo
estocástico para geração de séries climatológicas via Redes Neurais Artificiais:
O caso dos Modelos Univariados. In: CONGRESSO BRASILEIRO DE METE-
OROLOGIA, 16., 2010, Belém. Anais... . Belém: Sbmet, 2010.
in Science, 282, 1998, pp. 728-31.
Soc., 126, 2000b, pp. 2.265-91.
VILLELA, S.M.; Mattos, A. Hidrologia aplicada. São Paulo: McGraw-Hill do Brasil,
1975. 245p.
TURKMAN, M. A. A. (2000). How and why does the Gibbs sampler work? Re-
vista de Estatística, 3, 7-30.
WHEATER, H.s; ISHAM, V.s.; COX, D.r. L. Spatial temporal rainfall fields: mod-
elling and statistical aspects. Hydrology And Earth System Sciences, Lindau,
v. 4, p.581-601, 2000.
WILKS, D. S.. Simutaneous stochastic simulation of daily precipitation, tempera-
ture and solar radiation at multiple sites in complex terrain. Agricultural And
Forest Meteorology, Amsterdam, v. 96, n. 1-3, p.85-101, 1999.
7 ANEXOS
Códigos em R
Bin=read.table("precip.csv", head=T, sep=";")
Bin
attach(Bin)
fbin=rbinom(Precip, 808, 0.6774194)
summary(fbin)
hist(fbin, density=30, main = "", axes = T, xlab = "dias sem chuva", ylab =
Pois=read.table("precip.csv", head=T, sep=";")
attach(Pois)
head(Pois)
lambda =0.3293785
fpois=rpois(Precip, lambda)
fpois
hist(fpois,density=30)
#estimando alfa e beta com a média e a variância
estBetaParams <- function(mu, var) {
alpha <- ((1 - mu) / var - 1 / mu) * mu ^ 2
beta <- alpha * (1 / mu - 1)
return(params = list(alpha = alpha, beta = beta))
}
media= 0.4293785
vari= 0.2020252
uhum=estBetaParams(media, vari)
uhum
fbeta=rbeta(Precip, shape1= 0.09136418, shape2= 0.09136418, ncp = 0)
hist(fbeta,density=30)
u=read.table("precip.csv", head=T, sep=" ")
attach(u)
u
m = 5000
lambda = 0.5293785
a=0.09136418
b=0.1214182
#rpois(n, lambda)
dpois=rpois(Precip, lambda)
#rbinom(n, size, prob)
r=rbinom(Precip, 808, 0.6774194)
N=length(m)
X=length(m)
Y=length(m)
N[1]=1.6
Y[1]= 0.6774194
X[1]=1
for (i in 2:m)
{
Y[i]=rbeta(Precip,X[i-1]+a,N[i-1]-X[i-1]+b)
N[i]=rpois(Precip,(1-Y[i])*lambda)+X[i-1]
X[i]=rbinom(Precip,N[i],Y[i])
}
par(mfrow=c(3,2))
par(mai=c(0.77,0.77,0.0,0.07))
ts.plot(Y*10, ylab=expression(Y*10))
par(mai=c(0.77,0.77,0.45,0.07))
acf(Y*10, main=expression(Y*10), lag=30)
par(mai=c(0.77,0.77,0.0,0.07))
ts.plot(N, ylab=expression(N))
par(mai=c(0.77,0.77,0.45,0.07))
acf(N, main=expression(N))
par(mai=c(0.77,0.77,0.0,0.07))
ts.plot(X, ylab=expression(X))
par(mai=c(0.77,0.77,0.45,0.07))
acf(X, main=expression(X))
par(mfrow=c(2,3))
hist(X, )
hist(Y*10)
hist(N)
summary(X)
summary(Y*10)
summary(N)
N
Y
X
T=N+Y
T
ts.plot(T, type="l",ylab="Precipitação (mm)",xlab="Tempo (dias)", main="Série
Sintética da Precipitação para 161 meses de janeiro")
acf(T, main="Modelo Combinado")
hist(T,freq=TRUE,main="Modelo Combinado",density=30, ylab="Frequência",
xlab="")