investigando a previs~ao da curva de juros brasileira ... de economa... · palavras chave: curva de...

21
Investigando a Previs˜ ao da Curva de Juros Brasileira: Modelos de Fatores Lineares, VAR Bayesiano e Modelagem ARFIMA Jo˜ ao F. Caldeira Departamento de Economia e PPGE Universidade Federal do Rio Grande do Sul Hudson S. Torrent Departamento de Estat´ ıstica e PPGE Universidade Federal do Rio Grande do Sul Abstract Producing accurate forecasts of the term structure of interest rates is crucial for bond portfolio management, derivatives pricing, and risk management. Unfortunately, when analyzing brazilian yield curve, all the fore- casting models proposed so far in the macroeconomic and financial literature have a hard time in producing forecasts more accurate than a simple no-change forecast (i.e. a random walk forecast). In this paper we consider a bunch of models in order to investigate which ones are more appropriate to forecast yield curve in Brazil. In particular, we consider two estimators not before considered in the literature for Brazil: Bayesian VAR and ARFIMA class models. In the forecast exercise conducted in this paper the methods Bayesian VAR and ARFIMA present a valuable performance. Resumo A previs˜ ao acurada da estrutura a termo da taxa de juros ´ e crucial para gest˜ ao de portf´ olio de t´ ıtulos, precifica¸c˜ ao de derivativos e gest˜ ao de risco. Entretanto, quando analisada a curva de juros para o mer- cado brasileiro, os modelos de previs˜ ao propostos na literatura de macroeconomia e finan¸cas apresentam, na maioria dos casos, performance preditiva inferior ` a performance de um simples processo random walk. Portanto, neste trabalho consideramos uma s´ erie de modelos, a fim de investigar quais s˜ ao aqueles mais apro- priados para a previs˜ ao da curva de juros no Brasil. Em particular, consideramos dois estimadores ainda n˜ ao considerados na literatura para o Brasil: VAR Bayesiano e modelos da classe ARFIMA. No exerc´ ıcio de previ- ao apresentado no paper, os m´ etodos VAR Bayesiano e ARFIMA apresentam uma performance interessante. Keywords: Term structure of interest rate, Forecasting, nonlinear models, parametric models. Palavras Chave: Curva de juros, Previs˜ ao, modelos n˜ ao lineares, Modelos param´ etricos. JEL C53, E43, G17 * Autor Correspondente: J. F. Caldeira, Departamento de Economia e PPGE – UFRGS; E-mail: [email protected]; Tel.: +55-(51)3308-3440; Fax: +55-(51)3308-4050. Preprint submitted to 34 o EBE 24 de setembro de 2012

Upload: hathu

Post on 07-Dec-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Investigando a Previsao da Curva de Juros Brasileira: Modelos de FatoresLineares, VAR Bayesiano e Modelagem ARFIMA

Joao F. CaldeiraDepartamento de Economia e PPGE

Universidade Federal do Rio Grande do Sul

Hudson S. TorrentDepartamento de Estatıstica e PPGE

Universidade Federal do Rio Grande do Sul

Abstract

Producing accurate forecasts of the term structure of interest rates is crucial for bond portfolio management,derivatives pricing, and risk management. Unfortunately, when analyzing brazilian yield curve, all the fore-casting models proposed so far in the macroeconomic and financial literature have a hard time in producingforecasts more accurate than a simple no-change forecast (i.e. a random walk forecast). In this paper weconsider a bunch of models in order to investigate which ones are more appropriate to forecast yield curve inBrazil. In particular, we consider two estimators not before considered in the literature for Brazil: BayesianVAR and ARFIMA class models. In the forecast exercise conducted in this paper the methods Bayesian VARand ARFIMA present a valuable performance.

Resumo

A previsao acurada da estrutura a termo da taxa de juros e crucial para gestao de portfolio de tıtulos,precificacao de derivativos e gestao de risco. Entretanto, quando analisada a curva de juros para o mer-cado brasileiro, os modelos de previsao propostos na literatura de macroeconomia e financas apresentam,na maioria dos casos, performance preditiva inferior a performance de um simples processo random walk.Portanto, neste trabalho consideramos uma serie de modelos, a fim de investigar quais sao aqueles mais apro-priados para a previsao da curva de juros no Brasil. Em particular, consideramos dois estimadores ainda naoconsiderados na literatura para o Brasil: VAR Bayesiano e modelos da classe ARFIMA. No exercıcio de previ-sao apresentado no paper, os metodos VAR Bayesiano e ARFIMA apresentam uma performance interessante.

Keywords: Term structure of interest rate, Forecasting, nonlinear models, parametric models.Palavras Chave: Curva de juros, Previsao, modelos nao lineares, Modelos parametricos.JEL C53, E43, G17

∗Autor Correspondente: J. F. Caldeira, Departamento de Economia e PPGE – UFRGS; E-mail: [email protected]; Tel.:+55-(51)3308-3440; Fax: +55-(51)3308-4050.

Preprint submitted to 34o EBE 24 de setembro de 2012

1. Introducao

A estrutura a termo da taxa de juros define a relacao entre o yield de um tıtulo de renda fixa e o

tempo ate o vencimento do seu fluxo de caixa (maturidade). Assim, a curva de juros zero-cupom fornece a

relacao para tıtulos que fazem apenas um pagamento, na maturidade. A curva de juros zero-cupom serve

como base para precificacao de outros instrumentos de renda fixa e como input para varios modelos como,

por exemplo, gestao de risco, polıtica monetaria e precificacao de deriviativos. Embora os precos de tıtulos

zero-cupom possam ser usados para construir a curva de juros diretamente, a falta de liquidez do mercado e o

limitado espectro de maturidades disponıveis levam a necessidade da estimacao atraves dos precos de tıtulos

com cupom. Produzir previsoes precisas da estrutura a termo das taxas de juros e crucial para a gestao de

carteira de tıtulos de renda fixa, precificacao de derivativos e gestao de risco. Diversos trabalhos apresentam

formas alternativas, bem sucedidas, de previsao para a curva de juros zero-cupom para a economia americana.

Porem, quando se trata da curva de juros brasileira, grande parte dos modelos de previsao propostos ate agora

na literatura macroeconomica e financeira tem apresentado dificuldades em produzir previsoes mais precisas

do que um simples processo random walk.

Mais detalhadamente, os modelos para construcao de curvas de juros existentes podem podem ser di-

vididos em tres classes: os modelos de nao arbitragem; os modelos de equilıbrio; e modelos estatısticos ou

parametricos. O primeiro grupos contem modelos que se baseiam no paradigma de nao-arbitragem. Os

modelos de nao arbitragem tem foco no perfeito ajuste da estrutura a termo em um dado ponto do tempo,

assegurando que nao existam possibilidades de arbitragem, o que e importante para o aprecamento de deri-

vativos. Exemplos de modelos desta classe sao Ho & Lee (1986), Heath et al. (1992), Hull & White (1990)

e Dai & Singleton (2002). Na maioria dos casos a implementacao pratica destes modelos envolve impor uma

especificacao afim a um conjunto de fatores latentes. Os modelos afins da estrutura a termos funcionam

muito bem para ajuste da curva de juros (ver, por exemplo, de Jong, 2000; Dai & Singleton, 2002) mas

apresentam fraco desempenho quando o objetivo e fazer previsao. Duffee (2002) mostra que e difıcil bater

o random walk em termos de previsoes usando um modelo afim tradicional de nao-arbitragem da estrutura

a termo. Esta primeira classe de modelos tem a clara vantagem de ser fundamentada na teoria de financas,

enquanto o segundo grupo e aquele que ate agora produziu os melhores resultados na precisao das previsoes

de amostra. Os modelos de equilıbrio tem foco na modelagem da taxa instantanea, utilizando tipicamente

modelos afins, depois disso, as taxas de outros vencimentos podem ser derivadas sob varias suposicoes acerca

do premio de risco. Estes modelos tentam prever a curva de juros futura atraves de informacoes contidas

nas taxas forwards atuais. Modelos desta classe foram desenvolvidos em Vasicek (1977) Cox et al. (1985),

Duffie & Kan (1996) e Cochrane & Piazzesi (2005). Ang & Piazzesi (2003) mostram que impor condicao de

nao-arbitragem em modelos afim melhoram a previsao fora da amostra, mas o ganho em relacao ao random

walk ainda e pequeno, ja Almeida & Vicente (2008) encontram evidencias ligeiramente mais favoraveis a este

respeito. Hordahl et al. (2006), Favero et al. (2007) e Monch (2008) analisaram modelos com variaveis

macroeconomicas e mostraram que estas variaveis contribuem para uma melhor previsao da dinamica da

curva de juros.

A classe de modelos estatısticos ou parametricos e composta por modelos de componentes principais,

modelos de fatores ou de variaveis latentes, bem como por modelos de interpolacao. De acordo com Matzner-

Lober & Villa (2004), grande parte da intuicao a respeito da dinamica da rentabilidade de tıtulos de renda

fixa provem de modelos dessa classe, como em Litterman e Scheinkman (1991) e em Pearson & Sun (1994).

2

Dentre os modelos de fatores, o modelo de Nelson & Siegel (1987) e suas variantes, por exemplo, os modelos

de Diebold & Li (2006) e Svensson (1994a) sao os mais populares entre gestores de renda fixa e bancos centrais

conforme relatorio do BIS (2005). Diebold & Li (2006) argumentam que, apesar dos grandes desenvolvimentos

na modelagem teorica da estrutura a termo dos juros, pouca atencao foi dada a previsao da estrutura a termo.

Os modelos de nao arbitragem sao focados no ajuste para um dado ponto do tempo e tem muito pouco a

dizer sobre dinamica ou previsao fora da amostra. Ja os modelos de equilıbrio possuem algumas implicacoes

dinamicas dado um certo premio de risco, o que possibilita algum tipo de conclusao a respeito de previsoes

fora da amostra. Entretanto, ainda de acordo com Diebold & Li (2006), a maioria dos trabalhos dedicados

a modelos de equilıbrio focaram na performance dentro da amostra. Excecoes sao Duffee (2002), que mostra

que os modelos livre de arbitragem tem baixa performance em previsoes fora da amostra; e Egorov et al.

(2011) que mostram que modelos afins com volatilidade estocastica sao capazes de prever a distribuicao

condicional conjunta da rentabilidade dos tıtulos de renda fixa.

Tanto as especificacoes de Nelson & Siegel (1987) como Svensson (1994a) sao capazes de reproduzir uma

variedade das possıveis formas assumidas pela curva de juros. Entretanto, os modelos parametricos nao sao

imunes a problemas. Os modelos Nenslon & Siegel e Sensson nao sao formulados em uma estrutura dinamica

e o primeiro modelo nao e condizente com nao-arbitragem (ver Filipovic, 2009; Bjork & Christensen, 1999;

Diebold et al. , 2005; Christensen et al. , 2009, 2011). A primeira desvantagem foi abordada por Diebold

& Li (2006) , que aplicaram iterativamente uma versao simplificada do modelo de Nelson & Siegel para um

conjunto de dados dinamicos da curva de juros. Posteriormente, estimaram modelos de series de temporais

para as series dos fatores a fim de gerar previsoes para a curva de juros de zero-cupom, (a esse respeito ver

Diebold et al. , 2006; Almeida et al. , 2008; Caldeira et al. , 2010). Alguns autores dedicaram atencao ao

segundo problema, por exemplo, (ver Christensen et al. , 2007, 2009; Laurini & Hotta, 2010).

Fama & Bliss (1987) propuseram uma metodologia para construcao da estrutura a termo via taxas

forwards estimadas para as maturidades observadas. O metodo consiste em sequencialmente construir as

taxas forwards necessarias para precificar sucessivamente tıtulos com maturidades mais longas, chamadas de

taxas forwards nao-suavizadas de Fama e Bliss. A taxa de juros a termo resultante deste procedimento e

uma funcao com saltos (descontınua) em relacao ao vencimento do tıtulo que esta sendo utilizado (ver Hagan

& West, 2005).

Embora os modelos parametricos sejam importantes ferramentas para a estimacao e previsao da curva

de juros americana, esses modelos apresentam performance preditiva menos interessante, quando analisado o

mercado brasileiro de curva de juros. Nesse sentido, acreditamos ser desejavel buscar e investigar alternativas

capazes de superar a performance preditiva desses modelos para o Brasil. Vamos considerar neste trabalho,

alem de parte dos modelos supracitados, duas formas alternativas de estimacao da curva de juros zero-

cupom brasileira: VAR bayesiano e modelagem ARFIMA. O primeiro estimador proposto, VAR Bayesiano,

e motivado pelo recente trabalho de previsao de curva de juros para a economia americana de Carriero et al.

(2012). A ideia aqui e investigar se o processo de analise dos dados, inerentes a metodologia bayesiana, e

capaz de trazer ganhos para a previsao de curva de juros para o caso brasileiro. Mais detalhes sobre essa

metodologia serao dados em secoes posteriores. Alem disso, propomos investigar a performance de modelos

da classe ARFIMA na previsao da taxa de juros. A intuicao para a utilizacao dessa classe de modelos para

o caso brasileiro reside no seguinte fato: a quase totalidade das maturidades, se observadas ao longo do

tempo, se comporta como um processo proximo ao random walk. Ou seja, cada maturidade certamente nao

3

e um processo da classe ARMA e tambem nao parece apresentar estrutura de autocorrelacao suficiente que

justifique a utilizacao de modelos da classe ARIMA. A ideia aqui e, portanto, abrir a possibilidade de que o

processo seja algo entre um processo I(0) (estacionario) e um processo I(1) (raiz unitaria).

Este trabalho, portanto, tem por objetivo investigar uma serie de metodos, a fim de contribuir para a

previsao da curva de juros zero-cupom da economia brasileira. O trabalho possui mais cinco secoes alem

desta introducao. Na secao seguinte definimos o objeto de estudo, qual seja, a curva de juros zero-cupom. Na

secao 3 descrevemos os modelos autorregressivos utilizados para fazer previsao da curva de juros; na quarta

secao, desenvolvemos a metodologia de metodos parametricos tradicionalmente usados em previsao para a

curva de juros. Na secao 5, a performance preditiva dos metodos parametricos citados e comparada com a

performance dos modelos autorregressivos. A secao 6 estabelece algumas conclusoes.

2. Estrutura a termo, conceitos e notacoes

Estrutura a termo da taxa de juros descreve a relacao entre as taxas de juros e tıtulos com diferentes ma-

turidades. A taxa de juros de curto prazo e a taxa de juros anualisada de um perıodo de tempo inifinitesimal.

Na pratica, entretanto, a taxa de juros para horizonte de tres meses e considerada uma melhor aproximacao

da taxa de curto prazo porque, por exemplo, emprestimos overnight sao afetados por fatores que os modelos

de estrutura a termo nao cobrem (Anderson & Sleath, 2001). Neste artigo definimos a taxa de juros de curto

prazo como:

rt = yt(0) = limτ→0

yt(τ)

onde t denota o momento no tempo, τ a maturidade e yt(τ) a correspondente taxa de juros. Seja Bt(τ) o

preco de um tıtulo zero-cupom no tempo t que paga $1.00 na maturidade, τ , e yt(τ) a correspondente taxa

de juros.

Bt(τ) = exp [−yt(τ)τ ] (1)

Rescrevendo a equacao (1) obtem-se uma forma de descrever a taxa de juros como uma funcao do valor

do tıtulo:

yt(τ) = −1

τlog(Bt(τ)). (2)

Desde que Bt(τ) e um fator de desconto simples, e claro que yt(τ) nao pode assumir valores negativos para

assegurar que o fator de desconto descrito em (2) assuma valores entre zero e um.

Na pratica, no entanto, surgem complicacoes, apesar de serem observados tıtulos negociados com dife-

rentes maturidades, a curva de juros nao e diretamente observada, muito menos curvas de juros zero-cupom

para vencimentos padronizados. Assim, a curva de juros deve ser estimada a partir dos precos dos tıtulos

observados. As taxas forward implıcitas sao definidas como taxas de retornos marginais que os investidores

requerem para manter tıtulos de diferentes maturidades. O conjunto de taxas forward instantaneas, f(u),

estao relacionadas aos precos de um tıtulo zero-cupom com maturidade τ , Bt(τ) por:

Bt(τ) = exp

[−∫ τ

0

f(u)du

](3)

A equacao (3) mostra que para medir estas taxas forwards diretamente do mercado requer um conjunto de

precos de tıtulos zero-cupom observaveis para um continuum de maturidades (a funcao de desconto). Na

4

pratica as funcoes de desconto nao sao diretamente observaveis – sao observados apenas os precos de tıtulos

com e sem cupons. No entanto, o preco observado de cada tıtulo pode ser escrito em termos desta funcao

de desconto. Fazendo ci denotar o fluxo de caixa de um tıtulo no tempo τi e n refere-se ao numero de

pagamentos restantes, o preco do tıtulo, P (ci, τi) i = 1, . . . , n, pode ser expresso como:

P (ci, τi) =

n∑i=1

ciB(τi) (4)

Juntamente com a equacao (3), isto mostra que ha uma relacao direta entre os precos dos tıtulos que

sao observados e as taxas forward instantaneas. Outras complicacoes surgem, entretanto, por que embora

sejam negociados tıtulos com diversas maturidades, nao sao observadas em cada perıodo de tempo yields

para maturidades padronizadas. Assim, as curvas de juros precisam ser estimadas a partir dos precos dos

tıtulos observados. Um abordagem amplamente usada para construcao de curvas de juros foi proposta por

McCulloch (1971, 1975), que modela a curva de desconto atraves de splines polinomiais.1

3. Previsao da Curva de Juros com Modelos Auto-regressivos

Nesta secao sao apresentados os dois modelos auto-regressivos, BVAR e ARFIMA, que sao a maior

contribuicao deste trabalho, por nao terem sido ate entao aplicados ao problema de previsao da curva de juros

brasileira. Alem disso, diferentes modelos auto-regressivos comumente considerados na literatura de previsao

de curva de juros sao apresentados. Sao eles randon walk e modelos lineares (modelos autorregressivos e

vetores autorregressivos).

3.1. Vetor Auto-regressivo Bayesiano (BVAR)

Considere o seguinte vetor autorregressivo:

yt = A + Byt−1 + εt, (5)

O modelo VAR acima pode ser escrito em uma notacao mais compacta, definido como um sistema de regressoes

multivariado:

YT×N

= XT×K

FK×N

+ ET×N

(6)

Onde Y = [yh+1, . . . , yT ]′, X = [X1, . . . ,XT ]

′com Xt =

[Y′t−1 . . . ,Y

′t−p,1,

], F = [Ah,Bh]

′e uma matriz

K×N contendo todos os coeficientes e E = [εh+1, . . . , εT ]′e a matriz de resıduos. Note que o vetor de taxas de

juros yt e regredido diretamente sobre yt−h, o que significa que e empregado um modelo diferente para cada

horizonte de previsao, abordagem direta, discutida anteriormente. Alternativamente pode ser empregada a

abordagem powering up.2 A abordagem direta implica que a previsao h-passos a frente e uma funcao linear

dos coeficientes: yt+h = Ah + Bhyt, enquanto na abordagem tradicional as previsoes multi passos a frente e

funcao nao-linear dos coeficientes estimados.

A confianca na prior e imposta definindo os momentos a seguir para a distribuicao a priori dos coeficientes:

1Para mais detalhes e aplicacoes deste metodo, ver Hagan & West (2006) e Hayden & Ferstl (2010).2Para uma discussao e comparacao destas abordagens alternativas ver, por exemplo, Marcellino et al. (2006), Carriero et al.

(2011) e Pesaran et al. (2011).

5

E[Bijh

]=

δi se i = j

0 se i 6= j, Var

[Bijh

]= θ

σ2i

σ2j

(7)

Assume-se que os coeficientes em Bijh tem prior independente e normalmente distribuıda. Finalmente, a

especificacao e concluıda assumindo que o intercepto Ah tem prior normal difusa e a matriz dos resıduos tem

prior Wishart invertida, Σ ∼ iW (v0, S0), em que v0 e S0 sao parametros de escala e forma da prior, onde

Σ = diag(σ2

1 , . . . , σ2N

).

Banbura et al. (2010) sugerem definir δi = 1 para todo i, refletindo a crenca de que todas as variaveis

sao caracterizadas por elevada peristencua. As taxas de juros, independente da maturidade, sao processos

que exibem elevada persistencia, portanto, nao e surpreendente que um modelo autorregressivo simples e

processos Random Walk sem drift produzem boas previsoes das taxas de juros. Assim, e razoavel supor que a

prior de cada taxa de juros em (6) siga um AR univariado com elevada persistencia, ou seja, E [B] = 0.99×I,

tambem e necessario avaliar o quao forte e a confianca na prior definindo uma variancia.

O hiperparametro θ controla a proximidade da prior em torno do random walk ou AR e governa a

importancia relativa da confianca na priori em relacao as informacoes contidas nos dados. Para θ → 0 a

posterior e igual a prior e os dados nao influenciam as estimativas. Se θ →∞, por outro lado, a expectativa

posterior coincide com as estimativas de OLS. Banbura et al. (2010) argumentam que θ devere ser escolhido

levando-se em conta o tamanho do sistema. A medida que o numero de variaveis aumenta o parametro deve

ser reduzido para evitar overfitting (ver, De Mol et al. , 2008).

Para operacionalizar a prior e preciso escolher o valor do hiperparametro θ. Assim como em Carriero

et al. (2012), neste trabalho o valor de θ e definido de forma a maximiaxar a densidade marginal que pode

ser obtida integrando para todos os coeficientes do modelo, i.e., definindo o conjunto de todos os coeficientes

do modelo como Θ, a densidade maginal e:

p(Y ) =

∫p (Y |Θ) p (Θ) dΘ (8)

Considerando a prior como uma distribuicao normal Wishart invertida a densidade p(Y ) pode ser computada

em forma fechada (ver Bauwens et al. , 2000). Em cada ponto do tempo θ e escolhido de forma a maximizar:

θ∗t = argθ

max ln p(Y ) (9)

Para a escolha do parametro θ e considerado um grid de valores, θ ∈ 2e−16, 4e−16, 6e−16, 8e−16, 1e−15, 0.00001,

0.0001, 0.001, 0.01, 0.1, 10. Como e estimado um modelo para cada horizonte de previsao, tambem e seleci-

onado um θ∗ otimo para cada horizonte. O valor otimo de θ∗ fica proximo a 0.001 para todos os horizontes

de previsao considerados, sendo que se o parametro for mantido fixo em 0.001 para toda a amostra os re-

sultados sao muito similares. O fator σ2i /σ

2j e um parametro de escala que leva em conta diferentes escalas

e variabilidade dos dados. O parametro de escala e definido de acordo com Carriero et al. (2012) igual a

variancia dos resıduos de um modelo autorregressivo univariado para as variaveis.

A distribuicao a priori normal invertida de Wishart pode ser escrita como:

vec (F) |Σ ∼ N (vec (F0) ,Σ⊗ Ω0) , e Σ ∼ iW (S0, α0) (10)

6

onde os parametros da prior F0 Ω0, S0 e α0 sao escolhidos de tal forma que a esperanca e variancia de F

coincidam com o previsto pela equacao (7), E[Fh] = F0 e Var[Fh] = Σ ⊗ Ω0. Em que a esperanca de Σ e

igual a matriz de covariancia dos resıduos e os elementos de Ω0 sao dados por Var[Bijh

]em (7). Como e

usada uma prior iW conjugada, a distribuicao posterior tambem sera normal Wishart invertida:

vec (F) |Σ ∼ N(F,Σ⊗ Ω

), Σ|Y ∼ IW (S, α) (11)

as barras denotam distribuicoes posteriores dos parametros. Definindo F e E como as estimativas de OLS,

tem-se que F =(Ω−1

0 + X′X)−1 (

Ω−10 F0 + X′Y

), Ω =

(Ω−1

0 F0 + X′X)−1

, α = α0 + T e S = F′X′XF +

F′0Ω−10 F0 + F0 + E ′E − F′Ω

−1F.

Para realizar inferencia e previsao e necessario a distribuicao posterior conjunta e as distribuicoes marginais

dos parametros F e Σ. Pode-se usar as posteriores condicionais em (11) como base de um algoritmo Gibbs

sampling que gera realizacoes a partir das condicionais Σ|Y e Fh|Σ,Y e produz uma sequencia de realizacoes

da distribuicao conjunta posterior, Fh|Σ,Y e posteriores da marginal Σ|Y e Fh|Σ,Y, bem como a distribuicao

posterior de qualquer funcao destes coeficientes (por exemplo, previsoes multi-passos). Caso o interesse seja

apenas pela distribuicao posterior de F (ao inves de qualquer funcao linear da mesma) existe uma alternativa

a simulacao, que e atraves da integracao de (11):

vec (F) |Y ∼ N(

vec(F),Ω−1, S, α

).3 (12)

O valor esperado desta distribuicao e dado por:

F =(Ω−1

0 + X′X)−1 (

Ω−10 F0 + X′Y

)(13)

que pode ser calculada facilmente. Lembrando que F e o estimador de OLS e usando as equacoes normais

(X′X)−1F = X′Y a equacao (13) pode ser reescrita como:

F =(Ω−1

0 + X′X)−1

(Ω−1

0 F0 + X′XF)

(14)

a qual mostra que a media posterior de F e uma media ponderada do estimador de OLS e da media a-priori

F0, sendo que os pesos sao proporcionais ao inverso de suas respectivas variancias. Quando θ → 0 a estimativa

posterior colapsa para F = F0, com uma prior difusa θ →∞ a estimativa posterior colapsa para a estimativa

irrestrita de OLS.

Dado a media posterior F =[A0,B0

]′, pode-se obter previsoes h-passos a frente atraves de:

Yt+h = Ah + BhYt (15)

Banbura et al. (2010) mostram que e possıvel implementar a prior descrita acima atraves de um conjunto

de observacoes dummy (para detalhes ver, Banbura et al. , 2010; Carriero et al. , 2012).

3Para uma derivacao desta equacao ver Carriero et al. (2012).

7

3.2. Modelos ARFIMA

Os modelos da classe ARFIMA se caracterizam como processos de memoria longa fracionalmente inte-

grados. A presenca de memoria longa pode ser definida de forma heurıstica em termos da persistencia das

autocorrelacoes observadas, como descrito em Baillie (1996). No caso da curva de juros do mercado brasileiro,

ao considerarmos a funcao de autocorrelacao referente a uma determinada maturidade, observada ao longo do

tempo, percebemos uma estrutura de autocorrelacao com decaimento lento. Tomando a primeira diferenca

do processo, o resultado e um processo com estrutura de correlacao as vezes semelhante a um processo white

noise ou a algum processo com autocorrelacao significativa, mas que nao se parece com um processo da

classe ARMA. Desse modo, modelar o processo original para cada maturidade atraves de modelos ARIMA

parece nao ser o mais correto. Por outro lado, parece haver estrutura de correlacao a ser modelada, de modo

que tratar a serie como um random walk pode resultar em perda de informacao. Ou seja, a distincao entre

modelos I(0) e I(1) para o objeto de estudo pode ser excessivamente restritivo e o processo ARFIMA, sendo

entendido como algo intermediario, pode gerar melhores previsoes.

Um processo da classe ARFIMA(p,d,q) pode ser definido como

βp(L)(1− L)dyt = αq(L)et,

onde L e o operador de defasagens; βp(L) =∑pj=0 βjL

j ; αq(L) =∑qj=0 αjL

j , com α0 = 1; βp(L)αq(L) 6= 0

para |L| ≤ 1 e et ∼ RB(0, σ2e) estacionario e invertıvel. Se −0, 5 < d < 0, 5 entao o processo yt e chamado

de um processo ARFIMA(p,d,q). Utilizamos nesse trabalho a funcao arfima do pacote forecast, presente

no software R para realizar a estimacao da ordem do processo e de seus coeficientes. A previsao foi feita a

partir da funcao forecast presente no mesmo pacote.

3.3. Random Walk (RW)

O primeiro e mais importante modelo competidor e o Random Walk (RW). As previsao do RW para a

taxa de juros de maturidade τ no tempo t+ h e dada por:

yt+h(τ) = yt(τ) (16)

Duffee (2002) e Diebold & Li (2006) mostraram que bater as previsoes do Random Walk para a curva de

juros e uma tarefa difıcil, portanto, neste trabalho as previsoes do RW e o benchmark em relacao ao qual

serao comparadas as previsoes de todos os demais competidores.

3.4. Modelos Autorregressivos Univariados (AR)

Tambem sao realizadas previsoes atraves de modelos autorregressivos univariados. Previsoes de tal pro-

cesso podem ser produzidas de duas formas alternativas. A primeira forma e conhecida como abordagem

powering-up. Nesta abordagem e estimado o seguinte modelo:

yt+h(τ) = α+ βyt+h−1(τ) + εt (17)

8

para a maturidade generica τ . A previsao um passo a frente e obtida por yt+1(τ) = α+ βyt+h−1(τ), enquanto

as previsoes para o horizonte de h-passos a frente sao obtidas por:

yt+h(τ) = α+ βyt+h−1(τ)

Alternativamente, pode-se usar a abordagem direta. Esta abordagem otimiza diretamente a funcao de perda

relevante, i.e., o Erro Quadratico Medio da Previsao h-passos a frente (MSFE) e provou ser mais robusta,

mas menos eficaz (ver, por exemplo, Marcellino et al. , 2006; Pesaran et al. , 2011; Carriero et al. , 2012).

O modelo a ser estimado e dado por:

yt(τ) = αh + βhyt−h(τ) + εt (18)

ou seja, a variavel no tempo t e projetada diretamente sobre seu valor no perıodo (t − h) de forma que os

coeficientes estimados sintetizam o efeito h-passos a frente. Note que diferentes valores para αh e βh sao

obtidos para cada horizonte de previsao. As previsoes sao derivadas como:

yt+h(τ) = ατh + βτhyt(τ) + εt (19)

Neste trabalho sao estimadas as duas abordagens, sendo rotuladas de AR(pu) e AR(di), respectivamente.

Note-se que para o horizonte de 1-passo a frente dos dois metodos produzem os mesmos resultados.

Uma questao relevante quando se trabalha com modelos autorregressivos e a escolha do tamanho do lag.

Os modelos descritos acima sao AR(1), mas em princıpio poderia ser empregada outra ordem de defasagem,

p. Tambem foram consideradas outras especificacoes dinamicas e foram re-estimados ambos os modelos AR

(com abordagem power-up e direta), sendo que o tamanho do lag foi por meio dos Criterio de Informacao

Bayesiano (BIC) e Akaike (AIC). A ordem de defasagem oscila entre 1 e 4, dependendo do perıodo de

tempo considerado, mas os resultados finais sao semelhantes aos obtidos com a especificacao AR(1), mais

simples. Portanto, sao apresentados apenas os resultados da especificacao AR(1), os demais resultados estao

disponıveis mediante solicitacao.

3.5. Vetores Autorregressivos (VAR)

As previsoes com modelos V AR sao produzidas de forma semelhante as previsoes dos modelos AR uni-

variados. Espeficamente, as previsoes atraves de V AR powering-up sao obtidas como segue. O modelo de

regressao e:

yt = A + Byt−1 + εt, (20)

onde yt = (yt(τ1), yt(τ2), . . . , yt(τN ))′. A previsao um passo a frente e produzida como yt = A + Byt−1,

enquanto que previsoes h-passos a frente sao obtidas como:

yt+h = A + Byt+h−1 (21)

No caso da abordagem direta as previsoes sao obtidas da seguinte forma. O modelo de regressao e:

yt = Ah + Bhyt−h + εt, (22)

9

onde yt = (yt(τ1), yt(τ2), . . . , yt(τN ))′. Note que diferentes matrizes Ah e Bh sao usadas para cada horizonte

de previsao. As previsoes sao derivadas como:

yt+h = Ah + Bhyt (23)

Sao considerados resultados para ambas as abordagens, rotulando-as de V AR(pu) e V AR(di), respectiva-

mente. Note que para horizonte de um passo a frente os dois metodos produzem o mesmo resultado. Tambem

foram consideradas outras especificacoes com maior ordem de defasagem, porem os resultados sao bastante

pobres e estao disponıveis mediante solicitacao.

4. Modelos Parametricos de Fatores para Previsao da Curva de Juros

Nesta secao apresentamos os modelos de fatores amplamente abordados na literatura de previsao da curva

de juros. O princıpio basico desses modelos esta na especificacao de uma funcao valor, que e definida sobre

todo o domınio das maturidades. Enquanto as varias abordagens nesta classe de modelos defendem diferentes

escolhas da funcao, compartilham a abordagem geral de que os parametros do modelo sejam determinados

atraves da minimizacao dos desvios quadrados dos precos observados em relacao aos teoricos. Nesta secao

sao apresentados alguns dos principais modelos parametricos para prever a curva de juros, conforme relatorio

do BIS (2005). Os modelos parametricos oferecem uma descricao conceitualmente simples e parcimoniosa da

estrutura a termo da taxa de juros.

4.1. Modelo de Nelson & Siegel

Nelson & Siegel (1987), propoem uma funcao parcimoniosa para modelar a taxa forward instantanea como

uma funcao, f(τ,b), de um vetor de parametros relativamente pequeno, b. Neste caso as taxas forward sao

definidas como:

ft(τ, β) = β1 + β2 exp

(−τλ

)+ β3

τ

λexp

(−τλ

)(24)

com o vetor de parametros a ser estimado b = (β1, β2, β3, λ). Estes parametros podem ser interpretadas

como sendo relacionados ao nıvel de longo prazo da curva de juros, a taxa de curto prazo, inclinacao da curva

de juros e uma curvatura na curva. A funcao ft(τ, β) tem caracterısticas desejaveis para capturar a forma

da estrutura a termo. Uma delas e a existencia dos limites da funcao ft(τ, β) para τ =∞ e para τ = 0, i.e.:

ft(τ, β)τ→∞

= β1

ft(τ, β)τ→0

= β1 + β2

Diebold & Li (2006) propuseram uma versao dinamica do modelo de Nelson & Siegel (1987) e alcancam bons

resultados em termos de previsao da curva de juros para fora da amostra. O ponto de partida e a seguinte

interpolacao da curva de juros:

yt(τ) = β1 + β21− e−λτ

λτ+ β3

(1− e−λτ

λτ− eλτ

)(25)

10

onde b = (β1, β2, β3, λ) sao os parametros. Diebold & Li (2006) interpretam a equacao (25) de uma forma

dinamica como um modelo de fatores latentes em que β1, β2 e β3 sao fatores de nıvel, inclinacao e curvatura

variantes no tempo e os termos que multiplicam estes fatores sao suas respectivas cargas:

yt(τ) = β1t + β2t1− e−λτ

λτ+ β3t

(1− e−λτ

λτ− eλτ

)(26)

Para as maturidades longas, as taxas a vista e forwards aproximam-se assintoticamente do valor β1, o qual

deve ser positivo. (β1 + β2) determinam o valor inicial da curva na maturidade zero. Assim, β2 representa o

desvio da assıntota β1. Alem disso, (β1 + β2) tambem deve ser positivo. Os dois parametros restantes β3 e

τ sao responsaveis pela curvatura. A magnitude da curvatura e dada pelo valor absoluto de β3, enquanto a

direcao e dada pelo sinal: um sinal negativo indica uma forma de U , enquanto um sinal positivo indica forma

de U invertido. τ , o qual tambem deve ser positivo, determina a posicao da curvatura.

4.2. Modelo de Svensson

Para melhorar a flexibilidade das curvas e o ajuste, Svensson (1994b) amplia o modelo de Nelson & Siegel

(1987) incluindo mais um parametro que pode ser interpretado como uma segunda curvatura. A precisao

extra e alcancada ao custo de adicionar mais dois parametros, β4 e τ2, os quais precisam ser estimados. A

curva de juros resultante e dada por:

yt(τ) = β1t + β2t

(1− e−λ1τ

λ1τ

)+ β3t

(1− e−λ1tτ

λ1τ− e−λ1τ

)+ β4t

(1− e−λ2τ

λ2τ− e−λ2τ

). (27)

Esta especificacao permite uma segunda curvatura na curva de juros. Assim, o metodo de Svensson

(1994b) e mais flexıvel e geralmente tem melhor ajuste que o modelo de Nelson & Siegel (1987), com o custo

de ser menos parcimonioso. Um potencial problema de multicolinearidade no modelo de SV surge se os para-

metros de decaimento λ1 e λ2 assumem valores similares. Para contornar o problema de multicolinearidade,

Pooter (2007) propoe substituir o ultimo termo em (27), i.e, − exp −τλ2por − exp −2τ

λ2. Esta especificacao e

chamada aqui de modelo de Svensson ajustado.

4.3. Modelo de Tres Fatores de Bliss

Uma segunda opcao para tornar o modelo de Nelson-Siegel mais flexıvel e obtida relaxando a restricao

de que os componentes de inclinacao e curvatura sao governados pelo mesmo parametro de decaimento λ.

Bliss (1997) estima a estrutura a termo da curva de juros atraves de um modelo com tres fatores, similar ao

modelo de Nelson-Siegel, mas que permite dois parametros de decaimento diferentes, λ1 e λ2. A curva de

juros resultante e dada por:

yt(τ) = β1t + β2t1− e−λ1τ

λ1τ+ β3t

(1− e−λ2τ

λ2τ− eλ2τ

)(28)

Obviamente, o modelo de Bliss sera diferente do modelo de Nelson-Siegel apenas se λ1 6= λ2.

4.4. Procedimentos de estimacao

A abordagem mais direta e amplamente usada para estimacao dos fatores e parametros dos modelos (26),

(27) e (28) consiste em um procedimento de duas etapas (Diebold & Li, 2006). Na primeira etapa, a equacao

11

da curva de juros e tratada como um modelo cross section e e empregado o metodo de mınimos quadrados

para estimar os fatores para todos os perıodos de tempo individualmente. Na segunda etapa, a dinamica

dos fatores e especificada e ajustada por modelos de series de tempo. Para simplificar o procedimento de

estimacao, Diebold & Li (2006) sugerem reduzir o vetor de parametros para b = (β1, β2, β3) fixando o valor

de λt em um valor especificado a priori, o qual e mantido fixo, ao inves de trata-lo como um parametro

desconhecido. Almeida et al. (2008), propoem o uso de quatro regras para determinar o valor do parametro

de decaimento, em que para cada uma delas o parametro e otimizado com base no horizonte de previsao

desejado.

O primeiro passo do procedimento de estimacao produz series de tempo dos valores estimados para cada

um dos K fatores; βi,tTt=1, para i = 1, . . . ,K. O proximo passo e estimar a dinamica dos fatores da

equacao dos estados. Para cada especificacao do modelo e estimado um modelo AR(1) para cada fator ou,

alternativamente, modela-se a dinamica dos fatores atraves de um V AR(1).

A escolha dos parametros de decaimento para os modelos de Nelson-Siegel e Svensson e restrita ao intervalo

entre 0.04 e 0.5, pois estes valores correspondem ao peso maximo para a curvatura da estrutura a termo na

maior (48 meses) e na menor (6 meses) maturidade da base de dados, respectivamente. Seguindo estas

restricoes, constroi-se o conjunto Φ = 0.04 + 0.001j491j=1. Dado λj ∈ Φ e a correspondente matriz de

pesos dos fatores Λ(λj) e, baseado neles, o vetor de fatores bt e estimado por OLS em cada perıodo t. O

parametro de decaimento escolhido λ ∈ Φ e o que minimiza a raız da soma do erro quadratico medio. Mais

especificamente, λ e escolhido de forma a minimizar a diferenca entre as taxas de juros obtidas pelo modelo,

y, e as taxas observadas, y. O problema de otimizacao pode ser apresentado como:

λ = argminλ∈Φ

√√√√ 1

TN

T∑t=1

N∑i=1

(yt(τi)− yt(τi, λ,bt|t−1)

)2onde T e o numero de curvas de juros na amostra.

Nos modelos de Svensson e Bliss o problema e similar, com a diferenca de que neste caso e necessario

encontrar dois parametros (λ1, λ2) do conjunto Θ = (λι1, λι2)|λ1 ∈ Φ, λ2 ∈ Φ. Assim, (λ1, λ2) resolvem o

seguinte problema:

(λ1, λ2

)= argmin

(λ1,λ2)∈Θ

√√√√ 1

TN

T∑t=1

N∑i=1

(yt(τi)− yt(τi, λ1, λ2,bt|t−1)

)2.

5. Dados, Metodologia de Previsao e Analise Fora da Amostra

5.1. Descricao dos Dados

A base de dados empregada aqui consiste das taxas diarias de fechamento dos contratos de DI-futuro

negociados na BM&F. As maturidades constantes foram computadas atraves do metodo Cubic Splines. A

tabela 1 resume algumas estatısticas descritivas da curva de juros para o perıodo. Alguns fatos estiliazados

comuns a dados de curvas de juros estao claramente presentes: a curva media da amostra e positivamente

inclinada e concava, volatilidade e decrescente com a maturidade e as autocorrelacoes sao altas. Outro ponto

a destacar e que mesmo se tratando de um perıodo amostral nao muito longo, percebe-se ampla variacao entre

as taxas mınimas e maximas para todas as maturidades, refletindo o comportamento da polıtica monetaria

12

no perıodo. As tres ultimas colunas trazem as autorrelacoes com defasagens de 1, 5 e 21 dias uteis, observa-se

tambem que as taxas de juros para maturidades mais curtas exibem maior persistencia para os tres nıveis de

defasagens analisados, o que esta de acordo com a literatura relacionada ao tema.

Tabela 1: Estatısticas descritivas da curva de juros brasileira. Perıodo Amostral 2007:01 - 2010:12.

Maturidade τ Media Std. Dev. Skew Kurt Min Max ρ(1) ρ(5) ρ(21)

Meses

1 10.80 1.64 8.51 14.13 0.169 1.957 0.999 0.996 0.9673 10.82 1.65 8.58 14.34 0.220 2.006 0.999 0.997 0.9696 10.88 1.67 8.59 14.52 0.264 2.071 0.999 0.997 0.9689 10.94 1.69 8.58 14.69 0.306 2.132 0.999 0.996 0.96712 11.09 1.72 8.61 15.32 0.386 2.241 0.999 0.995 0.96115 11.34 1.73 8.73 16.04 0.495 2.373 0.998 0.992 0.95018 11.60 1.72 8.99 16.40 0.572 2.461 0.998 0.989 0.93821 11.85 1.68 9.35 16.92 0.655 2.565 0.997 0.986 0.92524 12.04 1.61 9.55 17.12 0.718 2.659 0.996 0.982 0.91127 12.21 1.55 9.79 17.26 0.805 2.815 0.995 0.979 0.89430 12.33 1.49 10.06 17.44 0.912 3.026 0.995 0.975 0.87733 12.43 1.45 10.27 17.62 1.005 3.290 0.994 0.972 0.85936 12.50 1.41 10.42 17.78 1.085 3.586 0.993 0.968 0.84339 12.60 1.32 10.71 17.83 1.281 4.180 0.992 0.961 0.81442 12.68 1.24 11.09 17.93 1.465 4.910 0.990 0.955 0.788

Nota: Esta tabela apresenta estatısticas descritivas das taxas de juros diarias para diferentes maturida-des. A tres ultimas colunas contem autocorrelacoes com defasagem de um dia, uma semana e um mes,respectivamente.

A figura 1 mostra o grafico das series temporais para o conjunto de maturidades empregadas e ilustra

como o nıvel da curva de juros e spread variam substancialmente ao longo do perıodo amostral. Por exemplo,

o ultimo ano da amostra usado para analise das previsoes fora da amostra e caracterizado por elevacao das

taxas de juros, principalmente para as maturidades mais curtas, que respondem mais diretamente a polıtica

de elevacao de juros implementada pelo Banco Central no primeiro semestre de 2010. Nota-se tambem que

nao apenas o nıvel da estrutura a termo flutua ao longo do tempo, mas tambem a inclinacao e curvatura. A

curvatura assume varios formatos, desde formas suaves a formas invertidas, tipo S.

Outra caracterıstica observada nos dados da curva de juros utilizados e a rejeicao da hipotese nula de

normalidade para toda a amostra, devido a assimetria positiva e excesso de curtose. Alem disso, alguns fatos

estilizados na literatura a respeito de curvas de juros sao tambem observados, como o fato de que curvas de

juros normalmente sao positivamente inclinadas, as taxas de juros para as maturidades mais curtas sao mais

volateis e apresentam maior persistencia.

5.2. Medidas Estatısticas de Performance

A fim de avaliar as previsoes, e empregado o erro quadratico medio das previsoes (MFSE). Seja yMt+h(τ)

a previsao de yt+h(τ) obtida pelo modelo M. O Erro Quadratico Medio de Previsao (MFSE) do modelo

13

Figura 1: Term-Structure Dynamics over Time

Note: This figure details the evolution of the term structure of interest rates over 1972:01-2000:12. Weexamine monthly data, constructed using the unsmoothed Fama-Bliss method. The maturities we showare 3, 6, 9, 12, 15, 18, 21, 24, 30, 36, 48, 60, 72, 84, 96, 108 and 120 months. Panel A presents a3-dimensional plot, Panel B provides time-series plots for selected maturities..

M para a previsao da taxa de juros de maturidade τ para o horizonte h e:

MSFEMτ,h =1

T −K∑(

yMt+h(τ)− yt+h(τ))2

(29)

em que a soma e calculada sobre todas as previsoes (T − K) produzidas. A acuracia das previsoes sao

avaliadas em termos erro quadratico medio das previsoes relativos ao Random Walk :

RMSFEMτ,h =MSFEMτ,hMSFERWτ,h

(30)

Para dar uma ideia do nıvel absoluto dos erros e facilitar a comparacao com outros estudos sao apresentados

tambem a Raiz do Erro Quadratico Medio do Random Walk, i.e.,√MSFERWτ,h . Como e padrao na literatura,

os resultados sao apresentados em termos de taxas de juros percentuais anualizadas. Por exemplo, um

RMSFE de 0.26 indica um erro de 26 pontos base na previsao da taxa de juros anualizada.

Para avaliar se as previsoes de dois modelos concorrentes sao diferentes estatisticamente significantes e

empregado o teste de Diebold & Mariano (ver, Diebold & Mariano, 1995; McCracken, 2007) para testar

a acuracia das previsoes. As previsoes geradas por cada modelo sao comparadas com aquelas obtidas com

o Random Walk. Seja dini=1 uma funcao das diferencas dos erros quadraticos das previsoes obtidas pelo

modelo M e pelo Random Walk. A o valor de di e calculado como:

di(yMt+h(τ)− yt+h(τ)

)2 − (yRWt+h (τ)− yt+h(τ))2

(31)

14

As variaveis yMt+h(τ) e yRWt+h (τ) sao as previsoes no tempo t, h-passos a frente do modeloM e Random Walk,

respctivamente. Diebold & Mariano (1995) propuseram um teste para checar se o diferencial de perda medio

di = 1n

∑ni=1 di e estatisticamente diferente de zero, o qual e definido por:

DM =d√δn

d−→ N(0, 1) (32)

onde δ e uma estimativa da matriz de covariancia de longo prazo de di. Neste trabalho sao empregadas as

estimativas de δ de Newey & West (1987), as quais permitem controlar para a presenca de correlacao serial

nos erros de previsao.

5.3. Previsoes fora da amostra

Nas subsecoes seguintes descrevemos o exercıcio de previsao implementado nesse estudo. As previsoes

sao realizadas atraves de um esquema rolling window e sao considerados os seguintes horizontes de previsao

h = 1, 5, 21, 63, 126, i.e, diario, semanal, mensal, trimestral e semestral. Seja κ a origem de previsao, isto e,

o momento no tempo no qual uma iteracao de previsao e implementada. O esquema de previsao recursiva

consiste em estimar os parametros aumentando recursivamente origem da previsao de κ = K = 500 ate

κ = T −h. No esquema de previsao rolling window, a janela fixa de tamanho K = 500 que termina na origem

de previsao e comeca no tempo κ − K + 1 e sequencialmente atualizada.4 Sao utilizadas 15 maturidades

na estimacao (τ = 1, 3, 4, 6, . . . , 30, 36, 42 e 48 meses). O ultimo ano da amostra e usado para analise das

previsoes fora da amostra.

A abordagem para fazer previsao da curva de juros com os modelos da classe Nelson-Siegel consiste em

fazer previsoes dos fatores, e entao usar os fatores previstos para ajustar previsoes da curva de juros. As

previsoes no tempo t, para t+ h, da taxa de juros com maturidade τ , sao dadas por:

yt+h|t(τ) = β1,t+h|t + β2,t+h|t

(1− e−λτ

λτ

)+ β3,t+h|t

(1− e−λτ

λτ− e−λτ

).

As previsoes dos fatores sao obtidas atraves de processos AR e VAR.

Na tabela 2 apresentamos o RMSE para as previsoes para diversos horizontes de previsao. Algumas

caracterısticas merecem destaque. Para previsao um passo a frente, percebe-se uma melhor performance dos

modelos VAR(pu), ARIMA, ARFIMA, BVAR e DL(VAR) para maturidades mais curtas (ate 9 meses). Para

as demais maturidades, os modelos AR(pu) e AR(di) apresentam melhor performance. E importante notar

que, para horizonte de 1-passo a frente, e sabido na literatura a dificuldade para se superar a performance

do random walk. Para previsao cinco passos a frente, percebe-se uma performance destacada do modelo

BVAR para maturidades mais curtas (ate 9 meses). Para previsao vinte e um passos a frente, percebe-se

uma melhor performance do modelo BVAR para as maturidades 1 e 3 meses; uma performance destacada

do modelo de fatores SV(AR) para as maturidades de 6-meses ate a maturidade de 33-meses. Vale tambem

ressaltar a performance consistente do modelo ARFIMA nesse caso. Para horizonte de 3 meses, destacam-se

4Note-se que K = 500 equivale a cerca de 2 anos de dados. Foram considerados outros tamanhos de janela, mas os resultadospermanecem qualitativamente semelhantes.

15

Tabela 2: Erro Quadratico Medio Relativo, Base de Dados de DI-FuturoPerıodo 2010:01 - 2010:12.

Nota: A Tabela contem os Erros Quadraticos Medios das Previsoes relativos ao Random Walk obtidas usando cada um dos modelos competi-dores para horizontes de 1- e 5- passos a frente, 1-, 3- e 6- meses a frente. O perıodo de avaliacao vai de 2010:01 a 2010:12. Para o RandomWalk e apresentado o erro quadratico medio das previsoes (RFMSE). Os modelos competidores considerados sao modelos lineares estimadoscom abordagens direta e powering-up (AR(pu), AR(di), VAR(pu) e VAR(di), VAR Bayesiano (BVAR), modelos de Diebold & Li e Svenssoncom dinamica dos fatores modelada por AR e VAR). Os asteriscos indicam o nıvel ao qual o teste de Giacomini & White (2006) rejeita ahipotese nula de igualdade na acuracia das previsoes (∗, ∗∗ e ∗∗∗ significam rejeicao ao nıvel de 10%, 5% e 1%, respectivamente).

Maturidade 1- 3- 6- 9- 12- 15- 18- 21- 24- 27- 30- 33- 36- 42- 48-Mes Meses Meses Meses Meses Meses Meses Meses Meses Meses Meses Meses Meses Meses Meses

Horizonte: 1-passoa frente

RW (Root 0.04 0.04 0.04 0.05 0.05 0.05 0.06 0.06 0.06 0.06 0.07 0.07 0.08 0.08 0.08blaMSFE)AR(pu) 1.03 1.03 1.02 1.01 1.00 1.00 1.00 0.99 0.99 0.99 0.99 0.99 0.99 0.99 0.99AR(di) 1.03 1.03 1.02 1.01 1.00 1.00 1.00 0.99 0.99 0.99 0.99 0.99 0.99 0.99 0.99VAR(pu) 0.95 0.96 0.97 1 1.03 1.04 1.05 1.07 1.08 1.08 1.07 1.06 1.07 1.06 1.03VAR(di) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1ARIMA 0.96 0.97 0.97 0.97 0.99 1.01 1.01 1.00 1.01 1.01 1.01 1.01 1.00 1.00 1.00ARFIMA 0.96 0.95 0.97 0.98 1.01 1.02 1.01 1.02 1.00 1.00 1.00 1.00 1.00 1.01 1.01BVAR 0.93 0.94 0.96 0.98 1.00 1.01 1.01 1.01 1.01 1.01 1.01 1.01 1.00 1.00 1.00DL(AR) 3.78 1.65 2.13 2.49 1.92 1.1 1.34 1.77 1.88 1.74 1.56 1.22 1.08 1.55 1.92DL(VAR) 0.95 0.94 0.96 0.98 1 1.01 1.02 1.02 1.02 1.02 1.02 1.02 1.01 1.01 1.01SV(AR) 1.18 1.47 1.32 1.17 1.14 1.06 1.06 1.02 1.06 1.13 1.06 0.99 1.03 1.05 1.03SV(VAR) 1.21 1.39 1.30 1.26 1.15 1.06 1.08 1.08 1.07 1.11 1.07 1.00 1.01 1.02 1.05Horizonte: 5-passosa frente

RW (Root 0.10 0.11 0.12 0.14 0.15 0.15 0.15 0.15 0.15 0.16 0.16 0.17 0.17 0.18 0.18blaMSFE)AR(pu) 1.10 1.09 1.06 1.04 1.01 1.00 0.99 0.99 0.99 0.99 0.99 0.99 0.99 0.99 0.99AR(di) 1.09 1.08 1.06 1.04 1.01 1.01 1.00 0.99 0.99 0.99 0.99 0.99 0.99 0.99 0.99VAR(pu) 1.06 1.07 1.05 1.05 1.03 1.03 1.03 1.03 1.02 1.02 1.02 1.02 1.02 1.02 1.02VAR(di) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1ARIMA 0.87 0.88 0.91 0.95 0.97 0.99 1.00 1.01 1.01 1.01 1.00 1.02 1.00 1.00 1.00ARFIMA 0.88 0.86 0.92 0.95 0.96 0.99 0.99 1.01 0.98 0.99 0.99 0.99 0.99 1.00 1.01BVAR 0.78 0.83 0.88 0.95 1.01 1.04 1.04 1.04 1.03 1.03 1.02 1.02 1.02 1.02 1.02DL(AR) 1.71 0.91 1.04 1.15 1.06 0.99 1.08 1.19 1.19 1.11 1.08 1.01 1.02 1.17 1.30DL(VAR) 1.12 1.11 1.09 1.07 1.06 1.05 1.05 1.06 1.06 1.05 1.05 1.05 1.05 1.04 1.04SV(AR) 1.12 1.00 0.99 0.96 0.97 0.99 0.98 0.98 0.99 0.99 0.96 0.96 1.04 1.09 1.11SV(VAR) 1.09 1.12 1.15 1.13 1.05 1.03 1.04 1.06 1.05 1.04 1.03 1.00 1.01 1.01 1.03Horizonte: 21-passosa frente

RW (Root 0.31 0.31 0.33 0.37 0.38 0.36 0.35 0.34 0.33 0.34 0.34 0.34 0.34 0.35 0.34blaMSFE)AR(pu) 1.21 1.19 1.15 1.09 1.04 1.01 0.99 0.98 0.98 0.97 0.96 0.97 0.96 0.97 0.97AR(di) 1.14 1.13 1.10 1.06 1.01 0.99 0.97 0.96 0.96 0.95 0.95 0.95 0.95 0.96 0.97VAR(pu) 1.22 1.22 1.20 1.18 1.15 1.15 1.13 1.12 1.12 1.10 1.09 1.09 1.08 1.08 1.09VAR(di) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1ARIMA 0.83 0.82 0.88 0.96 0.97 1.00 0.99 1.03 1.06 1.02 0.99 1.03 1.00 0.99 1.00ARFIMA 0.87 0.77 0.85 0.91 0.93 0.97 0.98 1.00 0.97 0.97 0.96 0.97 0.96 0.97 0.98BVAR 0.52 0.69 0.78 0.90 1.00 1.08 1.12 1.13 1.12 1.11 1.10 1.09 1.08 1.08 1.08DL(AR) 1.04 0.77 0.79 0.85 0.88 0.95 1.02 1.07 1.07 1.01 1.00 0.99 1.00 1.07 1.13DL(VAR) 0.65 0.70 0.78 0.91 1.02 1.08 1.15 1.22 1.26 1.24 1.26 1.28 1.27 1.27 1.27SV(AR) 1.01 0.70 0.70 0.71 0.74 0.77 0.79 0.85 0.89 0.89 0.92 0.96 1.11 1.23 1.34SV(VAR) 1.20 1.11 1.11 1.12 1.10 1.15 1.16 1.16 1.15 1.10 1.08 1.04 1.05 1.07 1.12Horizonte: 3-mesesa frente

RW (Root 0.77 0.77 0.79 0.80 0.76 0.69 0.63 0.58 0.53 0.53 0.52 0.51 0.5 0.51 0.51blaMSFE)AR(pu) 1.39 1.36 1.32 1.24 1.12 1.04 0.97 0.94 0.91 0.89 0.90 0.90 0.92 0.94 0.96AR(di) 0.99 0.96 0.94 0.88 0.82 0.78 0.76 0.76 0.77 0.78 0.79 0.83 0.90 0.96 1.01VAR(pu) 1.44 1.45 1.43 1.41 1.41 1.41 1.4 1.40 1.40 1.37 1.33 1.31 1.26 1.22 1.20VAR(di) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1ARIMA 1.06 1.06 1.09 1.13 0.97 1.02 1.00 1.08 1.06 1.08 0.99 1.02 1.00 1.00 1.00ARFIMA 1.15 1.03 1.03 0.92 0.88 0.88 0.89 0.91 0.86 0.86 0.86 0.88 0.91 0.94 0.96BVAR 0.61 0.69 0.74 0.83 0.95 1.06 1.06 1.14 1.24 1.24 1.26 1.31 1.26 1.22 1.20DL(AR) 0.82 0.75 0.73 0.71 0.71 0.77 0.84 0.92 0.97 0.97 1.00 1.06 1.10 1.10 1.06DL(VAR) 0.63 0.69 0.74 0.83 0.95 1.07 1.23 1.46 1.63 1.59 1.59 1.67 1.65 1.62 1.58SV(AR) 1.11 1.05 1.01 0.94 0.93 0.97 1.02 1.04 1.05 0.99 0.94 0.95 0.97 1.03 1.06SV(VAR) 1.33 1.39 1.37 1.31 1.27 1.31 1.37 1.42 1.45 1.39 1.35 1.33 1.25 1.22 1.21Horizonte: 6-mesesa frente

RW (Root 1.26 1.26 1.26 1.26 1.21 1.14 1.03 0.9 0.77 0.69 0.67 0.64 0.54 0.54 0.55blaMSFE)AR(pu) 2.01 1.93 1.86 1.71 1.44 1.23 1.05 0.92 0.81 0.72 0.72 0.73 0.82 0.92 0.98AR(di) 2.59 2.33 2.16 1.84 1.48 1.22 1.09 1.04 1.08 1.09 1.03 1.08 1.34 1.42 1.45VAR(pu) 0.82 0.84 0.85 0.87 0.95 1.02 1.14 1.32 1.55 1.68 1.69 1.8 2.22 2.21 2.17VAR(di) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1ARIMA 1.54 1.41 1.44 1.45 1.23 1.36 1.32 1.07 1.09 1.08 0.99 1.00 1.00 0.99 1.00ARFIMA 1.39 1.23 1.29 1.05 0.89 0.73 0.66 0.57 0.51 0.52 0.56 0.62 0.79 0.92 0.98BVAR 0.72 0.80 0.82 0.85 0.93 0.99 0.83 0.72 0.71 0.72 0.80 0.93 1.16 1.25 1.10DL(AR) 0.93 0.89 0.89 0.87 0.81 0.76 0.74 0.74 0.75 0.77 0.76 0.77 0.90 0.97 1.01DL(VAR) 2.15 1.92 1.81 1.61 1.33 1.08 0.87 0.75 0.73 0.72 0.80 0.94 1.21 1.31 1.29SV(AR) 1.15 0.97 0.9 0.82 0.82 0.88 0.96 1.05 1.14 1.19 1.15 1.16 1.32 1.32 1.26SV(VAR) 1.84 1.97 2.04 2.02 1.89 1.77 1.73 1.76 1.85 1.87 1.77 1.72 1.73 1.55 1.39

16

os modelos BVAR e DL(VAR) para maturidades curtas (1 a 9-meses); para maturidades intermediarias e

longas, destaque para o modelo ARFIMA. Para horizonte h = 6 meses, esse padrao se repete. Novamente

destaque para o modelo BVAR para maturidades curtas (1 a 9-meses) e performance destacada para o modelo

ARFIMA para maturidades intermediarias e longas.

De modo geral, podemos perceber que o estimador BVAR e os modelos de fatores apresentaram perfor-

mance interessante para maturidades mais curtas, superando o random walk em diversas situacoes. Ja o

estimador ARFIMA e os modelos AR foram interessantes para previsao de maturidades intermediarias e lon-

gas, superando o random walk a partir do horizonte de 21 passos a frente. Em comparacao com a literatura

de previsao de curva de juros americana, percebe-se uma performance relativamente pobre do modelos de

fatores quando considerado o objetivo de previsao da curva de juros brasileira. Para o Brasil, os modelos

auto-regressivos (BVAR, ARFIMA e AR) mostraram-se mais uteis do que os modelos de fatores. Isso sugere

uma que mais pesquisa deve ser conduzida na tentativa de um modelo que descreva mais razoavelmente o

formato e dinamica da curva de juros brasileira.

6. Conclusao

Neste trabalho investigamos a performance preditiva da estrutura a termo da taxa de juros para o caso

do Brasil a partir de diversos modelos existentes na literatura de financas. Consideramos neste trabalho

os populares modelos de fatores e, alem disso, introduzimos dois estimadores alternativos que ainda nao

haviam sido aplicados para previsao de curva de juros no Brasil. Um deles e o estimador Bayesian VAR,

recentemente proposto por Carriero et al. (2012) e aplicado a previsao de curva de juros do EUA. Alem

disso, consideramos modelos da classe ARFIMA, sob o argumento de que tratar a serie temporal para uma

determinada maturidade como I(0) seria falso, mas tambem trata-la como I(1) poderia ser sobremaneira

restritivo. Como resultado pratico, para a amostra considerada, vimos que os modelos de fatores, populares

na previsao de curva de juros, tem papel relevante para previsao de maturidades mais curtas, mas nao

constituem opcao interessante para as demais maturidades. Isso ilustra uma certa peculiaridade da curva de

juros brasileira em relacao a curva de juros americana, visto que os modelos de fatores se mostram bem valiosos

para previsao desta. Isto posto, vimos que o estimador BVAR se mostrou bastante relevante para previsao

de maturidades mais curtas. Os modelos ARFIMA e AR se destacaram para maturidades intermediarias e

longas. Portanto, a performance destacada de modelos auto-regressivos vis-a-vis modelos de fatores sugere

que mais investigacoes sao necessarias, a fim de se estabelecer um modelo que descreva bem a curva de juros

para o Brasil.

17

Referencias

Almeida, Caio, & Vicente, Jose. 2008. The role of no-arbitrage on forecasting: Lessons from a parametric

term structure model. Journal of Banking & Finance, 32(12), 2695–2705.

Almeida, Caio, Gomes, Romeu, Leite, Andre, & Vicente, Jose. 2008. Movimentos da Estrutura a

Termo e Criterios de Minimizacao do Erro de Previsao em um Modelo Parametrico Exponencial. Revista

Brasileira de Economia, 62(4), 497–510.

Anderson, Nicola, & Sleath, John. 2001 (Mar.). New estimates of the UK real and nominal yield

curves. Bank of England working papers 126. Bank of England.

Ang, Andrew, & Piazzesi, Monika. 2003. A no-arbitrage vector autoregression of term structure dyna-

mics with macroeconomic and latent variables. Journal of Monetary Economics, 50(4), 745–787.

Baillie, Richard T. 1996. Long memory processes and fractional integration in econometrics. Journal of

Econometrics, 73, 5–59.

Banbura, Marta, Giannone, Domenico, & Reichlin, Lucrezia. 2010. Large Bayesian vector auto

regressions. Journal of Applied Econometrics, 25(1), 71–92.

Bauwens, Luc, Lubrano, Michel, & Richard, Jean-Francois. 2000. Bayesian Inference in Dynamic

Econometric Models. Oxford University Press.

BIS. 2005 (Oct.). Zero-coupon yield curves: technical documentation. BIS Papers 25. Bank for International

Settlements (Monetary and Economic Department).

Bjork, T., & Christensen, B.J. 1999. Interest Rate Dynamics and Consistent Forward Rate Curves.

Mathematical Finance, 9, 323–348.

Bliss, Robert R. 1997. Testing term structure estimation methods. Advances in Futures and Options

Research, 9(1), 197–231.

Caldeira, Joao F., Moura, Guilherme V., & Portugal, Marcelo S. 2010. Efficient Yield Curve

Estimation and Forecasting in Brazil. EconomiA, 11(1), 27–51.

Carriero, Andrea, Kapetanios, George, & Marcellino, Massimiliano. 2011. Forecasting large

datasets with Bayesian reduced rank multivariate models. Journal of Applied Econometrics, 26(5), 735–

761.

Carriero, Andrea, Kapetanios, George, & Marcellino, Massimiliano. 2012. Forecasting govern-

ment bond yields with large Bayesian vector autoregressions. Journal of Banking & Finance, 36(7),

2026–2047.

Christensen, Jens H. E., Diebold, Francis X., & Rudebusch, Glenn D. 2009. An arbitrage-free

generalized Nelson-Siegel term structure model. Econometrics Journal, 12, 33–64.

Christensen, Jens H.E., Diebold, Francis X., & Rudebusch, Glenn D. 2007. The affine arbitrage-

free class of Nelson-Siegel term structure models. Tech. rept.

18

Christensen, Jens H.E., Diebold, Francis X., & Rudebusch, Glenn D. 2011. The affine arbitrage-

free class of Nelson-Siegel term structure models. Journal of Econometrics, 164(1), 4–20.

Clark, Todd E., & McCracken, Michael W. 2009. Improving Forecast Accuracy By Combining

Recursive And Rolling Forecasts. International Economic Review, 50(2), 363–395.

Cochrane, John H., & Piazzesi, Monika. 2005. Bond Risk Premia. American Economic Review, 95(1),

138–160.

Cox, John C, Ingersoll, Jonathan E, Jr, & Ross, Stephen A. 1985. A Theory of the Term Structure

of Interest Rates. Econometrica, 53(2), 385–407.

Dai, Qiang, & Singleton, Kenneth J. 2002. Expectation puzzles, time-varying risk premia, and affine

models of the term structure. Journal of Financial Economics, 63(3), 415–441.

de Jong, Frank. 2000. Time-series and Cross-section Information in Affine Term Structure Models. Journal

of Business and Economic Statistics, 18(1), 300–314.

De Mol, Christine, Giannone, Domenico, & Reichlin, Lucrezia. 2008. Forecasting using a large

number of predictors: Is Bayesian shrinkage a valid alternative to principal components? Journal of

Econometrics, 146(2), 318–328.

Diebold, F. X., & Mariano, R. 1995. Comparing Preditive Acuracy. Journal of Business and Economic

Statistics, 13, 253–263.

Diebold, Francis X., & Li, Canlin. 2006. Forecasting the term structure of government bond yields.

Journal of Econometrics, 130(2), 337–364.

Diebold, Francis X., Piazzesi, Monika, & Rudebusch, Glenn D. 2005. Modeling Bond Yields in

Finance and Macroeconomics. American Economic Review, 95(2), 415–420.

Diebold, Francis X., Rudebusch, Glenn D., & Borag[caron]an Aruoba, S. 2006. The macroeco-

nomy and the yield curve: a dynamic latent factor approach. Journal of Econometrics, 131(1-2), 309–338.

Duffee, Gregory R. 2002. Term Premia and Interest Rate Forecasts in Affine Models. Journal of Finance,

57(1), 405–443.

Duffie, D., & Kan, R. 1996. A Yield-Factor Model of Interest Rates. Mathematical Finance, 6(4), 379–406.

Egorov, Alexei V., Li, Haitao, & Ng, David. 2011. A tale of two yield curves: Modeling the joint term

structure of dollar and euro interest rates. Journal of Econometrics, 162(1), 55–70.

Fama, Eugene F, & Bliss, Robert R. 1987. The Information in Long-Maturity Forward Rates. American

Economic Review, 77(4), 680–92.

Favero, Carlo A., Niu, Linlin, & Sala, Luca. 2007. Term Structure Forecasting: No-arbitrage Restric-

tions vs. Large Information Set. Tech. rept.

Ferraty, F., & Vieu, P. 2006. Nonparametric functional data analysis: theory and practice. 1st edn.

19

Filipovic, Damir. 2009. Term-Structure Models: A Graduate Course. Springer Finance.

Giacomini, Raffaella, & White, Halbert. 2006. Tests of Conditional Predictive Ability. Econometrica,

74(6), 1545–1578.

Hagan, P., & West, G. 2005. Interpolation schemes for curve construction. Applied Mathematical Finance.

Hagan, P., & West, G. 2006. Interpolation methods for curve construction. Applied Mathematical Finance,

13(2), 89–129.

Hayden, Josef, & Ferstl, Robert. 2010. Zero-coupon yield curve estimation with the package termstrc.

Journal of Statistical Software, 36(i01), 1–34.

Heath, David, Jarrow, Robert, & Morton, Andrew. 1992. Bond Pricing and the Term Structure of

Interest Rates: A New Methodology for Contingent Claims Valuation. Econometrica, 60(1), 77–105.

Ho, TSY, & Lee, S.B. 1986. Term Structure Moevements and the Pricing of Interest Rate Contingent

Claims. The Journal of Finance, 41, 1011–1029.

Hull, John, & White, A. 1990. Valuating Derivative Securities Using the Explicit Finite Difference

Method. The Journal of Financial and Quantitaive Analysis, 25, 87–100.

Hordahl, Peter, Tristani, Oreste, & Vestin, David. 2006. A joint econometric model of macroeco-

nomic and term-structure dynamics. Journal of Econometrics, 131(1-2), 405–444.

Laurini, Marcio P., & Hotta, Luiz K. 2010. Bayesian extensions to diebold-li term structure model.

International Review of Financial Analysis, 19, 342–350.

Marcellino, Massimiliano, Stock, James H., & Watson, Mark W. 2006. A comparison of direct

and iterated multistep AR methods for forecasting macroeconomic time series. Journal of Econometrics,

135(1-2), 499–526.

Matzner-Lober, Eric, & Villa, Christophe. 2004. Functional Principal Component Analysis of the

Yield Curve. In: 21th International Conference AFFI. Association Francaise de Finance.

McCracken, M. W. 2007. Asymtoptics for out of sample tests of Granger Causality. Journal of Econome-

trics, August, 719–752.

McCulloch, J Huston. 1971. Measuring the Term Structure of Interest Rates. Journal of Business, 44(1),

19–31.

McCulloch, J Huston. 1975. The Tax-Adjusted Yield Curve. Journal of Finance, 30(3), 811–30.

Monch, Emanuel. 2008. Forecasting the yield curve in a data-rich environment: a no-arbitrage factor-

augmented VAR approach. Journal of Econometrics, 146(1), 26–43.

Nelson, Charles R., & Siegel, Andrew F. 1987. Parsimonious Modeling of Yield Curves. The Journal

of Business, 60(4), 473–489.

20

Newey, Whitney K, & West, Kenneth D. 1987. A Simple, Positive Semi-definite, Heteroskedasticity

and Autocorrelation Consistent Covariance Matrix. Econometrica, 55(3), 703–08.

Pearson, Neil D, & Sun, Tong-Sheng. 1994. Exploiting the Conditional Density in Estimating the Term

Structure: An Application to the Cox, Ingersoll, and Ross Model. Journal of Finance, 49(4), 1279–1304.

Pesaran, M. Hashem, & Timmermann, Allan. 2007. Selection of estimation window in the presence of

breaks. Journal of Econometrics, 137(1), 134–161.

Pesaran, M. Hashem, Pick, Andreas, & Timmermann, Allan. 2011. Variable selection, estimation

and inference for multi-period forecasting problems. Journal of Econometrics, 164(1), 173–187.

Pooter, Michiel De. 2007 (June). Examining the Nelson-Siegel Class of Term Structure Models. Tinbergen

Institute Discussion Papers 07-043/4. Tinbergen Institute.

Ramsay, J.O., & Silverman, B.W. 1997. Functional Data Analysis. 1st edn.

Svensson, Lars E. O. 1994a (Sept.). Estimating and Interpreting Forward Interest Rates: Sweden 1992-

1994. IMF Working Papers 94/114. International Monetary Fund.

Svensson, Lars E. O. 1994b (Sept.). Estimating and Interpreting Forward Interest Rates: Sweden 1992-

1994. IMF Working Papers 94/114. International Monetary Fund.

Vasicek, Oldrich. 1977. An equilibrium characterization of the term structure. Journal of Financial

Economics, 5(2), 177–188.

21