an alisis de series de tiempo y pron ostico · mayores indices estacionales se ubican en los...

34
An´ alisis de series de tiempo y pron´ ostico ıctor Jos´ e Espinoza Hern´ andez Universidad Nacional Aut´onoma de Nicaragua, Le´on 5 de octubre de 2017 1

Upload: buithien

Post on 20-Sep-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Analisis de series de tiempo y pronostico

Vıctor Jose Espinoza HernandezUniversidad Nacional Autonoma de Nicaragua, Leon

5 de octubre de 2017

1

Indice

1. Introduccion 6

2. Metodo 6

3. Resultados 83.1. Analisis de la serie . . . . . . . . . . . . . . . . . . . . . . . . 8

3.1.1. Analisis de la varianza . . . . . . . . . . . . . . . . . . 83.1.2. Descomposicion de la serie . . . . . . . . . . . . . . . . 9

3.2. Modelo autorregresivo integrado de medias moviles (Arima) . 133.2.1. Analisis inicial de estacionariedad y estacionalidad . . . 133.2.2. Identificacion del proceso AR y MA . . . . . . . . . . . 183.2.3. Estimacion del modelo . . . . . . . . . . . . . . . . . . 203.2.4. Verificacion del modelo . . . . . . . . . . . . . . . . . . 203.2.5. Pronostico . . . . . . . . . . . . . . . . . . . . . . . . . 243.2.6. Validacion del pronostico . . . . . . . . . . . . . . . . . 25

4. Comentarios 26

5. Referencias bibliograficas 27

6. Apendices 28

A. Serie de tiempo utilizada 28

B. Funciones creadas para el estudio 29

C. Codigo utilizado para elaborar el estudio 31

2

Indice de figuras

1. Consumo trimestral real para Nicaragua, periodo 2006 al 2017 82. Comportamiento de la serie consumo por ano . . . . . . . . . 93. Descomposicion de la serie consumo . . . . . . . . . . . . . . . 114. Indices estacionales de la serie consumo . . . . . . . . . . . . . 125. Comportamiento de la serie consumo por trimestre . . . . . . 126. Funcion de autocorrelacion simple para la serie consumo . . . 147. Consumo trimestral real en Nicaragua en primeras diferencias

regulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158. Funcion de autocorrelacion simple para la serie consumo en

primeras diferencias regulares . . . . . . . . . . . . . . . . . . 169. Consumo trimestral en Nicaragua en primeras diferencias es-

tacionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1710. Consumo trimestral en Nicaragua en primeras diferencias es-

tacionales y regulares . . . . . . . . . . . . . . . . . . . . . . . 1811. Funcion de autocorrelacion simple para la serie consumo en

primeras diferencias regulares y estacionales . . . . . . . . . . 1912. Funcion de autocorrelacion parcial para la serie consumo en

primeras diferencias regulares y estacionales . . . . . . . . . . 2013. Histograma de los residuos del modelo Arima . . . . . . . . . 2214. Cırculos unitarios del modelo Arima . . . . . . . . . . . . . . . 2215. Funcion de autocorrelacion simple para los residuos del modelo 2316. Funcion de autocorrelacion parcial para los residuos del modelo 2317. Pronostico de la serie consumo trimestral real en Nicaragua

para los siguientes 3 trimestres . . . . . . . . . . . . . . . . . . 2518. Serie consumo trimestral real en nicaragua observado y ajustado 26

3

Indice de cuadros

1. Comportamiento de la serie consumo por ano . . . . . . . . . 102. Indices estacionales de la serie consumo . . . . . . . . . . . . . 113. Comportamiento de la serie consumo por trimestre . . . . . . 134. Prueba de raız unitaria para la serie consumo . . . . . . . . . 145. Prueba de raız unitaria para la serie consumo en primeras

diferencias regulares . . . . . . . . . . . . . . . . . . . . . . . 156. Prueba de raız unitaria para la serie consumo en primeras

diferencias estacionales . . . . . . . . . . . . . . . . . . . . . . 177. Prueba de raız unitaria para la serie consumo en primeras

diferencias estacionales y regulares . . . . . . . . . . . . . . . 188. Modelo SARIMA (0, 1, 1)(0, 1, 1)4 propuesto para la serie con-

sumo trimestral real en Nicaragua para el perıodo 2006 a 2017 219. Significancia estadıstica de los coeficientes . . . . . . . . . . . 2110. Prueba de normalidad de los residuos del modelo Arima . . . 2111. Prueba de ruido blanco para los residuos del modelo Arima . . 2412. Pronostico de la serie consumo trimestral real en Nicaragua

para los siguientes 3 trimestres . . . . . . . . . . . . . . . . . . 2413. Indicadores de error de pronostico para el modelo Arima . . . 2514. Consumo trimestral real en Nicaragua (millones de cordobas) . 28

4

Resumen

Las series de tiempo son un tipo de variables que encontramos a lolargo de toda la ciencia economica y es necesario conocer su compor-tamiento para llevar a cabo un correcto pronostico de las mismas. Elconsumo es uno de los componentes del PIB y las polıticas economi-cas orientadas a alterar los niveles de consumo en Nicaragua debentomar en cuenta el comportamiento futuro de esta serie, con este ob-jetivo se utiliza el consumo real trimestral de Nicaragua en el periodo2006(I)-2017(I) en millones de cordobas con ano base 2006, la varian-za no es constante por lo que se utiliza un modelo multiplicativo parala descomposicion, la serie presenta tiene una tendencia positiva, losmayores indices estacionales se ubican en los ultimos 2 trimestres delano, el valor medio del consumo es mayor en el cuarto trimestre conC$35,520 millones de cordobas constantes. La serie en niveles no esestacionario pero la serie en diferencias estacionales y regulares si esestacionaria. Las pruebas de funcion de autocorrelacion simple y fun-cion de autocorrelacion parcial demuestran que el proceso generadorde datos del modelo SARIMA es (0, 1, 1)(0, 1, 1)4.Los Pronostico delos siguientes 3 periodos son de C$42,566, C$44,501 y C$45,484 millo-nes de cordobas constante respectivamente.

Palabras clave: Serie de tiempo, SARIMA, Pronostico,Consumo, Nicaragua

5

1. Introduccion

A lo largo del componente de polıtica economica se desarrollan temas acer-ca de los instrumentos utilizados para el analisis de las polıticas economicas,partiendo del analisis de la elaboracion de la polıtica hasta el efecto que tie-nen los retardos sobre la efectividad de las polıticas desarrolladas. Se planteala polıtica monetaria a dos niveles como un metodo necesario para el correc-to seguimiento de los efectos que tienen los instrumentos sobre los objetivosultimos. Dentro de la polıtica fiscal se detallan las distintas posturas queexisten sobre el efecto del financiamiento del deficit publico, ademas de to-mar en cuenta los llamados deficit gemelos al introducir el analisis del sectorexterior. El componente finaliza con un analisis de las polıticas de rentas ylas polıticas micro-economicas.

En el analisis de las polıticas economicas debemos considerar el compor-tamiento de las variables que pretendemos utilizar como objetivo de nuestrosinstrumentos.

El pronostico de estas variables permite: ((...obtener resultados para an-ticipar posibles acontecimientos futuros desfavorables y mitigar la incerti-dumbre sobre las variables economicas exploradas. De igual manera permiteayudar a establecer polıticas para regular el consumo y la produccion encualquier actividad y manejar sistemas de inversion y planificacion macro-economica)) (Rosales Alvarez, Ramon Antonio y cols., 2013).

Los modelos de series temporales “...son conocidos como modelos en for-ma reducida o no estructurales, ya que no han sido derivados de un modeloteorico economico o financiero. Estos modelos son de bastante uso en fi-nanzas, porque usualmente las predicciones obtenidas con estos modelos sonmejores que las obtenidas con los modelos estructurales” (Court Monteverde,Eduardo y Rengifo, Erick Williams, 2011)

2. Metodo

Para la serie de tiempo analizada se lleva a cabo un analisis de la varianzay la tendencia con el uso de tablas y graficas de polıgonos de frecuencia y

6

boxplot agrupados sugeridos por Veliz Capunay (2011).

Se utiliza el metodo Box-Jenkins, tambien conocido como ARIMA pa-ra pronosticar el valor de cada serie para los siguientes tres periodos. Coneste objetivo se toman en cuenta los pasos planteados por Rosales Alvarez,Ramon Antonio y cols. (2013) iniciando por el analisis inicial de la estacio-nariedad y componente estacional de la serie en estudio utilizando la pruebaaumentada de Dickey-Fuller y la funcion de autocorrelacion simple y parcial,a continuacion se procede a la identificacion del proceso AR y MA para de-tectar el proceso generador de datos con la ayuda de las graficas de funcionde autocorrelacion simple y parcial de la serie, con esta informacion se esti-ma el modelo. Antes de llevar a cabo el pronostico se determina si el modeloes adecuado a traves de la verificacion del mismo utilizando la prueba denormalidad de Jarque-Bera, el cırculo unitario, la prueba de Ljung-Box y lafuncion de autocorrelacion simple y parcial para demostrar que los residuosson ruido blanco. Despues de esta etapa es posible llevar a cabo el pronosticoy su validacion a traves de los indicadores de error de pronostico.

7

3. Resultados

3.1. Analisis de la serie

La serie que se desarrolla se obtiene a partir de los datos del Banco Cen-tral de Nicaragua (BCN), y representa el consumo total de Nicaragua enmillones de cordobas en terminos reales (ano base 2006) para el periodo delprimer trimestre del 2006 al primer trimestre del 2017(ver figura 1). La va-riable se denota a lo largo del documento con la letra ((C))

30000

35000

40000

2006 2008 2010 2012 2014 2016

Time

C

Figura 1: Consumo trimestral real para Nicaragua, periodo 2006 al 2017

3.1.1. Analisis de la varianza

Veliz Capunay (2011) sugiere que se identifique la varianza a traves deuna analisis de serie agrupado, utilizando el ano en el que se encuentra el valorcomo factor de agrupacion (ver cuadro 1), en el que podemos concluir quela media no es constante a lo largo de los anos al igual que la varianza, estoultimo nos permite concluir que debemos utilizar un modelo multiplicativo(ver ecuacion 1). El analisis grafico sustentan esta afirmacion (ver figura 2) enel que podemos observar como la mediana aumenta cada ano. Es importantemantener al margen el valor del ano 2017, ya que solo tenemos el valor delprimer trimestre.

Yt = Tt ∗ St ∗ It (1)

8

Y = Serie de tiempoT = Componente tendenciaS = Componente estacionalI = Componente irregular

Todos estos aspectos son basicos para determinar si la serie es o no estacio-naria aunque mas adelante se utilizaran las pruebas estadısticas apropiadaspara llegar a declaraciones concluyentes.

30000

35000

40000

200620072008200920102011201220132014201520162017

Año

Ser

ie

Figura 2: Comportamiento de la serie consumo por ano

3.1.2. Descomposicion de la serie

Como primer paso para desarrollar el pronostico de una serie de tiempoVeliz Capunay (2011) propone analizar el comportamiento de la serie de ma-nera mas detalla a traves de la descomposicion de la serie a traves de mediasmoviles utilizando una funcion multiplicativa, lo cual nos permite conocerel comportamiento de esta variable de manera mas exacta (ver figura 3), seobserva que la serie tiene una tendencia 1 positiva, es decir que a lo largo delos anos en estudio el consumo a aumentado. Para el componentes estacionalde la serie se lleva a cabo el analisis de los indices estacionales.

Los indices estacionales calculados a partir de medias moviles nos mues-tran que el comportamiento de la serie en los primeros trimestres son menores

1Anderson, David R. y cols. (2012) tambien llaman a este componente como tendencia-ciclo, por la dificultad de identificar estos componentes por separado

9

Cuadro 1: Comportamiento de la serie consumo por ano

xYear mean sd var max min2006 28677 1223,3 1496396 30178 274422007 29795 1363,6 1859527 31159 285362008 30957 1076,9 1159780 31944 297022009 31486 1434,3 2057211 32723 299852010 32398 944,3 891782 33250 315262011 33296 1072,8 1150888 34802 322992012 34653 1779,0 3164764 36300 327392013 36063 1671,3 2793302 37524 341892014 37688 1382,3 1910631 39042 363652015 39731 1812,0 3283506 41696 377092016 42040 1419,9 2015984 43946 407512017 42338 NA NA 42338 42338

a la tendencia estimada, algo que no ocurre con los ultimos trimestres delano (ver figura 4). Veliz Capunay (2011) propone interpretar los indices es-tacionales en base a la tendencia estimada. En consideracion a esto se utilizala interpretacion para analizar el valor de los indices desarrollada por An-derson, David R. y cols. (2012) y podemos concluir que: el consumo en elprimer y segundo trimestre es 2 % y 3 % menor a la tendencia respectiva-mente. Mientras que en el tercer y cuarto trimestre el consumo aumenta en3 % y 2 % respectivamente con respecto a la tendencia. Lind, Douglas A. ycols. (2012) propone el analisis de estos indices en comparacion a la media.Es decir que el valor del ındice estacional del primer trimestre nos muestraque el consumo del primer trimestre es 2 % por debajo del promedio anual2.

Para analizar como se comporta esta serie por cada trimestre calculamosalgunos estadısticos descriptivos de la serie (ver cuadro 3) utilizando el tri-mestre como factor de agrupacion, metodo sugerido por Hanke, John E. yWichern, Dean W. (2010), en los cuales podemos observar que el trimestreen el que se presenta mayor consumo es el cuarto con 35,520 millones decordobas en terminos reales, ademas de ser este trimestre aquel que presenta

2La interpretacion puede desarrollarse en cualquiera de las formas aquı descritas

10

data

seas

onal

tren

dre

mai

nder

2006 2008 2010 2012 2014 2016

30000

35000

40000

0.98

0.99

1.00

1.01

1.02

32000

36000

40000

0.97

0.98

0.99

1.00

1.01

1.02

Time

Decomposition of multiplicative time series

Figura 3: Descomposicion de la serie consumo

Cuadro 2: Indices estacionales de la serie consumo

ts season figure diff1 1 0,98 −0,022 2 0,97 −0,033 3 1,03 0,034 4 1,02 0,02

11

−0.02

−0.01

0.00

0.01

0.02

1 2 3 4

Periodo

Indi

ces

esta

cion

ales

− 1

multiplicative

Figura 4: Indices estacionales de la serie consumo

mayor variacion con respecto a esta media (medido a traves de la desviacionestandar). Tambien es posible apreciar este comportamiento a traves de lamediana (ver figura 5), aunque en este caso es el tercer trimestre el que pre-senta mayor consumo 3

30000

35000

40000

1 2 3 4

Periodo

Ser

ie

Figura 5: Comportamiento de la serie consumo por trimestre

3Se recomienda al lector un analisis mas exhaustivo a traves de la asimetrıa y curtosispara aclarar este tipo de afirmaciones

12

Cuadro 3: Comportamiento de la serie consumo por trimestre

xSeason mean sd max min1 33812 4838 42338 274422 33204 4086 41201 279623 35250 4191 42263 291254 35520 4544 43946 30178

3.2. Modelo autorregresivo integrado de medias movi-les (Arima)

3.2.1. Analisis inicial de estacionariedad y estacionalidad

Rosales Alvarez, Ramon Antonio y cols. (2013) plantea que como primerpaso se debe determinar si la serie es estacionaria. Es posible utilizar la prue-ba de Kwiatkowski-Phillips-Schmidt-Shin (KPSS) cuya hipotesis nula es quela serie es estacionaria (Hyndman y Athanasopoulos, 2014).

H0: La serie es estacionaria. el orden de integracion es 0 (Yt ∼ I(0)), notiene raız unitaria.

Aunque la prueba KPSS plantea una prueba de estacionariedad, la prue-ba aumentada de Dickey-Fuller (ADF) es la prueba mayormente utilizada ymuy documentada por Gujarati (2010) y Rosales Alvarez, Ramon Antonio ycols. (2013).La hipotesis nula es que la serie contiene raıces unitarias es decirno es estacionaria, la serie es de orden de integracion 1, que se denota como:Yt ∼ I(1). Esta prueba nos permite plantear cual es el orden de integraciondel modelo Arima 4.

H0:La serie no es estacionaria. el orden de integracion es 1 (Yt ∼ I(1)),tiene raız unitaria.

Es importante senalar que todas las pruebas ADF aplicadas en este docu-mento son elaboradas sin intercepto y sin tendencia a menos que se establezca

4Existe la prueba de Phillips Perron (PP) que planeta la misma hipotesis nula que laprueba ADF para determinar si una serie de tiempo tiene raıces unitarias (Gujarati, 2010)

13

lo contrario y todas pruebas de hipotesis se comparan con un valor de signi-ficancia α = 0.05.

Aplicamos la prueba ADF a la serie sin intercepto o tendencia a la seriede tiempo del consumo trimestral real (ver cuadro 4). Tomando en considera-cion el p-valor y comparando con un nivel de significancia podemos concluirque la serie no es estacional.

Cuadro 4: Prueba de raız unitaria para la serie consumo

ADF testdata: C

ADF(1) = 1.7362, p-value = 0.9784alternative hypothesis: true delta is less than 0

sample estimates:delta

0.01091035

Ademas de la prueba ADF podemos desarrollar la grafica de la funcionde autocorrelacion simple para determinar si la serie es estacional (ver figu-ra 6). Podemos observar que el coeficiente de autocorrelacion de los rezagosdisminuye lentamente.

−0.3

0.0

0.3

0.6

0.9

4 8 12 16

Lag

AC

F

Series: C

Figura 6: Funcion de autocorrelacion simple para la serie consumo

Para lograr que la serie se convierta en estacionaria se recomienda dife-

14

renciar la serie, esto con el objetivo de eliminar la tendencia (Rosales Alvarez,Ramon Antonio y cols., 2013). Se lleva a cabo la diferencia regular de la serie(∆Y = Yt − Yt−1)

La serie diferenciada (ver figura 7) no presenta ninguna tendencia y grafi-camente parece tener media y varianza constante.

−2000

0

2000

2006 2008 2010 2012 2014 2016

Time

diff(

C)

Figura 7: Consumo trimestral real en Nicaragua en primeras diferencias re-gulares

Las aseveraciones anteriores parecen ser correcta al compararlas con losresultados obtenidos con la prueba ADF aplicadas a las diferencias regularesde la serie (ver cuadro 5) en la cual el p valor es menor al nivel de significancia.

Cuadro 5: Prueba de raız unitaria para la serie consumo en primeras diferen-cias regulares

ADF testdata: diff(C)

ADF(1) = -9.1453, p-value < 2.2e-16alternative hypothesis: true delta is less than 0

sample estimates:delta

-1.704417

Para poder concluir si la serie es estacionara es necesario llevar a cabo el

15

analisis de los coeficientes de la funcion de autocorrelacion simple (acf) dela serie en estudio. En este caso podemos concluir que la serie en diferenciasregulares (ver figura 8) posee un componente estacional, debido a que loscoeficientes en los rezagos estacionales5 (S) son significativos (Hanke, JohnE. y Wichern, Dean W., 2010). En este caso los coeficientes de los rezagos 4,8, 12, 16, es decir la serie de consumo trimestral real es estacional. En estepunto todavıa no podemos concluir si la serie es estacionaria ya que debido aque la serie tiene un componente estacional, la prueba de raız unitaria ADFaplicada anteriormente no es correcta, ya que debemos eliminar el componen-te estacional antes de aplicar esta prueba (Rosales Alvarez, Ramon Antonioy cols., 2013).

−0.4

0.0

0.4

4 8 12 16

Lag

AC

F

Series: diff(C)

Figura 8: Funcion de autocorrelacion simple para la serie consumo en prime-ras diferencias regulares

Con el objetivo de eliminar el componente estacional de la serie, procede-mos a calcular la la serie con diferencias estacionales es decir: ∆S = Yt−Yt−S,en el caso del consumo real trimestral tendremos ∆4 = Ct−Ct−4. La serie condiferencias estacionales presenta una pequena tendencia a lo largo del tiempo(ver figura 9). Lo cual se complementa con la prueba ADF (ver cuadro 6),con lo que podemos concluir que la serie con diferencias estacionales no esestacionaria.

Debido a que la serie aun contiene una tendencia debemos llevar a cabo ladiferencia regular de la diferencia estacional, y llevar a cabo el procedimiento

5S = 4 para datos trimestrales y S = 12 para datos mensuales

16

0

1000

2000

3000

2008 2010 2012 2014 2016

Time

sdiff

C

Figura 9: Consumo trimestral en Nicaragua en primeras diferencias estacio-nales

Cuadro 6: Prueba de raız unitaria para la serie consumo en primeras diferen-cias estacionales

ADF testdata: sdiffC

ADF(1) = -0.77984, p-value = 0.3719alternative hypothesis: true delta is less than 0

sample estimates:delta

-0.07013953

anterior. El analisis grafico de esta nueva serie (ver figura 10) nos permitedecir que la serie no posee tendencia de ningun tipo.

La prueba ADF (ver cuadro 7) nos permite concluir que la serie es estacio-nal. Aunque al diferenciar la serie de manera estacional y regular obtuvimosuna serie estacional, Hyndman y Athanasopoulos (2014) recomienda que seutilice algun tipo de transformacion Box-Cox en el caso que la varianza cam-bie da lo largo del tiempo6. En caso de ser necesaria la transformacion Box-Cox, se recomienda utilizar el logaritmo de la serie, que equivale a la funcionBox-Cox con λ = 0, es decir que tendrıamos que representar la funcion de

6Gujarati (2010) plantea un ejemplo de transformacion logaritmica de la serie PIBtrimestral de estados unidos, que equivale a una transformacion Box-Cox con λ = 0(lambda)

17

−2000

−1000

0

1000

2000

2008 2010 2012 2014 2016

Time

diffs

diffC

Figura 10: Consumo trimestral en Nicaragua en primeras diferencias estacio-nales y regulares

autocorrelacion simple y parcial de la serie: ∆∆4C = ∆(log(C)t− log(C)t−4)para el caso en estudio.

Cuadro 7: Prueba de raız unitaria para la serie consumo en primeras diferen-cias estacionales y regulares

ADF testdata: diffsdiffC

ADF(1) = -7.8215, p-value = 3.145e-13alternative hypothesis: true delta is less than 0

sample estimates:delta

-2.150443

Tomando en consideracion la estructura del modelo Arima (p, d, q)(P,D,Q)s,hasta este momento conocemos de la necesidad de diferenciar de manera es-tacional (D) y regular la serie (d), cuya frecuencia(S) es trimestral, por loque el modelo tiene hasta este punto la forma: Arima(p, 1, q)(P, 1, Q)4

3.2.2. Identificacion del proceso AR y MA

Hyndman y Athanasopoulos (2014) proponen escribir un ARIMA(p,d,q)

18

de la forma en que se muestra en la ecuacion 2:

∆dYt = c+ φ1∆dYt−1 + ...+ φp∆

dYt−p + +θ1et−1 + θqet−q + et (2)

Mientras que para un modelo SARIMA(p, d, q)(P,D,Q)S nos muestra laecuacion 3 como ejemplo a un modelo SARIMA (1, 1, 1)(1, 1, 1)4:

(1− φ1)(1− Φ1B4)(1−B)(1−B4)Yt = (1 + θ1B)(1 + Θ1B

4)et (3)

Para llevar a cabo el modelo propuesto se utilizara la notacion:

SARIMA(p, d, q)(P,D,Q)S.

En donde:p = orden del proceso autorregresivo regulard = orden de integracion regular (diferencia regular)q = orden del proceso de medias moviles regularP = orden del proceso autorregresivo estacionalD = orden de integracion estacional (diferencia estacional)Q = orden del proceso de medias moviles estacional

−0.6

−0.4

−0.2

0.0

0.2

4 8 12 16

Lag

AC

F

Series: diffsdiffC

Figura 11: Funcion de autocorrelacion simple para la serie consumo en pri-meras diferencias regulares y estacionales

A traves de la funcion de autocorrelacion simple (ver figura 11) y lafuncion de autocorrelacion parcial (ver figura 12) es posible identificar elproceso generador de datos (Rosales Alvarez, Ramon Antonio y cols., 2013).Este es un proceso iterativo y por ello en el presente documento solo semuestran los detalles del modelo final escogido en el cual se aplica el principiode parsimonia.

19

−0.6

−0.4

−0.2

0.0

0.2

4 8 12 16

Lag

PA

CF

Series: diffsdiffC

Figura 12: Funcion de autocorrelacion parcial para la serie consumo en pri-meras diferencias regulares y estacionales

((El principio de parsimonia se refiere a la preferencia por losmodelos sencillos por encima de los modelos complejos)) (Hanke,John E. y Wichern, Dean W., 2010)

3.2.3. Estimacion del modelo

El modelo SARIMA (0, 1, 1)(0, 1, 1)4 fue el mejor candidato para la serieconsumo trimestral real (ver cuadro 8), basados en el principio de parsimoniay el criterio de informacion de Akaike (AIC) mas bajo7 para seleccionar elmejor modelo (Hanke, John E. y Wichern, Dean W., 2010)

3.2.4. Verificacion del modelo

Rosales Alvarez, Ramon Antonio y cols. (2013) proponen como uno delos pasos para la verificacion del modelo, determinar si los coeficientes sonestadısticamente distintos a cero, utilizando como Hipotesis nula: Ho = Elcoeficiente es igual a 0 (cero). Al llevar a cabo la prueba de significancia(ver cuadro 9) podemos concluir que se rechaza la hipotesis nula, los coefi-cientes en el modelo son distintos a cero (son estadısticamente significativos).

Hanke, John E. y Wichern, Dean W. (2010) propone como primer pasopara verificar la idoneidad del modelo, una histograma (ver grafica 13) y

7Tambien puede utilizarse el criterio de informacion de Bayesiano (BIC)

20

Cuadro 8: Modelo SARIMA (0, 1, 1)(0, 1, 1)4 propuesto para la serie consumotrimestral real en Nicaragua para el perıodo 2006 a 2017

Model 1ma1 −0,63

(0,12)sma1 −0,57

(0,18)AIC 639.40AICc 640.06BIC 644.46Log Likelihood -316.70∗∗∗p < 0,001, ∗∗p < 0,01, ∗p < 0,05

Cuadro 9: Significancia estadıstica de los coeficientesModel 1

ma1 −0,63∗∗∗

(0,12)sma1 −0,57∗∗

(0,18)∗∗∗p < 0,001, ∗∗p < 0,01, ∗p < 0,05

una prueba formal de normalidad. Para este ultimo objetivo Rosales Alva-rez, Ramon Antonio y cols. (2013) sugiere utilizar la prueba de Jarque-Bera(ver cuadro 10) para demostrar que los residuos tienen una distribucion nor-mal con la hipotesis nula: H0 : La variable tiene una distribucion normal.Podemos comprobar que el modelo propuesto cumple con la condicion denormalidad.

Cuadro 10: Prueba de normalidad de los residuos del modelo ArimaJarque Bera Test

data: model$residualsX-squared = 0.11812, df = 2, p-value = 0.9427

21

0.0

2.5

5.0

7.5

10.0

12.5

−2000 −1000 0 1000 2000

model$residuals

coun

t

Figura 13: Histograma de los residuos del modelo Arima

Rosales Alvarez, Ramon Antonio y cols. (2013) propone que dentro de laverificacion del modelo se desarrolle el analisis de las raıces inversas del proce-so AR y MA, esto nos permite comprobar que la serie se estacionaria e inver-tible. Las raıces inversas del los procesos del modelo ARIMA(0, 1, 1)(0, 1, 1)4utilizado para la serie en estudio (ver figura 14) nos muestra que todas lasraıces inversas se encuentran dentro del cırculo unitario, por lo que el modeloes invertible, es decir no es explosivo (Court Monteverde, Eduardo y Rengifo,Erick Williams, 2011). Es debido aclarar que el modelo, al poseer solamenteun proceso MA (y no contener el proceso AR), es estacionario y no se nece-sita demostrar esta ultima condicion.

●●

−1.0

−0.5

0.0

0.5

1.0

−1.0 −0.5 0.0 0.5 1.0

Real

Imag

inar

y

UnitCircle

● Within

Inverse MA roots

Figura 14: Cırculos unitarios del modelo Arima

22

Hanke, John E. y Wichern, Dean W. (2010) nos plantea analizar las au-tocorrelaciones residuales en primer lugar de forma individual, advirtiendoque las aucorrelaciones de los residuos deben ser pequenas y generalmentedentro del intervalo de confianza ±2

√n (ver figura 15 y figura 16). Como

podemos observar los residuos no presentan problema de autocorrelacion enel analisis individual.

−0.3

−0.2

−0.1

0.0

0.1

0.2

0.3

4 8 12 16

Lag

AC

F

Series: model$residuals

Figura 15: Funcion de autocorrelacion simple para los residuos del modelo

−0.3

−0.2

−0.1

0.0

0.1

0.2

0.3

4 8 12 16

Lag

PA

CF

Series: model$residuals

Figura 16: Funcion de autocorrelacion parcial para los residuos del modelo

Para desarrollar el analisis residual como grupo (hipotesis conjunta), sedebe aplicar la prueba de Ljung-Box (ver ecuacion 4), con una distribucionchi cuadrada con m-r grados de libertar, donde m es el numero de retrasos

23

Cuadro 11: Prueba de ruido blanco para los residuos del modelo Arima

Ljung-Box testdata: Residuals from ARIMA(0,1,1)(0,1,1)[4]

Q* = 6.3743, df = 6, p-value = 0.3826Model df: 2. Total lags used: 8

que se evaluan y r es el numero de parametros estimados en el modelo (Han-ke, John E. y Wichern, Dean W., 2010).

Q = n(n+ 2)m∑k=1

r2k(e)

n− k∼ χ2

m−r (4)

Al aplicar esta prueba se utiliza como hipotesis nula: H0 : Los residuosson ruido blanco (ρ1 = ρ2 = ... = 0)8. Al aplicar el test de Ljung-Box para losresiduos del modelo Arima estimado (ver cuadro 11) podemos concluir que seacepta la hipotesis nula, por lo que el residuo se comporta como ruido blanco.

3.2.5. Pronostico

Al terminar la etapa de diagnostico del modelo procedemos a la etapa delpronostico, para el segundo trimestre del ano 2017 se pronostica que el valordel consumo real en Nicaragua llegara a C$ 42,566 millones de cordobas. Losvalores pronosticados y sus intervalos de confianza son estimados al 95 % y80 % (ver cuadro 12 y figura 17)

Cuadro 12: Pronostico de la serie consumo trimestral real en Nicaragua paralos siguientes 3 trimestres

round Point Forecast Lo 80 Hi 80 Lo 95 Hi 952017 Q2 42566 41717 43414 41268 438642017 Q3 44501 43596 45405 43118 458832017 Q4 45484 44527 46440 44021 46946

8El valor de los coeficientes de aucorrelacion son de forma conjunta iguales a 0

24

30000

35000

40000

45000

2007.5 2010.0 2012.5 2015.0 2017.5

Time

Clevel

80

95

Forecasts from ARIMA(0,1,1)(0,1,1)[4]

Figura 17: Pronostico de la serie consumo trimestral real en Nicaragua paralos siguientes 3 trimestres

3.2.6. Validacion del pronostico

Rosales Alvarez, Ramon Antonio y cols. (2013) plantean como ultimo pa-so para la creacion del modelo Arima, la validacion del pronostico a traves delanalisis de los errores. Con este objetivo podemos utilizar varios indicadoresdel error del pronostico 9. Para la serie utilizada podemos observar que lospronosticos en el modelo Arima tienen un error de 1.38 % medido a travesdel error porcentual absoluto medio (MAPE por sus siglas en ingles).

Cuadro 13: Indicadores de error de pronostico para el modelo Arima

as.data.frame ME RMSE MAE MPE MAPE MASE ACF1Training set 105,6 608,55 488,69 0,24 1,38 0,36 −0,18

Rosales Alvarez, Ramon Antonio y cols. (2013) establecen la necesidad degraficar los valores observados y los estimados para determinar si el modeloestima de manera correcta los valores de la serie.

9Hanke, John E. y Wichern, Dean W. (2010) nos brindan un resumen de todos estosindicadores.

25

30000

35000

40000

2007.5 2010.0 2012.5 2015.0 2017.5

tiempo

serie

tipo

ajustado

C

Figura 18: Serie consumo trimestral real en nicaragua observado y ajustado

4. Comentarios

La serie de tiempo de consumo trimestral en Nicaragua en terminos realespresenta un comportamiento estacional, por lo que aplicar un modelo Arimasin tomar en cuenta estas diferencias produce problemas con la prueba deraices unitarias, por lo que es necesario llevar a cabo las diferencias estacio-nales y regulares, el modelo SARIMA (0, 1, 1)(0, 1, 1)4 utilizado cumple contodos los supuestos necesarios dentro de este tipo de modelo, es por lo tantouna herramienta util para pronostico de la serie de tiempo en estudio. Elconsumo real en Nicaragua aumentara en los proximos trimestres con res-pecto al trimestre del ano anterior, presenta por lo tanto tendencia positiva.Para la toma de decisiones de polıtica economica es necesario considerar elefecto que podrıa provocar cambios en los instrumentos utilizados por lasautoridades monetarias (cambio en el nivel de impuestos), que tienen efectosobre la propension marginal a consumir de los nicaraguenses.

26

5. Referencias bibliograficas

Referencias

Anderson, David R., Sweeney, Dennis R., y Williams, Thomas A. (2012).Estadıstica para negocios y economıa (11a ed.). Mexico: CENGAGE Lear-ning.

Court Monteverde, Eduardo, y Rengifo, Erick Williams. (2011). Estadısticasy econometrıa financiera (1a ed.). Argentina: CENGAGE Learning.

Gujarati, D. N. (2010). Econometria (5a ed.). McGRAW-HILL.

Hanke, John E., y Wichern, Dean W. (2010). Pronosticos en los negocios(9a ed.). Mexico: Pearson Educacion.

Hyndman, R., y Athanasopoulos, G. (2014). Forecasting: principles andpractice:. OTexts. Descargado de https://books.google.com.ni/books

?id=gDuRBAAAQBAJ

Lind, Douglas A., Marchal, William G., y Wathen, Samuel A. (2012). Es-tadıstica aplicada a los negocios y la economıa (15a ed.). Mexico: McGraw-Hill.

Rosales Alvarez, Ramon Antonio, Perdomo Calvo, Jorge Andres, MoralesTorrado, Carlos Andres, y Urrego Mondragon, Jaime Alejandro. (2013).Fundamentos de econometrıa intermedia, teorıa y aplicaciones. Colombia:Uniandes.

Veliz Capunay, C. (2011). Estadıstica para la administracion y los negocios(1a ed.). Mexico: Pearson Educacion.

27

6. Apendices

A. Serie de tiempo utilizada

Cuadro 14: Consumo trimestral real en Nicaragua (millones de cordobas)

df year Qtr1 Qtr2 Qtr3 Qtr41 2006 27442,12 27961,73 29125,24 30177,582 2007 28711,40 28536,13 30773,84 31159,363 2008 29701,71 30421,89 31943,98 31758,934 2009 29985,33 30533,37 32703,83 32722,535 2010 31637,89 31525,88 33249,70 33180,056 2011 32298,92 32865,64 34801,75 33218,397 2012 33544,44 32739,41 36028,48 36299,718 2013 34188,61 35119,46 37420,14 37523,999 2014 36365,25 36635,85 38708,14 39042,4410 2015 38784,87 37708,63 40732,11 41696,4911 2016 40750,63 41201,22 42263,37 43945,7912 2017 42337,60

28

B. Funciones creadas para el estudio

# ts_plot_season

ts_plot_season <- function(x = x) {

season <- cycle(x)

season.factor <- factor(season)

ggplot() +

geom_boxplot(mapping = aes(x = season.factor,

y = x)) +

labs(x = "Periodo", y = "Serie")

}

# ts_plot_year

ts_plot_year <- function(x = x) {

t <- time(x)

year <- trunc.Date(x = t, units = "year")

factor.year <- factor(year)

ggplot() +

geom_boxplot(mapping = aes(x = factor.year, y = x)) +

labs(x = "A~no", y = "Serie")

}

# ts_plot_figures

ts_plot_figures <- function(x = x, type = "m") {

d <- decompose(x = x, type = type)

figure <- d$figure

ggplot() +

geom_col(mapping = aes( x = 1:length(figure), y = figure - 1)) +

labs(x = "Periodo", y = "Indices estacionales - 1", caption = d$type) +

scale_x_continuous(breaks = 1:length(d$figure))

}

library(tables)

#ts_table_season

ts_table_season <- function(x) {

tables::tabular(Heading("Season")*factor(cycle(x)) ~

x*(mean + sd + max + min))}

29

#ts_table_year

ts_table_year <- function(x) {

tables::tabular(Heading("Year")*factor(trunc(time(x))) ~

x*(mean + sd + var + max + min))}

#ts_table_figures

ts_table_figures <- function(x = x, type = "m"){

d <- decompose(x,type)

data.frame(season = 1:length(d$figure),

figure = round(x = d$figure, digits = 2),

diff = round(x = d$figure - 1, digits = 2))}

30

C. Codigo utilizado para elaborar el estudio

df <- read.csv(file.choose())

C <- df$con_t_real

C <- ts(data = C, start = 2006, frequency = 4)

C

library(ggplot2)

library(forecast)

library(tseries)

library(CADFtest)

library(texreg)

autoplot(object = C) + theme_gray(base_family = "serif")

ggsave(filename = "C.pdf", device = "pdf",width = 4, height = 2)

autoplot(decompose(x = C, type = "m")) + theme_gray(base_family = "serif")

ggsave(filename = "decompose.pdf", device = "pdf",width = 4, height = 5)

ts_plot_figures(x = C, type = "m") + theme_gray(base_family = "serif")

ggsave(filename = "figures.pdf", device = "pdf",width = 4, height = 2)

ts_plot_season(x = C) + theme_gray(base_family = "serif")

ggsave(filename = "season.pdf", device = "pdf",width = 4, height = 2)

ts_plot_year(x = C) + theme_gray(base_family = "serif")

ggsave(filename = "year.pdf", device = "pdf",width = 4, height = 2)

ts_table_figures(x = C,type = "m")

latex(ts_table_figures(x = C,type = "m"))

ts_table_season(x = C)

latex(ts_table_season(x = C))

ts_table_year(x = C)

latex(ts_table_year(x = C))

library(CADFtest)

31

CADFtest::CADFtest(model = C, type = "none")

ggAcf(C) + theme_gray(base_family = "serif")

ggsave(filename = "acfC.pdf", device = "pdf",width = 4, height = 2)

# diferencia del C ####

autoplot(diff(C)) + theme_gray(base_family = "serif")

ggsave(filename = "diffC.pdf", device = "pdf",width = 4, height = 2)

CADFtest::CADFtest(model = diff(C), type = "none")

ggAcf(diff(C)) + theme_gray(base_family = "serif")

ggsave(filename = "acfdiffC.pdf", device = "pdf",width = 4, height = 2)

sdiffC <- diff(x = C, lag = 4)

# diferencia estacional del C####

autoplot(sdiffC) + theme_gray(base_family = "serif")

ggsave(filename = "sdiffC.pdf", device = "pdf",width = 4, height = 2)

CADFtest::CADFtest(model = sdiffC, type = "none")

diffsdiffC <- diff(x = sdiffC, lag = 1)

autoplot(object = diffsdiffC) + theme_gray(base_family = "serif")

ggsave(filename = "diffsdiffC.pdf", device = "pdf",width = 4, height = 2)

CADFtest::CADFtest(model = diffsdiffC, type = "none")

ggAcf(x = diffsdiffC) + theme_gray(base_family = "serif")

ggsave(filename = "acfdiffsdiffC.pdf", device = "pdf",width = 4, height = 2)

ggPacf(x = diffsdiffC) + theme_gray(base_family = "serif")

ggsave(filename = "pacfdiffsdiffC.pdf", device = "pdf",width = 4, height = 2)

# Modelo ####

32

model <- forecast::Arima(y = C, order = c(0,1,1),seasonal = c(0,1,1))

texreg(model)

library(lmtest)

texreg(coeftest(model))

autoplot(model) + theme_gray(base_family = "serif")

ggsave(filename = "modelur.pdf", device = "pdf",width = 4, height = 2)

ggAcf(x = model$residuals) + theme_gray(base_family = "serif")

ggsave(filename = "acfmodel.pdf", device = "pdf",width = 4, height = 2)

ggPacf(x = model$residuals) + theme_gray(base_family = "serif")

ggsave(filename = "pacfmodel.pdf", device = "pdf",width = 4, height = 2)

forecast::checkresiduals(model)

forecast::gghistogram(x = model$residuals,add.normal = T)

ggsave(filename = "normal.pdf", device = "pdf",width = 4, height = 2)

tseries::jarque.bera.test(model$residuals)

forecast::forecast(object = model, h = 3)

latex(round(as.data.frame(forecast::forecast(object = model, h = 3))))

autoplot(forecast(object = model, h = 3))

ggsave(filename = "forecast.pdf", device = "pdf",width = 4, height = 2)

latex(as.data.frame(round(x = forecast::accuracy(f = model),digits = 2)))

33

ajustado <- model$fitted

serie <- c(C,ajustado)

tipo <- c(rep("C",length(C)),rep("ajustado",length(ajustado)))

tiempo <- rep(time(C),2)

df.plot <- data.frame(tiempo,serie,tipo)

ggplot(data = df.plot) + geom_line(aes(x = tiempo,y = serie,color = tipo))

+ theme_gray(base_family = "serif")

ggsave(filename = "comparar.pdf", device = "pdf",width = 4, height = 2)

34