predicción del tipo de cambio con redes neuronales

Upload: omar-manuel

Post on 06-Jul-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    1/18

    319Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

    MODELADO DEL ÍNDICE DE  TIPO DE CAMBIO REAL COLOMBIANO USANDO REDES NEURONALES  ARTIFICIALES

    MODELADO DEL ÍNDICE DE TIPODE CAMBIO REAL COLOMBIANO

    USANDO REDES  NEURONALESARTIFICIALES*

     Juan David Velásquez Henao**

     Lina María González Rivera***

     * Artículo de investigación científica y tecnológica. Es producto de la investigación realizada por el grupo deFinanzas Computacionales en el modelado y la predicción de series temporales usando técnicas basadas eninteligencia artificial. Fue auspiciado por la Escuela de Sistemas, Facultad de Minas, Universidad Nacional deColombia. El artículo se recibió el 19-04-2005 y se aprobó el 05-12-2005.

    ** Candidato a doctor en Sistemas Energéticos, Universidad Nacional de Colombia. Magíster en Ingeniería deSistemas, Universidad Nacional de Colombia, 1997. Ingeniero civil, Universidad Nacional de Colombia, 1994.Profesor asociado de la Facultad de Minas, Universidad Nacional de Colombia, sede Medellín. Director delGrupo de Finanzas Computacionales, Facultad de Minas, Universidad Nacional de Colombia.Correo electrónico: [email protected]

    *** Ingeniera de sistemas, Universidad Nacional de Colombia, 2006. Miembro del Grupo de Finanzas Computa-cionales, Facultad de Minas, Universidad Nacional de Colombia. Correo electrónico: [email protected]

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    2/18

    320 Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

     JUAN DAVID  VELÁSQUEZ HENAO, LINA MARÍA GONZÁLEZ RIVERA

    R ESUMEN

    El modelaje y la predicción de las tasas decambio es un importante problema econó-mico. En el artículo se usa un modelo deredes neuronales artificiales para represen-tar la dinámica del índice del tipo de cambioreal colombiano, porque describe mejor ladinámica de la serie que un modelo linealautorregresivo, como lo muestra el resulta-do del contraste del radio de verosimilitud.

    El modelo fue aceptado después de aplicarleuna serie de pruebas estándar y de contras-tar sus resultados con los obtenidos usandoun modelo lineal autorregresivo. Los resul-tados indican que el valor actual de la seriedepende únicamente de su valor anterior.

    Palabras clave: redes neuronales artificia-les, tasa de cambio, series de tiempo, mode-lado.

    ABSTRACT

     Modeling the Colombian Real Exchange Rate Index Using Artificial Neuronal Net-

    works

    Modeling and forecasting exchange rates isa big economic headache. This paper usesan artificial neuronal network model to re- present the Colombian real exchange indexdynamics because it describes the series

    dynamics better than a self-regressive lin-ear model does, as may be appreciated inthe result of the verosimilitud radius con-trast. The model was accepted after apply-ing a series of standard tests and contrastingthe results against those obtained using aself-regressive linear model. The results in-dicated that the current value of a seriessolely depends on its previous value.

    Key words: Artificial neuronal networks,exchange rate, time series, modeling.

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    3/18

    321Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

    MODELADO DEL ÍNDICE DE  TIPO DE CAMBIO REAL COLOMBIANO USANDO REDES NEURONALES  ARTIFICIALES

    Introducción

    Durante las últimas décadas, la representa-ción de relaciones económicas no linealesha sido un problema de investigación muyimportante (van Djck, 1999; Granger yTeräsvirta, 1993), de tal forma que laeconometría empírica se ha nutrido de mu-chos modelos y técnicas, cuyos orígenesse encuentran en la estadística y la inteli-gencia artificial. Particularmente, el uso de

    las redes neuronales artificiales ha venidoganando terreno, debido a su capacidad pararepresentar relaciones desconocidas a par-tir de los datos mismos, en aquellos casosdonde la economía no brinda suficientes ele-mentos para establecer la forma funcionalde dicha relación. Más aún, se han dedica-do importantes esfuerzos para desarrollar aproximaciones metodológicas que permi-tan formular y formalizar esta clase de mo-delos a partir de criterios estadísticos y, así,abandonar los métodos ad hoc tradicionales –véase, por ejemplo, a Anders y Korn(1999), Fukumizu (2003), entre otros–.

    Igualmente, ha resultado importante la apli-cación de estas metodologías en el modela-do y predicción de series económicas yfinancieras reales con el fin de ganar una

    mayor experiencia en su uso, ya que, talcomo lo señalan Granger y Teräsvirta(1993), no hay suficientes indicios que per-mitan determinar cuáles modelos podrían ser los más adecuados en la representaciónempírica de relaciones económicas.

    Por otra parte, el modelado y la predicciónde las tasas de cambio han sido reconocidos

    como importantes problemas económicos, enespecial por la dificultad para realizar predic-

    ciones tanto de corto como de largo plazo(Ince y Trafalis, 2006). En el modelado se

     pretende encontrar una descripción matemá-tica (modelo) de la dinámica que sigue unatasa de cambio particular, tal que se cumplanlos supuestos básicos en que se basa el mo-delo usado. Así, por ejemplo, los supuestos básicos en que se fundamentan los modelosautorregresivos son los siguientes: (a) el va-lor actual de la serie se obtiene como unacombinación lineal de sus valores pasados;

    los residuales del modelo son (b) incorrela-cionados, (c) homocedásticos y (d) idénti-camente distribuidos (siguiendo unadistribución normal). El proceso de modela-do busca que el modelo finalmente obtenidocumpla con las condiciones estipuladas, detal forma que cualquier violación de ellas se-ría considerada una causal del rechazo delmodelo, lo que obligaría a reformularlo (eli-minando o adicionando valores rezagados dela serie, etc.) o a postular otro tipo de modelo(una red neuronal u otra técnica no lineal enmedia, o un modelo GARCH para losresiduales, etc.).

    El modelo finalmente obtenido durante el pro-ceso de modelado es una teoría del funciona-miento de la dinámica de la serie estudiadaque permite esclarecer sus propiedades. El pro-

    ceso de formulación del modelo es, en sí mis-mo, un proceso de aprendizaje en que elmodelador, mediante un proceso de ensayo yerror, depura su conocimiento sobre la serieestudiada. En la predicción se pretende en-contrar aquel o aquellos modelos que permi-tan pronosticar con mayor precisión el valor futuro de las tasas de cambio, uno o más pe-ríodos adelante. Este proceso es distinto al

    del modelado, ya que en este último (el mode-lado) prima el cumplimiento de los supuestos

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    4/18

    322 Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

     JUAN DAVID  VELÁSQUEZ HENAO, LINA MARÍA GONZÁLEZ RIVERA

    de la serie, mientras que en la predicción pri-ma la precisión de los pronósticos.

    Los estudios recientes indican que la dificul-tad del modelado y la predicción de las tasasde cambio radica en que ellas siguen, en ge-neral, una dinámica inherentemente no lineal(Kilian y Taylor, 2003). No resulta sorpren-dente, entonces, que haya un número apre-ciable de aproximaciones metodológicasnovedosas a este problema –véase, por ejem-

     plo, a Ince y Trafalis (2006); De Gooijer, Rayy Krager (1998); Tseng, Tzeng, Yu y Yuan(2001); entre otros–, así como estudios ba-sados en la comparación entre diferentes cla-ses de modelos que buscan encontrar el mejor  predictor para cada tasa de cambio particu-lar –como trabajos recientes en este campose encuentran a Clements y Smith (2001), ElShazly y El Shazly (1999), Cao y Soofi(1999), entre otros–.

    La modelación econométrica de las tasas no-minales de cambio del peso colombiano res- pecto al dólar americano es un tema querecientemente ha despertado el interés de losinvestigadores nacionales. Revéiz (2002) pre-senta un análisis descriptivo del comporta-miento de la tasa de cambio nominal diariaentre enero de 1994 y septiembre de 1999,

    que corresponde al período de vigencia de la banda cambiaria. Gómez (1999) desarrollaun modelo empírico en que relaciona las ta-sas de cambio real y nominal a partir la técni-ca de cointegración de Johansen. Patiño yAlonso (2005) analizan la capacidad de pre-dicción de la tasa de cambio nominal paraColombia en el período 1984:I-2004:I, usan-do los enfoques monetarios de precios rígi-

    dos y el modelo de Balassa-Samuelson, encontra de un modelo de paseo aleatorio. Milas

    y Otero (2002) analizan las relaciones de lar-go plazo entre las tasas de cambio oficial y

     paralela bajo los regímenes de bandacambiaria y tasa de cambio flexible. Igual-mente, se han desarrollado estudios sobre latasa de cambio real  para el caso colombiano,con el fin de explicar sus determinantes(Echavarría y Gaviria, 1992; Langebaek,1993; Calderón, 1995; Meisel, 1994).

    Sin embargo, no se encontraron hallazgos

    sobre la realización de estudios en el mode-lado del índice del tipo de cambio real (ITCR), aunque este es un importante indi-cador económico que permite comparar laevolución relativa de la tasa de cambio co-lombiana en relación con las monedas deuna canasta específica de países y las va-riaciones de los precios relativos. En esteartículo se contribuye en esa dirección, aldesarrollar un modelo univariado basado enredes neuronales artificiales del ITCR del peso colombiano frente a 18 países miem- bros del Fondo Monetario Internacional(FMI)1 . Este reporte se encuentra organi-zado de la siguiente manera: la descripciónde la información utilizada y la metodologíade modelado son presentadas en la Sección1. El modelo obtenido, los resultados de las pruebas estadísticas de especificación y su

    discusión son presentados en la Sección 2.Finalmente, las principales conclusiones sonesbozadas en la Sección 3.

    1 Este es un ejercicio de modelado y no de predic-ción, ya que se busca un modelo que pueda repre-

    sentar la dinámica de la serie estudiada y no elmodelo que permita pronosticarla con la mayor  precisión posible.

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    5/18

    323Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

    MODELADO DEL ÍNDICE DE  TIPO DE CAMBIO REAL COLOMBIANO USANDO REDES NEURONALES  ARTIFICIALES

    1. Datos y metodología

    1.1  Información utilizada

    1.1.1 Formación de la tasa de cambio

    La tasa de cambio representativa del mer-cado (TRM) del peso colombiano respectoal dólar americano es el valor calculado ycertificado por la Superintendencia Finan-ciera (conocida anteriormente como la Su-

     perintendencia Bancaria), que correspondeal promedio ponderado de pesos colombia-nos pagados por cada dólar americano delas operaciones de compra y venta de dóla-res del día hábil inmediatamente anterior. Noincluye las operaciones de ventanilla y dederivados sobre divisas que llevan a cabolos establecimientos de crédito en las ciuda-des de Bogotá, Medellín, Cali y Barranqui-

    lla. La TRM para el día siguiente a un díaque es hábil en Colombia y festivo en Esta-dos Unidos es la misma TRM vigente el díafestivo. Es un indicador de las operacionesde compra y venta de dólares en el mercadocambiario, y sus fluctuaciones dependen dela relación entre la oferta y la demanda.

    El mercado cambiario colombiano está com- puesto por un mercado regulado y por unmercado libre. El primero está conformado por las transacciones que se realizan me-diante los intermediarios cambiarios autori-zados (como las entidades financieras);mientras que el mercado libre comprendelas demás transacciones de cambio entre eldólar y el peso colombiano realizadas por el público en general.

    Igualmente, el mercado cambiario está con-formado por los intermediarios y el público

    en general. Los intermediarios comprendenlos establecimientos de crédito, las socieda-

    des comisionistas de bolsa y las casas decambio; entre tanto, el mercado libre estácompuesto por los compradores profesio-nales, que son agentes especializados, re-gistrados en las cámaras de comercio, y quenegocian con el público en general. El Esta-tuto Cambiario indica que las siguientes ope-raciones deben realizarse a través delmercado cambiario regulado:

    • Transacciones de dólares, derivadas delas operaciones de exportación e impor-tación de bienes.

    • Operaciones de endeudamiento exter-no, realizadas por los residentes del país,así como los costos financieros deriva-dos de éstas.

    • Inversiones de capital del exterior en el país, así como los rendimientos asocia-

    dos con ellas.• Inversiones de capital colombianas en

    el exterior. También incluye los rendi-mientos derivados de estas inversiones.

    • Inversiones financieras en títulos emi-tidos y radicados en el exterior, asícomo los rendimientos asociados conellas.

    • Avales y garantías en moneda extranjera.• Operaciones de derivados financieros,

    como contratos forward y swaps de di-visas.

    1.1.2  Efectos en la economía nacional 

    Adicionalmente a la importancia del cambiode divisas entre los agentes del mercado, la

    TRM es la base para la proyección de losingresos de los exportadores y los egresos

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    6/18

    324 Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

     JUAN DAVID  VELÁSQUEZ HENAO, LINA MARÍA GONZÁLEZ RIVERA

    de los importadores, de tal forma que serealizan constantemente esfuerzos para pro-

    nosticar su evolución con la mayor preci-sión posible. Las tendencias marcadas haciala devaluación o revaluación del dólar ame-ricano afectan las ventas externas y hacenmenos o más competitivos los productosnacionales, vía precio, con los consiguien-tes efectos económicos.

    De igual forma, aparte de que la TRM se

    usa como la base para el cálculo de la tasade interés efectiva de algunos activos, in-fluye directamente en el monto en pesos dela deuda del gobierno pactada en dólares yen la consiguiente estrategia gubernamental para su pago, pues la devaluación o reva-luación del peso en relación con el dólar americano ejerce un efecto indirecto sobrelos índices de precios al productor y al con-sumidor. La TRM se considera uno de losindicadores de la situación económica y política del país, ya que refleja indirectamentela confianza que tienen los inversionistas,tanto nacionales como extranjeros, en quese den condiciones favorables para la traídao permanencia de capitales.

    1.1.3  Regulación histórica del mercado cambiario

    La regulación del mercado cambiario Co-lombiano ha pasado por un proceso evoluti-vo: en el modelo anterior, la tasa de cambioera fijada por decreto una o dos veces por semana (Milas y Otero, 2002); el modeloactual, vigente desde septiembre de 1999,está caracterizado por un régimen de flota-ción sucia. En este último, la tasa de cam-

     bio flota sobre una banda amplia sin ningúnsistema de piso o techo, y su valor es deter-

    minado por la interacción de las fuerzas delmercado. No obstante, el Banco de la Re-

     pública se reserva el derecho de actuar so- bre el mercado cambiario para estabilizarlo,ya sea mediante la subasta de opciones tipo

     put  y call , con los fines de acumular reser-vas o aumentar su liquidez, o mediante laintervención directa, cuando la TRM se en-cuentra cuatro puntos por encima o por debajo de su promedio móvil de los últimosveinte días con el fin de disminuir su

    volatilidad.

    1.1.4  Información utilizada

    Tal como lo indica el Banco de la República(2002), internacionalmente se prefiere el usode índices sobre la medición de la tasa decambio real, debido a las dificultades meto-dológicas y a los grandes costos que impli-ca su cálculo. La información utilizada enesta investigación corresponde al índice detipo de cambio real efectivo calculado por el FMI (ITCRFMI) para el peso colombia-no frente a 18 países de entre sus miem- bros, para el período comprendido entre1989:12 y 2003:10, el cual es publicado por el Banco de la República (Gráfico 1).

    1.2 Metodología de modelado

    1.2.1  El modelo de redes neuronales

    Un perceptrón multicapa (MLP, por su siglaen inglés) es un modelo matemático que imitala estructura masivamente paralela de lasneuronas del cerebro, cuya representaciónse presenta en el Gráfico 2 –véase a Masters(1993 y 1995) para una revisión general–.

    Este modelo puede aproximar cualquier fun-ción continua definida en un dominio com-

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    7/18

    325Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

    MODELADO DEL ÍNDICE DE  TIPO DE CAMBIO REAL COLOMBIANO USANDO REDES NEURONALES  ARTIFICIALES

     pacto, con una precisión arbitraria previa-mente establecida (Hornik, Stinchcombe yWhite, 1989; Cybenko, 1989; Funahashi1989). En la práctica, los MLP se han ca-racterizado por ser muy tolerantes a infor-mación incompleta, inexacta o contaminada

    con ruido (Masters, 1993), por lo que hansido usados en la modelación empírica deseries temporales no lineales. Zhang, Patuwoy Hu (1998) presentan una revisión generalsobre el estado del arte, mientras que apli-caciones específicas son presentadas por Heravi, Osborn y Birchenhall (2004);Swanson y White (1997a y 1997b);Faraway y Chatfield (1998); Darbellay y

    Slama (2000); Kuan y Liu (1995), entremuchos otros.

    Gráfico 1

    Índice de tipo de cambio real efectivo (fuente FMI) calculado para el peso

    colombiano frente a 18 países miembros del FMI entre 1989:12 y 2003:10

    Fuente: Banco de la República.

    El MLP presentado en el Gráfico 2 se definematemáticamente como:

    (1)

    Los parámetros Ω  = [β *, β h, α*,h, α p,h],h =1… H , p = 1… P  son estimados usando el principio de máxima verosimilitud de losresiduales. La ecuación definida por (1) equi-vale a un modelo estadístico no paramétricode regresión no lineal (Sarle, 1994). En (1)se asume que ε 

    t   sigue una distribución nor-

    mal con media cero y varianza desconocidaσ 2.  H   representa el número de neuronas en

    la capa oculta. P  es el número de rezagos dela variable dependiente. Y g (·) es la función

     H 

    h

     P 

     p

     pt h ph

     y

    ht    y g  y   ε α α σ 

     β  β    +

     

      

     +⋅+= ∑ ∑

    = =

    −−

    1 1

    ,*,1*2

    1

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    8/18

    326 Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

     JUAN DAVID  VELÁSQUEZ HENAO, LINA MARÍA GONZÁLEZ RIVERA

    de activación de las neuronas de la capaoculta. En el contexto de las series tempo-rales, el modelo puede ser entendido comouna combinación lineal ponderada de latransformación no lineal de varios mode-los autorregresivos.

    El problema de identificación o estimaciónde parámetros está relacionado con la mul-tiplicidad de puntos de mínima local de la

    función de error usada para la estimaciónde los parámetros, debido a que:

    • El modelo puede estar mal condiciona-do, lo cual es síntoma de que las dife-rencias entre las magnitudes de los parámetros Ω  son muy grandes. Ello puede causar que las neuronas en la capaoculta estén en su nivel de saturación (di-ferentes entradas netas producen la mis-

    ma salida), y consecuentemente que elgradiente de la función de verosimilitud

    sea cercano a cero, por lo que la optimi-zación numérica se hace ineficiente.

    • Se pueden obtener modelos diferentescon el mismo error al permutar las neu-ronas de la capa oculta sin variar los va-lores de los parámetros, lo que equivalea intercambiar algunos de los elementosde Ω.

    • Se pueden obtener modelos diferentes

    con el mismo error, cambiando de sig-no los parámetros asociados con las co-nexiones que entran y salen de la mismaneurona oculta, ya que para funcionesde activación que cumplen con  g (u) =sgn(u)|u|, el cambio de signos no alterael resultado del MLP.

    • El modelo no es globalmente identifica- ble, si la salida de una neurona oculta o

    el parámetro asociado con la conexiónentre ella y la neurona de salida son cero,

    Gráfico 2

    Modelo de redes neuronales

    Fuente: elaboración propia.

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    9/18

    327Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

    MODELADO DEL ÍNDICE DE  TIPO DE CAMBIO REAL COLOMBIANO USANDO REDES NEURONALES  ARTIFICIALES

    ya que algunos de los parámetros res-tantes podrían tomar cualquier valor.

    El efecto nocivo de estas características delMLP puede ser mitigado al modificar la fun-ción de activación de las neuronas ocultas yal imponer algunas restricciones a los pará-metros del modelo:

    • Tal como es indicado por LeCun, Bottou,Orr y Muller (1998), algunos autores hansugerido, por su experiencia práctica, que

    las funciones tipo sigmoidea simétricasalrededor del origen, convergen más rá- pidamente que la función sigmoidea tra-dicional. Adicionalmente, la incorporaciónde un término lineal puede ayudar a laconvergencia, ya que se evita la satura-ción de la neurona y garantiza un gra-diente mínimo cuando la salida neta de lafunción sigmoidea es cercana a sus va-

    lores extremos. Consecuentemente conlas razones expuestas, el modelo pro- puesto activa sus neuronas de la capaoculta usando la función:

    (2)

    • El conjunto de parámetros β h, h = 1,…, H 

     pueden restringirse a ser positivos, ya

    que si uno de ellos es negativo, su sig-no puede alterarse multiplicando los pa-rámetros de las conexiones que entrany salen de la correspondiente neurona por menos uno; esto se debe a que (2)es simétrica alrededor del origen, por loque  g (u) = - g (-u).

    • El conjunto de parámetros β h, h = 1,…, H 

    se restringe a que sus componentes

    estén ordenados de forma creciente0 < β 

    1 = β 

    2 = … = β 

     H , para evitar que

    se puedan obtener nuevas configuracio-nes permutando las neuronas de la capa

    oculta.

    La división de la entrada neta a la neurona por 2σ 

     y  escala automáticamente las entra-

    das al modelo, de tal forma que no es nece-sario realizar su preprocesamiento.

    1.2.2  Selección del modelo

    Por otra parte, el problema de selección delmodelo (determinación de las variables rele-vantes y número de neuronas de la capa ocul-ta) puede resolverse de una forma másadecuada a partir de pruebas de hipótesis, talcomo es sugerido por Anders y Korn (1999).En este sentido, los contrastes de Wald, elmultiplicador de Lagrange y el radio de vero-similitud aplican, ya que los parámetros tie-

    nen una distribución asintóticamente normal,siempre y cuando en su estimación se use el principio de máxima verosimilitud y el mo-delo no tenga neuronas ocultas redundantes.

    Ello implica que en el proceso de selecciónse debe agregar una nueva neurona en lacapa oculta, a fin de contrastar si la ganan-cia de su adición es significativa. Es biensabido que estos resultados son válidos si el

    modelo no tiene neuronas ocultas redundan-tes, tal como es discutido por Fukumizu(2003), así como también que los tres con-trastes anteriores son equivalentes asintóti-camente; no obstante, poco es sabido cuandola muestra de datos es pequeña; usualmen-te, la elección del contraste usado para cadacaso particular se realiza en función de lafacilidad de su cálculo, aunque los resulta-

    dos pueden ser significativamente diferen-tes para un mismo caso.

    uu

    uu g    01.0

    )exp(1

    )exp(1)(   +

    −+

    −−=

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    10/18

    328 Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

     JUAN DAVID  VELÁSQUEZ HENAO, LINA MARÍA GONZÁLEZ RIVERA

    En este sentido, Anders y Korn (1999), asícomo muchos otros, argumentan que el pro-

    ceso de selección del modelo debe ser reali-zado en forma constructiva: el primer modelo contiene una neurona en la capaoculta; el segundo, dos, y así sucesivamen-te. Por otra parte, en este estudio se consi-dera que la prueba basada en el radio deverosimilitud es más apropiada, ya que tie-ne en cuenta el desempeño real del modeloaumentado con la nueva neurona, y no una

    aproximación, como ocurre en el contrastede multiplicadores de Lagrange. Consecuen-temente, la metodología propuesta para laespecificación del MLP es la siguiente:

    1. Los regresores iniciales son determina-dos a partir de la especificación de unmodelo AR de orden p usando un crite-rio de información como el de Akaike,Hannan y Quinn o Schwartz.

    2. Se estima con el modelo con H  = 1.3. Se agrega una nueva neurona oculta y se

    estima el modelo.

    4. Si la nueva neurona es aceptada usandola prueba del radio de verosimilitud seregresa al paso 3; de lo contrario se con-tinúa con el paso 5.

    5. Fin del algoritmo.

    1.2.3  Evaluación del modelo

    El modelo estimado se evalúa mediante laaplicación de dos grupos de pruebas paradeterminar sus bondades en la representa-ción de la dinámica de la serie estudiada.Un primer grupo de pruebas está orientadoa determinar si la secuencia de errores ε 

    siguen una distribución normal. Las prue- bas restantes se usan para determinar si los

    residuales son incorrelacionados o presen-tan algún tipo de heterocedasticidad. Una

    verificación final, obligatoria para cualquier modelo no lineal, es determinar sus pro- piedades dinámicas. Si el modelo es diver-gente, debería ser rechazado y, luego,realizar una nueva especificación o un nue-vo proceso de estimación de sus paráme-tros. Las pruebas específicas llevadas acabo y sus resultados son descritos en la próxima sección.

    2. Resultados obtenidos y discusión

    En esta sección se reportan los resultadosde aplicar el proceso de especificación delMLP descrito en la sección anterior alITCRFMI. La serie se encuentra disponibleen la página web del Banco de la Repúblicade Colombia. Sus principales propiedadesestadísticas son resumidas en el Gráfico3. La inspección visual de la serie y de suautocorrelograma señalan indicios de queel ITCRFMI esté integrado; no obstante,los contrastes KPSS (con un estadísticode 2,109,  p-crítico < 1%) y de Dickey-Fuller (con un estadístico de -1,3828,

     p-crítico > 10%) indican que la serie esestacionaria.

    Siguiendo el primer paso del proceso deespecificación, se estimaron modelos au-torregresivos AR( p) para p = 1,…,12, y secalcularon para cada uno de ellos los crite-rios de información de Akaike, Hannan yQuinn y Schwartz. Los resultados son pre-sentados en el Cuadro 1. Para complemen-tar los resultados obtenidos en esta primerafase, se aplicaron las pruebas de no lineali-

    dad de Tsay, Kennan, White y RESET acada uno de los modelos AR( p) estimados.

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    11/18

    329Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

    MODELADO DEL ÍNDICE DE  TIPO DE CAMBIO REAL COLOMBIANO USANDO REDES NEURONALES  ARTIFICIALES

    Gráfico 3

    Propiedades estadísticas del ITCRFMI

    Fuente: Elaboración propia.

    Las pruebas de White y Tsay indican que

    la serie es no lineal para todos los modelosestimados, usando un valor crítico del 5%.La prueba RESET indica no linealidad paralos modelos AR( p) con  p = 1, 3, 4, 11 y12. La prueba de Kennan indica una evi-dencia moderada a favor de la no linealidad para el modelo AR(1). Los tres criterios deinformación considerados indican que elmodelo óptimo es un AR(1), y para el cual

    las cuatro pruebas confirman la no lineali-dad de la serie estudiada.

    Como segundo paso del procedimiento se

    estimaron modelos MLP con H = 1 y 2. Elestadístico para el contraste del radio deverosimilitud para los dos modelos es 2,923( p = 0,404), por lo que se rechaza el mode-lo con  H = 2. Los parámetros del modeloobtenido ( H = 1) son reportados en el Cua-dro 2, junto con los criterios de informa-ción calculados. En dicho cuadro, AIC es elcriterio de información de Akaike; HQC, el

    criterio de información de Hannan-Quinn, ySC, el criterio de información de Schwartz.

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    12/18

    330 Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

     JUAN DAVID  VELÁSQUEZ HENAO, LINA MARÍA GONZÁLEZ RIVERA

    Cuadro 1

    Criterios de información calculados para un modelo autorregresivo de orden  P 

    * Valor crítico al 5% pero no al 1%.

    ** Valor crítico al 1%.

    Fuente: elaboración propia.

    Cuadro 2

    Parámetros del modelo de redes neuronales

    La predicción un mes adelante puede ser observada en el Gráfico 4.

    En el Gráfico 5 se resumen las principales propiedades estadísticas de los residuales: LMy JB son las pruebas de normalidad de Lin-Muldhokar y Jarque-Bera, respectivamente;BP y LB son las pruebas de correlación serialde Box-Pierce y Ljung-Box, respectivamen-

    te; ARCH es la prueba de heterocedasticidadde Engle (1982). Los residuales del modelo

    Fuente: elaboración propia.

    son incorrelacionados y no siguen una distri- bución normal. La prueba ARCH indica la presencia de heterocedasticidad en losresiduales, pero se piensa que esto es un efec-to, debido a que no se han incluido variablesexplicativas, más que una propiedad intrín-seca de la serie misma.

    P AK HQ SC Kennan RESET Tsay White1 5,5509  5,5707  5,5999  4,854* 7,556** 4,903* -0,050**2 5,5601 5,5865 5,6254 2,551 2,895 20,150** -0,037**3 5,5533 5,5863 5,6349 2,638 3,117* 13,140** -0,039**4 5,5612 5,6008 5,6591 2,539 3,029* 8,951** -0,030**5 5,5946 5,6408 5,7089 2,315 2,731 6,454** -0,024**6 5,8258 5,8787 5,9564 2,296 2,757 5,156** -0,024**7 5,7981 5,8575 5,9450 2,288 2,737 4,582** -0,022**8 6,3978 6,4638 6,5610 2,292 2,739 3,948** -0,023**

    9 6,0394 6,1121 6,2190 2,369 2,837 3,431** -0,028**10 6,0659 6,1451 6,2617 2,343 2,939 3,154** -0,032**11 6,5986 6,6845 6,8108 2,397 3,118* 2,847** -0,035**12 7,4414 7,5338 7,6699 2,736 3,811* 2,449** -0,046**

    Parámetro Valor Error estándar Estadístico Tα1,1  1,12 0,07 15,83α*,1  -121,25 95,61 -1,27β1  53,00 7,99 6,63β*  107,97 88,54 1,22

    AIC = 5,508; HQC = 5,535; SC = 5,574.

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    13/18

    331Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

    MODELADO DEL ÍNDICE DE  TIPO DE CAMBIO REAL COLOMBIANO USANDO REDES NEURONALES  ARTIFICIALES

    Gráfico 4

    Predicción un mes adelante usando un perceptrón multicapa con  H  = 1

    Gráfico 5

    Propiedades estadísticas de los residuales del modelo

    Fuente: elaboración propia.

    LM = 4,374 ( p = 0,00); JB = 13233,5 ( p = 0,00); BP(5) = 3,283

    ( p = 0,656); LB(5) = 3,357 ( p = 0,645); ARCH(1) = 30,003

    ( p = 0,0); ARCH(5) = 7,021 ( p = 0,219).Fuente: elaboración propia.

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    14/18

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    15/18

    333Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

    MODELADO DEL ÍNDICE DE  TIPO DE CAMBIO REAL COLOMBIANO USANDO REDES NEURONALES  ARTIFICIALES

    Para contrastar las ventajas del MLP, unmodelo AR(1) fue estimado. Los estadísti-cos del ajuste a la muestra son presentadosen el Cuadro 3 y señalan cómo el MLP reco-ge de mejor forma la dinámica de la serie es-tudiada. Una prueba del radio de verosimilitud

    fue aplicada a los dos modelos considerandoque ellos son independientes. El estadísticoobtenido fue 1,066 con  p = 0,012, el cualindica que los pronósticos de ambos mode-los son significativamente diferentes el unodel otro, lo que confirma la ventaja de lamodelación usando la red neuronal artificial.

    La relación σno_lineal

    /σlineal

      = 0,978, dondeσ

    no_lineal y σ

    lineal representan la desviación es-

    tándar de los residuos de los modelos MLPy AR(1), respectivamente, da una idea de laganancia relativa del ajuste de ambos mode-los a los datos. Su valor cercano a la unidadindica que el modelo no lineal es necesario para caracterizar algunos períodos donde ladinámica de la serie es más compleja.

    A partir del análisis anterior puede concluir-

    se que la red neuronal obtenida es una re- presentación más adecuada de la dinámica

    del ITCRFMI en relación con un modeloautorregresivo, ya que se ha demostrado quela serie es no lineal.

    Conclusiones

    Tanto el modelado como el pronóstico devariables económicas y financieras son im- portantes problemas que han recibido mu-cha atención tanto de profesionales comode investigadores durante las últimas déca-das; consecuentemente, se han dedicadomuchos esfuerzos para desarrollar metodo-logías que buscan superar las falencias ylimitantes teóricas, conceptuales y prácti-

    cas que se presentan cuando cada serie par-ticular es analizada a la luz de los modelostradicionales. En este mismo sentido, resul-ta importante analizar la capacidad de mo-delado y predicción desde cada modelo ycada serie disponible en particular, esto es,determinar para cada serie cuál o cuáles sonlos modelos que mejor representan sus ca-racterísticas, y para cada modelo, estable-

    cer cuáles son las características de las seriesque representa mejor.

    Cuadro 4

    Momentos y valores máximo y mínimo para el ITCRFMI

    y los modelos considerados

    Nota: los valores para los modelos fueron calculados realizando una simulación de 10.000 datos

    usando bootstrapping.Fuente: elaboración propia.

    Estadístico ITCRFMI MLP(H=1) AR(1)Máximo 144,210 154,830 186,580Mínimo 79,390 41,900 33,210Media 107,970 115,750 111,410Varianza 230,700 254,430 389,620Curtosis 0,153 -0,678 -0,028Asimetría 2,428 2,431 3,217

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    16/18

    334 Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

     JUAN DAVID  VELÁSQUEZ HENAO, LINA MARÍA GONZÁLEZ RIVERA

    En este estudio se realiza una primera con-tribución en esta dirección, ya que se anali-

    za la serie del ITCRFMI con una redneuronal del tipo perceptrón multicapa, cuyaespecificación y aceptación está basada encriterios estadísticos, y se compara con unmodelo autorregresivo que usa las mismasentradas. Los principales resultados obteni-dos están relacionados con los siguientesaspectos: se demuestra a partir de criteriosestadísticos que la serie sigue una dinámica

    no lineal; la red neuronal desarrollada cap-tura las relaciones determinísticas de ordenno lineal entre el valor actual de la ITCRFMIy el valor del mes anterior, de tal forma quelos residuales obtenidos son menores enmagnitud en relación con un modelo linealque usa los mismos regresores. Consecuen-temente, el modelo desarrollado es poten-cialmente un mejor predictor de la serie encomparación con un modelo lineal.

    Existen otros modelos no lineales que po-drían ser usados para representar la dinámi-ca de la serie estudiada, de tal forma que enun trabajo futuro se hace necesario compa-rar dichos modelos para establecer cuál deellos representa mejor la dinámica delITCRFMI.

    Agradecimientos

    Los autores expresan sus agradecimientosa dos evaluadores anónimos, cuyos comen-tarios permitieron mejorar ampliamente lacalidad del artículo.

    Lista de referencias

    Anders, U. y Korn, O. (1999). Model selection inneural networks. Neural Networks, 12, 309-323.

    Ayala, M. y Castillo, R. D. (2005). Un modelo de predicción para el valor TRM: un acercamiento

    desde las redes neuronales artificiales. Recupe-rado de: http://www.usergioarboleda. edu.co/observatorio_economico/Redes_ Neuronales/Sistemas_Inteligentes.htm

    Banco de la República (2002). Reportes del Emisor (40).

    Calderón, A. (1995). La tasa de cambio real en Co-lombia: mitos y realidades. Coyuntura Econó-mica, XXV (2), 101-111.

    Cao, L. y Soofi, A. S. (1999). Nonlinear determinis-tic forecasting of daily dollar exchange rates.

     International Journal of Forecasting , 15, 421-430.

    Clements, M. P. y Smith, J. (2001). Evaluating fore-casts from SETAR models of exchange rates.

     Journal of International Money and Finance,20, 133-148.

    Cybenko, G. (1989). Approximation by superposi-tions of a sigmoidal function.  Mathematics of Control, Signals and Systems 2, 202-314.

    El Shazly, M. y El Shazly, H. E. (1999). Forecast-ing currency prices using a genetically evolved

    neural network architecture.  International Re-view of Financial Analysis, 81, 67-82.

    Darbellay, G. y Slama, M. (2000), Forecasting theshort-term demand for electricity: do neural net-works stand a better chance? International Jour-nal of Forecasting, 16, 71-83.

    De Gooijer, J. G., Ray, B. K. y Krager, H. (1998).Forecasting exchange rates using TSMARS.

     Journal of International Money and Finance,17, 513-534.

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    17/18

    335Cuad. Adm. Bogotá (Colombia), 19 (32): 319-336, julio-diciembre de 2006 

    MODELADO DEL ÍNDICE DE  TIPO DE CAMBIO REAL COLOMBIANO USANDO REDES NEURONALES  ARTIFICIALES

    Echavarría, J. J y Gaviria, A. (1992). Los determi-nantes de la tasa de cambio y la coyuntura ac-

    tual en Colombia. Coyuntura Económica, XXII,4, 101-111.

    Engle, R. (1982). Autoregressive conditionalheterocedasticity with estimates of the varianceof United Kingdom inflations.  Econometrica(50), 987-1007.

    Faraway, J. y Chatfield, C. (1998). Time series fore-casting with neural networks: a comparative

    study using the airline data. Journal of Applied Statistics (47), 231-250.

    Fukumizu, K. (2003). Likelihood ratio of unidenti-fiable models and multilayer neural networks.

     Annals of Statistics, 31 (3), 833-851.

    Funahashi, K. (1989). On the approximate realiza-tion of continuous mappings by neural networks.

     Neural Neworks, 2, 183-192.

    Granger, C. y Teräsvirta, T. (1993). Modeling non-linear economic relationships. Oxford: OxfordUniversity Press.

    Gómez, J. (1999). A model of the nominal and realexchange rates in Colombia. Serie Borradores deEconomía (129). Bogotá: Banco de la República.

    Heravi, S., Osborn, D. y Birchenhall, C. (2004).Linear versus neural network forecasts for european industrial production series. Interna-tional Journal of Forecasting  (20), 435-446.

    Hornik, K., Stinchcombe, M. y White, H. (1989).Multilayer feedforward networks are universalapproximators. Neural Networks, 2, 359-366.

    Ince, H. y Trafalis, T. B. (2006). A hybrid model for 

    exchange rate prediction. Decision Support Sys-tems, 42(2), 1054-1062.

    Kilian, L. y Taylor, M. P. (2003). Why is it sodifficult to beat the random walk forecast of 

    exchange rates? Journal of International Eco-nomics, 60, 85-107.

    Kuan, C. y Liu, T. (1995). Forecasting exchangerates using feedforwad and recurrent neural net-works. Journal of Applied Econometrics (10),347-364.

    Langebaek, A. (1993). Tasa de cambio real y tasa decambio de equilibrio. Serie  Archivos de Ma-croeconomía. Departamento Nacional de Pla-neación, Unidad de Análisis Macroeconómico.Documento 19, 27 p.

    LeCun, Y., Bottou, L., Orr, G. B. y Muller, K. R.(1998). Efficient backprop. En:  Neural net-works: Tricks of the trade (pp. 5-50). Springer Lecture Notes in Computer Sciences 1524.

    Masters, T. (1993). Practical neural network reci- pes in C++. New York: Academic Press.

    Masters, T. (1995). Neural, novel and hybrid algo-rithms for time series prediction. New York:John Wiley and Sons.

    Meisel, A. (1994). Cómo determinar si el peso estásobrevaluado o subvaluado. Borradores Sema-

    nales de Economía  (6). Bogotá: Banco de laRepública.

    Milas, C. y Otero, J. (2002). Modelling oficial and parallel exchange rates in Colombia under alter-native regimes: a non-linear approach. Economic

     Modelling , 20, 165-179.

    Patiño, C. I. y Alonso, J. C. (2005). Determinan-tes de la tasa de cambio nominal en Colom-

    bia: evaluación de pronósticos. Manuscritono publicado.

  • 8/17/2019 Predicción Del Tipo de Cambio Con Redes Neuronales

    18/18

    336 Cuad Adm Bogotá (Colombia) 19 (32): 319-336 julio-diciembre de 2006

     JUAN DAVID  VELÁSQUEZ HENAO, LINA MARÍA GONZÁLEZ RIVERA

    Revéiz, A. (2002). Evolution of the Colombian pesowithin the currency bands, nonlinear analysis

    and stochastic modeling. Rev. Econ. Ros., 5(1),37-91.

    Sarle, W. (1994). Neural networks and statisticalmodels. Documento presentado en The 19th

     Annual SAS Users Group Int. Conference, Cary, NC: SAS Institute, pp. 1538-1550.

    Swanson, N. y White, H. (1997a). Forecasting eco-nomic time series using adaptive versusnonadaptive and linear versus non-linear econo-metric models. International Journal of Fore-casting  (13), 439-461.

    Swanson, N. y White, H. (1997b). A model selec-tion approach to real time macroeconomic fore-

    casting using linear models and artificial neuralnetworks. Review of Economics and Statistics

    (39), 540-550.

    Tseng, F. M., Tzeng, G. H., Yu, H. C. y Yuan, B. J.C. (2001). Fuzzy ARIMA model for forecast-ing the foreign exchange market. Fuzzy Sets and Systems, 118, 9-19.

    Van Djck, D. (1999), Smooth transition models:extensions and outlier robust inference. Tesis dePh. D. no publicada, Erasmus University, Rot-terdam, Holanda.

    Zhang, G., Patuwo, B. y Hu, M. (1998). Forecast-ing with artificial neural networks: the state of the art.  International Journal of Forecasting (14), 35-62.