Download - Teoría de Cópulas Aplicada a La Predicción
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
1/324
UNIVERSIDAD COMPLUTENSE DE MADRID
FACULTAD DE CIENCIAS MATEMÁTICASDepartamento de Estadística e Investigación Operativa
TEORÍA DE CÓPULAS APLICADA A LA PREDICCIÓN
MEMORIA PARA OPTAR AL GRADO DE DOCTOR
PRESENTADA POR
Daniel Vélez Serrano
Bajo la dirección del doctor:
Vicente Quesada Paloma
Madrid, 2007
ISBN: 978-84-669-3134-2
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
2/324
UNIVERSIDAD COMPLUTENSE DE MADRID
FACULTAD DE CIENCIAS MATEMÁTICAS
DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA
TEORÍA DE CÓPULAS APLICADA A LA PREDICCIÓN
Daniel Vélez Serrano
Noviembre 2006
TESIS DOCTORAL
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
3/324
- 2 -
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
4/324
D. VICENTE QUESADA ALO!A" CATEDR#TICO DEL DEARTA!ENTO DEESTADISTICA E INVESTI$ACI%N OERATIVA DE LA UNIVERSIDADCO!LUTENSE DE !ADRID
CERTI&ICA'
Que la presente memoria de título:
TEOR(A DE C%ULAS ALICADA A LA REDICCI%N
Ha sido realizada bajo mi dirección por D. Daniel Vélez Serrano, licenciado enCiencias Matemticas, ! constitu!e su tesis para optar al "rado de Doctor enCiencias Matemticas.
# para $ue conste, en cumplimiento de la le"islación %i"ente ! a los e&ectos oportunos,&irmo la presente en Madrid a '( de )o%iembre de '**+
- 3 -
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
5/324
- 4 -
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
6/324
- I saw...I saw a city in the clouds.- Mmm. Friends you have there.- They were in pain.- It is the future you see.- Future? Will they die?
oda closes his eyes and lowers his head.
- !ifficult to see. Always in motion is the future...
"T#$ $M%I&$ 'T&I($' )*+(,'cript adaptation y awrence (asdan and ei/h )rac0ett from a story y 1eor/e ucas
- -
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
7/324
- -
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
8/324
Agradecimientos
Creo que una tesis doctoral no es sólo el resultado del esfuerzo compartido entre el director de tesis y su alumno.
Al menos en mi caso, debo confesar que esta tesis nunca hubiera visto la luz de no haber sido por una relación de
personas a las que considero tengo mucho que agradecer.
En primer lugar, me gustaría citar a un compañero de mi primer trabao llamado !gnacio Arbu"s, posiblemente la
persona m#s inteligente con la que he trabaado. $ue su amplio dominio de la materia, su pasión por las matem#ticas y
la facilidad con la que era capaz de transmitir sus conocimientos, las que me motivaron a empezar los cursos de
postgrado para meorar mi grado de formación. %erdí la pista a este asturiano cuando decidió dear la empresa en la que
trabaaba conmigo, para empezar a prepararse las oposiciones del !&E y lo 'ltimo que s" de "l es que las aprobó, algo
de lo que nunca tuve duda alguna. En cualquier caso, si alguna ves lees estas líneas, (gracias &acho).
En segundo lugar quería hacer mención a mi director de tesis, *icente +uesada, dado que fue "l quien, una vez que
hube conseguido la suficiencia investigadora, me animó a continuar el doctorado y a hacer esta tesis. %ara mi, supuso
todo un reto emprender este camino estando ya bien situado laboralmente con casi cinco años de eperiencia, y a
sabiendas de las dificultades y el sacrificio que con seguridad implicaría un compromiso de este tipo. Entre las cosas
que quiero agradecerle me gustaría destacar el hecho de que haya sabido siempre proponerme temas de investigación
tan relacionados con los proyectos de an#lisis que desarrollo y a la vez tan innovadores y desconocidos en el mundillo
en el que me muevo. -ambi"n le agradezco no haberme presionado y haberme dado fleibilidad total a la hora de llevar
esta tesis adelante, entendiendo las dificultades derivadas de compatibilizar dicha labor con mi trabao.
A los doctores avier /artín y os" /aría 0arcía 1antesmases, me gustaría agradecer en primer lugar el hecho de que
me pusieran en contacto con *icente para que me tutelase esta tesis. $ueron ellos adem#s, quienes me ofrecieron mi
primer trabao como consultor matem#tico y les quiero agradecer la confianza que en mí depositaron desde el primer
momento para participar y dirigir importantes proyectos de investigación. Entre ellos, guardo un especial recuerdo de
los realizados para el Departamento de Aná!"!" # S!m$a%!&n de la compañía Ena'á". Agradezco a la responsable del
departamento 2aura /arín y a todo su equipo la ayuda prestada, de forma especial a Ana 3el"n 0arcía que me ha
echado una mano con la provisión de datos utilizados para el desarrollo de las aplicaciones pr#cticas que aquí se
eponen y que adem#s, me ha transmitido muchos #nimos a lo largo de estos 'ltimos años.
-ambi"n tengo mucho que agradecer a mi círculo de amistades por los buenos ratos que hemos compartido y que espero
seguir compartiendo. 0racias por sus #nimos constantes a 2uis avier $errero, mi primer compañero de fatigas en la
carrera, que siempre estuvo ahí. 0racias tambi"n a 1andra /artín, a Amanda 1anz, a os" 2uis &avarro, a os" /aría
%icado, a /iguel 4edondo 5de manera especial por su ayuda y por sus conseos6, a 7avid 3ueno, a $rancisco
$ern#ndez, a 7avid 0uti"rrez, a Carlos 4uíz, a %rudencio 8reña, a 9scar *illanueva y a muchos otros que seguro deo
de nombrar, quienes, a trav"s de su compañía y afecto, han aportado su granito de arena en esta tesis.
0racias a los padres de mi novia, -om#s y Charo, por sus conseos, su atención, y por esas agradables meriendas y
cenas en las que nos hemos reunido para ver alguna película o partido. 4atitos de conversación totalmente necesarios.
- 5 -
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
9/324
$inalmente, quiero hacer mención especial a mi familia. 7e forma general gracias a todos por sus #nimos y por haberme
entendido cuando ni yo mismo era capaz de hacerlo.
7ebo agradecerle a mi hermano os" todas sus enseñanzas de programación, sus charlas matem#ticas y científicas, y
todos sus conseos a la hora de dar formato para presentar esta tesis. Adem#s considero que, el hecho de quecomenz#ramos al mismo tiempo la andadura en una tesis doctoral y de que nos hayamos motivado mutuamente durante
todos estos años a seguir adelante, ha sido un factor determinante para el logro de nuestros obetivos.
+uiero agradecer a mi abuelo %aco las 6partiditas de tute7 espor#dicas que han salpicado muchas de mis tardes y que
me han ayudado a evadirme en momentos de bastante agobio y tensión. 0racias abuelo por tu inter"s declaradamente
sincero por todas y cada una de mis labores profesionales.
-ambi"n quería recordar a mi padre que sólo pudo verme empezar este largo camino aunque muy probablemente se
marchó con la certeza de que intentaría recorrerlo hasta el final. Creo que debo agradecerle a "l 5o a sus genes6 una parte
importante de ese car#cter constante y de esa cabezonería que considero imprescindibles para haber afrontado estedesafío. Cualquiera que sea el rinconcito de cielo en el que est"s, (gracias pap#).
$inalmente quiero dar las gracias a las tres mueres m#s importantes en mi vida y a las que quiero dedicar esta tesis.
A mi madre que ha sido la que creo que ha aguantado m#s que nadie mis cambios de humor, ha sabido convivir con
montañas de papeles ininteligibles sobre mi escritorio y a'n así, me ha seguido animando hasta el 'ltimo momento.
A mi chica, 2eticia, por sus #nimos, por su apoyo, por haberme sabido escuchar y sobre todo, por haber tenido la
paciencia suficiente para seguir conmigo despu"s de un 'ltimo año 5o dos, o quiz# tres6 especialmente duro en el que tal
vez haya estado un :poquito; m#s volcado en mis intereses profesionales que personales.
%ara terminar quiero dar las gracias a mi abuela Consolación que en paz descanse, quien siempre mostró de formaincondicional una confianza ciega en que terminaría consiguiendo cuanto me propusiera. -al vez llevaras razón, abuela.
- 8 -
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
10/324
Prólogo
7icen que el saber no ocupa lugar. 1i el saber es sinónimo de eperiencia tal vez no debiera haber duda alguna al
respecto. 1i en cambio ese saber es refleo de la formación cultural de una persona, los límites podrían venir marcados
por su af#n de conocimiento pero tambi"n por su memoria. Estos mismos límites serían aplicables a cualquier individuo
para el que :saber; no fuera otra cosa que la capacidad para retener en su cabeza un volumen determinado de
información sin importar que "sta estuviese referida a los n'meros de la guía telefónica o a las palabras del diccionario
enciclop"dico. En cualquier caso, en el mundo empresarial, la frase se nos antoa aprovechable en uno u otro sentido.
1eg'n van pasando los días, el ordenador personal permite almacenar m#s información, m#s saber, en menos espacio.
Eisten grandes bases de datos que recogen históricos de una compañía al nivel de detalle que se desee. 1i bien eisten
restricciones impuestas en función de la memoria de los equipos, la cantidad de datos recogidos suele ser suficiente para
plantear estudios de mercado y tomar decisiones que puedan meorar la evolución del negocio.
%uede ser que este saber no eista. 1ería el caso, por eemplo, de una compañía nueva en cualquiera de los sectores
5telecomunicaciones, industria, banca, seguros, etc.6 que no tuviese ning'n dato almacenado sobre el que basar alg'n
an#lisis específico. -ambi"n podría ser ilustrativo el eemplo de una compañía que quisiera lanzar un producto nuevo y
no tuviera por tanto historia del mismo para poder conocer la respuesta que pudiera esperar tras una campaña comercial.
8n tercer caso podría venir inducido por un cambio significativo de comportamiento que eperimentara el mercado
haciendo inservible cualquier información almacenada. Es entonces cuando el saber del eperto de negocio, basado en
la eperiencia de la que habl#bamos, uega un papel determinante siendo su opinión la que terminar# conduciendo a la
toma de una decisión final.
2a situación ideal se plantea cuando se combina la eperiencia del analista en un negocio determinado con unas
circunstancias del mercado que hacen que los históricos de datos de la compañía resulten de un valor incuestionable.
El saber del eperto se fusiona con el saber almacenado en sus equipos inform#ticos y esto le permite realizar una
planificación de las acciones a emprender a corto, medio y largo plazo.
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
11/324
- :; -
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
12/324
Índice
%rólogo................................................................................................................................................. ?
@. !ntroducción....................................................................................................................................B@. Estado del arte..........................................................................................................................@.D /"todos gr#ficos............................................................................................ HFD.B.F /"todo F> Aproimación analítica de los m"todos gr#ficos............................................HHD.B.H /"todo H> Criterio de información de AGaiGe 5A!C6...................................................... HHD.B.B /"todo B> Contrastes de bondad de auste de una cópula............................................... HBD.B. /"todo > Calidad de las predicciones que proporciona una cópula...............................H
F. /etodologías para la construcción de funciones cópula................................................................H?F. /"todo de inversión................................................................................................................ H?F.D /"todos geom"tricos...............................................................................................................B@
F.D. Cópulas singulares con soporte conocido........................................................................B@F.D.D Cópulas construidas como 1uma
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
13/324
H.D.F /"todo de interpolación mediante polinomios c'bicos de Jermite................................?H.D.F. Condiciones a imponer para que la función construida por interpolación c'bicaverifique las propiedades frontera de las cópulas.................................................................KDH.D.F.D Condiciones a imponer para que la función construida por interpolación c'bicaverifique la propiedad DIcreciente de las cópulas................................................................ KF
H.D.F.D. Condición a imponer para que una superficie interpoladora de $erguson sea DI
creciente...........................................................................................................................KHH.D.F.D.D Condición a imponer para que una superficie interpoladora de Jermite sea DIcreciente...........................................................................................................................
H.D.F.F Condiciones para construir cópulas por interpolación c'bica..................................?BH.D.H Algunas observaciones sobre las cópulas interpoladoras...............................................@@
B. 1imulación de valores para las cópulas construidas por interpolación........................................ @BB. 1imulación de valores para algunas familias de cópulas [email protected] 1imulación de valores para la cópula construida por interpolación bilineal......................... @KB.F 1imulación de valores para la cópula construida por interpolación c'[email protected] 1imulación de valores para la cópula construida por interpolación mediante polinomios de
3ernstein......................................................................................................................................@?
. Empleo de funciones cópula para predecir .................................................................................... Empleo de funciones cópula como modelos de función de transferencia..............................D Empleo de funciones cópula para eplicar dependencia din#mica........................................
K. Aplicación pr#ctica> %redicción de la demanda de gas natural.................................................... ?K. !ntroducción...........................................................................................................................?K.D %redicción de la demanda de gas natural a medio plazo........................................................DD
K.D. !ntroducción al problema............................................................................................... DDK.D.D %lanteamiento de la solución..........................................................................................DFK.D.F $A1E !> Construcción de un histórico de demanda en condiciones normales detemperatura..............................................................................................................................DKK.D.H $A1E !!> Construcción de un modelo autorregresivo para hacer una predicción a medio
plazo........................................................................................................................................ HHK.D.H. !dentificación del patrón estacional semanal..........................................................HBK.D.H.D !dentificación de la variabilidad............................................................................. H?K.D.H.F !dentificación del ciclo anual de la serie................................................................ BF
K.D.H.F. 0eneración de la variable Ciclo a partir de Lavelets..................................... BHK.D.H.F.D 0eneración de la variable Ciclo a partir de splines de regresión....................B?K.D.H.F.F Comparativa entre los m"todos planteados para la generación de la variable
Ciclo...............................................................................................................................HK.D.B $A1E !!!> 1imulación del valor esperado de la demanda en situaciones climatológicasetremas..................................................................................................................................
K.D.B. 0eneración de distribuciones marginales...............................................................K@K.D.B.D 7eterminación de una cópula a trav"s del criterio de selección basado en elestadístico de %earson.........................................................................................................KK.D.B.F Construcción de cópulas que optimizan el estadístico de %earson.........................K
K.D.B.F. Construcción de una cópula por interpolación bilineal.................................. K?K.D.B.F.D Construcción de una cópula por interpolación c'bica....................................K.D.B.F.F Construcción de una cópula por interpolación mediante polinomios de3ernstein........................................................................................................................H
K.D.B.H Comparativa de resultados entre las diferentes cópulas candidatas....................... B
- :2 -
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
14/324
K.F %redicción de la demanda de gas natural a corto plazo......................................................... ?K.F. !ntroducción al problema............................................................................................... ?K.F.D %lanteamiento de la solución..........................................................................................??
K.F.D. Auste de una serie mediante un A4!/A complementado con modelos de funciónde transferencia...................................................................................................................D@K.F.D.D Auste de una serie mediante un A4!/A complementado con un algoritmo basado
en funciones cópula............................................................................................................DK
. Conclusiones.................................................................................................................................DF?
?. $uturos trabaos............................................................................................................................ DHF
A&EM Algunas familias de cópulas......................................................................................DHBA!. $amilias no param"tricas................................................................................................ DHB
A!.. $amilias de dependencia etrema........................................................................... DHB
A!..D 7emostración del lema H.D.......................................................................................DBB
A&EM< !!!> 7emostración del lema H.F..................................................................................... DBK
A&EM< !*> 7emostración del lema H.H.....................................................................................D
A&EM< *> 7emostración del lema H.B...................................................................................... DK?
A&EM< *!> 7emostración del lema H......................................................................................DF
A&EM< *!!> 7emostración del teorema H................................................................................D??
A&EM< *!!!> Contrastes de bondad de auste a una distribución dada......................................F@K
A&EM< !M> Contraste de NrusGalIOallis...................................................................................F@?
A&EM< M> An#lisis mediante Lavelets......................................................................................F
A&EM< M!> An#lisis mediante splines de regresión...................................................................FB
3ibliografía.......................................................................................................................................FD
- :3 -
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
15/324
- :4 -
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
16/324
0 Introd!cción
8na de las principales funciones de una empresa transportista de gas es diseñar un plan de operaciones a trav"s del cual
pueda garantizar la continuidad y seguridad del suministro de gas natural y la correcta coordinación entre los puntos de
acceso, los almacenamientos, el transporte y la distribución teniendo en cuenta las necesidades y características de cada
uno de sus tipos de clientes tanto dentro del #mbito industrial como del dom"stico. En nuestro país, Ena'á" es la
principal empresa transportista de gas y entre sus activos, cuenta con K.BF Gm de gasoductos de alta presión, tres
plantas de regasificación 53arcelona, Cartagena y Juelva6 y la propiedad o gestión de los almacenamientos de gas
natural. 2a gestión del plan de operaciones es una tarea muy complea que se realiza no sólo en función de los recursos
de gas disponibles sino tambi"n de la demanda prevista a abastecer y del cumplimiento de los compromisos
contractuales tanto con las empresas suministradoras como con las distribuidoras y comercializadoras.
2a aparición de las comercializadoras de gas ha tenido lugar a raíz de la reciente liberalización del mercado del gas en
España 5desde Enero de D@@F6. 1eg'n la nueva normativa, un cliente no tiene porqu" mantenerse en el mercado
regulado que se rige de acuerdo a las tarifas fiadas por el gobierno, sino que puede comprar directamente en dicho
mercado, elegir una comercializadora a la que pague una tarifa de menor coste o establecer contratos bilaterales.
El crecimiento del n'mero de comercializadoras, el incremento esperado del consumo y la capacidad limitada de la red
de gasoductos, son factores a tener en cuenta a la hora de elaborar el plan de operaciones. 4esulta por ello
imprescindible para el departamento encargado de su gestión, disponer de unas buenas herramientas de predicción de la
demanda a distintos horizontes para poder adaptarse de manera adecuada a las necesidades de suministro a corto 5@
días con detalle horario6 y medio 5IF años6 plazo. Cuanto mayor sea la bondad de las predicciones que proporcionen
estos sistemas, m#s fielmente se ceñir#n a la realidad los programas y planes de gestión citados y por tanto m#s
beneficiosos resultar#n los resultados de la operación.
Eiste un amplio abanico de metodologías matem#ticas para el tratamiento de problemas de predicción de demanda de
gas a corto y medio plazo. +ueremos observar que por lo general "stas t"cnicas son igualmente aplicables al sector
el"ctrico y por ello no debe de etrañar que la literatura que nos ha servido de consulta haga referencia indistintamente a
uno u otro sector. 2a diferencia fundamental radica en el periodo de influencia del factor meteorológico sobre la
demanda, que abarca al invierno 5calefacción el"ctrica6 y al verano 5aparatos de aire acondicionado6 en el caso el"ctrico
y sólo al invierno en el caso gasista. Esta circunstancia no afecta desde un punto de vista metodológico sino 'nicamentea la hora de definir las variables clim#ticas que participan en los modelos y es por ello que, aun cuando la eposición
que hacemos en esta tesis esta centrada en el mercado gasista, ya hemos contrastado la validez de los m"todos que
proponemos en uno y otro #mbito.
Introducci
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
17/324
0.) E*+a,o ,el ar+e
1i bien como hemos dicho los m"todos de predicción que se manean en la actualidad son aplicables a datos de
demanda referidos tanto al gas como a la electricidad, la utilización de ellos est# condicionada por el horizonte de
predicción para el que se plantea el estudio.
En el tratamiento a corto plazo se pretende obtener predicciones con detalle diario para un horizonte que suele depender
del m#imo periodo para el que se disponga de una previsión fiable de los agentes climatológicos y que habitualmente
oscila entre @ y B días. 7espu"s de haber trabaado durante m#s de tres años en problemas de predicción de demanda
a corto plazo y haber contrastado la eficacia de diversas alternativas creemos que, por las características de este tipo de
series, es la metodología (o)*+en,!n" fundamentada en el empleo de modelos ARIMA, la que proporciona unos
meores resultados 5v"ase por eemplo el estudio para la )ritish 1as =orth Western que se epone en P$!4EA1-Q6.
Estos modelos plantean a trav"s de una ecuación lineal 5aditiva en las variables6 la relación entre la demanda en uninstante de tiempo :t ;, el valor de la propia variable en instantes anteriores de tiempo 5parte A4! del modelo6 y el error
que el modelo ha podido cometer en dichos instantes 5parte /A6. Es esta capacidad para corregirse en función de los
errores de predicción m#s recientes la que los hace especialmente orientados para la predicción a corto plazo. A trav"s
de una ecuación autorregresiva el modelo reflea la tendencia, variabilidad y estacionalidad de los datos, captura
mediante un :an>lisis de intervenci
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
18/324
Con el fin de meorar los altos costes computacionales que conlleva la implementación de los sistemas difusos, algunos
autores proponen un modelo híbrido denominado r ed ne$rona d!-$"a que b#sicamente consiste en alimentar con una
base de reglas difusas a una red neuronal. En este conteto de las redes de neuronas y los sistemas difusos aplicados a la
predicción de la demanda energ"tica podemos citar por eemplo los artículos de P2=M8EQ , P/8JA!Q o
P*ACJ8&-AQ.
Cuando el n'mero de variables eplicativas crece de forma desmesurada, las posibilidades de sobreauste de los
modelos neuronales aumentan a la vez que disminuye su potencia predictiva. %ara resolver este problema eisten
t"cnicas de Inte!'en%!a Art!-!%!a como son los a'or!tmo" 'en.t!%o" o los "!"tema" e)perto", de cuya aplicación al
problema de predicción de la demanda a corto plazo podemos encontrar una breve descripción en P%E4OJ!Q.
4especto del tratamiento a medio plazo, encontramos tambi"n diferentes propuestas de modelización para la predicción
con detalle mensual o diario en función del obetivo que se persiga. Así por eemplo seg'n se cita en P/EJ4AQ, para el
tratamiento mensual acostumbran a utilizarse modeo" e%onom.tr!%o" planteados a trav"s de una relación de
ecuaciones en las que la demanda se epresa como una función de factores económicos tales como la población, el
ingreso per c#pita, el precio de los distintos medios de combustible alternativos a aqu"l que se predice, etc.
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
19/324
obtener las distribuciones de consumos diarios a partir de las distribuciones de consumo mensuales.
En esta tesis proponemos nuevos m"todos para predecir a corto y medio plazo la demanda de gas, y por etensión la
demanda el"ctrica, conugando algunas de las t"cnicas citadas con el empleo de una clase de funciones denominadas
%&p$a". 2as posibilidades de este tipo de funciones en el #mbito de la simulación las hacen muy atractivas para abordar problemas de predicción a medio plazo y hemos considerado que es "sta una razón de peso para considerar la
metodología que proponemos como una alternativa m#s de predicción a dicho horizonte, sin intención de establecer una
comparativa rigurosa con los resultados a los que puedan conducir algunas de las t"cnicas que acabamos de enumerar.
En cuanto al corto plazo se refiere, las funciones cópula suelen ser utilizadas para predecir series de car#cter financiero
suetos a una fuerte volatilidad que en el conteto de la demanda energ"tica acostumbra a traducirse en la predicción de
los precios del gas ySo la electricidad 5v"ase por eemplo PNE--2E4Q6. %or ello, dado que su empleo no parece estar tan
orientado a la precisión que eige la predicción puntual de la demanda energ"tica para un día determinado y teniendo en
cuenta la amplia variedad de m"todos que de antemano eiste para tratar el problema, hemos estimado oportuno
contrastar con alguno de ellos, los resultados a los que conduce un algoritmo que proponemos basado en su utilización.
7e esta forma pretendemos hacernos una idea de las posibilidades que pueden llegar a ofrecer estas funciones en un
estudio predictivo a corto plazo y sentar las bases de futuras líneas de investigación. En concreto, hemos decidido
comparar los resultados conseguidos con dicho algoritmo con aquellos proporcionados por una solución de eficacia
contrastada en el tratamiento de este tipo de series. 2a solución a la que hacemos referencia y que tambi"n hemos
mencionado en este capítulo consiste en aplicar la metodología 3oIenGins basada en el empleo de modelos A4!/A
complementado con modelos de función de transferencia para reflear el efecto de las variables de temperatura.
0.2 Ob-e+ivo*
El obetivo fundamental que persigue esta tesis es definir una metodología que automatice el proceso que conlleva
realizar una predicción diaria a medio plazo 5ID años6 para una serie de demanda energ"tica y, a trav"s de ella, conocer
el :pico; que se puede presentar durante dicho horizonte. A tal fin hemos utilizado un histórico de datos que reflea la
demanda de gas natural en /adrid así como las temperaturas m#imas y mínimas registradas en algunos observatorios
de la provincia. Estos datos han sido proporcionados por el Departamento de Aná!"!" # S!m$a%!&n de la compañía
Enag#s.
El m"todo que proponemos sugiere como punto de partida realizar una predicción diaria de la demanda para los dos
próimos años en condiciones normales de temperatura siendo así posible conocer, bao esta hipótesis de normalidad, el
valor m#imo que se puede esperar durante un periodo concreto 5un invierno, un año, etc.6. Este planteamiento inicial
sigue en cierta medida las directrices marcadas por autores como En'e4 Gran'er4 M!t%3em # Ramanat3an 5?K?6 o
Stanton # G$pta 5?@6 quienes consideran que una forma adecuada de abordar esta problem#tica es estimar la
demanda t de un día gen"rico :t;, y posteriormente considerar el pico esperado para ella como el m>@t T t U .
%ara hacer esta predicción inicial, establecemos qu" se entiende por condiciones clim#ticas normales y construimos a
Introducci
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
20/324
partir de un histórico diario de demanda de gas, aqu"l que hipot"ticamente se hubiera presentado en dichas condiciones.
Así, a partir de un nuevo histórico cuyo comportamiento est# aislado de la influencia meteorológica, realizamos en una
segunda fase, una predicción a dos años vista a trav"s de un modelo autorregresivo que incorpora entre sus variables
eplicativas el patrón cíclico de la serie, la etrapolación del cual permite plantear dicha predicción. %ara la detección
de este patrón cíclico hemos utilizado t"cnicas de suavizado de curvas como son el an#lisis mediante 5a1eet" y los
"p!ne" de re're"!&n.
En una tercera fase, aplicamos la Teor6a de C&p$a" para analizar la relación de dependencia eistente entre las
desviaciones de los datos reales de demanda con respecto a los datos construidos en condiciones normales y las
desviaciones entre los valores reales de temperatura y los supuestamente normales y, a partir de dicho an#lisis,
simulamos el comportamiento que cabría esperar para la demanda en determinados escenarios t"rmicos. Esta es una de
las características m#s innovadora que aporta esta metodología, el empleo de funciones cópula para analizar a fondo la
relación demandaStemperatura, cuantificar la respuesta del consumo ante situaciones climatológicas especialmente
adversas y dar un resultado basado, no en un 'nico valor esperado alrededor del cual se construye un intervalo de
confianza sim"trico, sino en toda una distribución de valores sueta a posibles asimetrías y apuntamientos que permita
valorar la probabilidad de que la demanda alcance ciertas cotas y evaluar el riesgo asociado a la toma de determinadas
decisiones. Es precisamente esta propuesta de utilizar esta teoría en el #mbito de la predicción de la demanda energ"tica
la que nos ha llevado a profundizar en las posibilidades que puede ofrecer y la que, en cierto modo, nos ha motivado a
definir a esta tesis como una tesis sobre cópulas.
+ueremos hacer hincapi" en que, en este conteto de la predicción del pico de demanda, no es tan importante conocer
con eactitud el valor m#imo esperado para la demanda como la distribución de valores esperados que permita evaluar
la probabilidad de que "ste se presente y el riesgo que puede conllevar.
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
21/324
general cuando se trabaa con funciones cópula es determinar aquella familia que meor se auste a la muestra de datos
dada e identifique de forma adecuada la relación de dependencia en ella implícita. Jemos utilizado un criterio ya
eistente, basado en someter a un contraste de bondad de auste a una relación de cópulas candidatas 5v"ase P7
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
22/324
0. La +e*i*
Esta tesis se encuadra dentro de los obetivos que persigue el programa de doctorado del Departamento de E"tad6"t!%a
e In1e"t!'a%!&n Operat!1a de a Fa%$tad de Matemát!%a" de a Un!1er"!dad Comp$ten"e de Madr!d, cuya
finalidad es potenciar la investigación de metodologías y resultados teóricos orientados a dar solución a un problema
pr#ctico.
2a eposición que realizamos est# estructurada en dos grandes bloques, uno puramente teórico en el que eponemos
algunas nociones de la teoría de cópulas que consideramos b#sicas para el meor entendimiento del m"todo de
construcción de cópulas que planteamos y otro pr#ctico en el que abordamos la predicción de la demanda de gas a corto
y medio plazo mediante el empleo de este tipo de funciones.
El bloque teórico se compone de un total de capítulos de los cuales damos a continuación una breve descripción>
– En el primero de los capítulos, se hace una presentación de las funciones cópula, d#ndose su definición,
haci"ndose mención de los diferentes tipos y familias que eisten y cit#ndose las diferentes versiones del
teorema de 1Glar, resultado que supone uno de los pilares sobre el cual se construye esta teoría.
– El segundo capítulo enumera diversas t"cnicas eistentes que permiten seleccionar la familia de cópulas que
meor se adapta a la relación de las variables que intervienen en un an#lisis y dentro de la familia seleccionada
aqu"l miembro que se considera m#s adecuado para ello.
– El tercer capítulo hace un repaso de los m"todos eistentes para la construcción de funciones cópula tanto
desde la perspectiva geom"trica como desde la puramente analítica y, en conunción con el capítulo segundo,
sirve de introducción al siguiente que constituye la aportación teórica fundamental de esta tesis.
– En el capítulo cuarto se presenta una metodología para la generación de funciones cópula alternativa a las
epuestas en el anterior. 1e basa en la interpolación polinómica del dominio de definición de aquella función
subcópula que optimiza el valor del estadístico de %earson. 1eg'n se eplica en el capítulo segundo, este
estadístico es utilizado por algunos autores como criterio de evaluación de la bondad del auste de las
funciones cópula a los datos.
%ara mostrar cómo la construcción de cópulas a partir de subcópulas se complica conforme crece el orden de
los polinomios interpoladores comparamos, a modo de eemplo, la interpolación bilineal 5realizada mediante
polinomios de orden 6 con la c'bica, llevada a cabo a trav"s de po!nom!o" de 7erm!te. En este 'ltimo caso,
se presenta un amplio desarrollo, a raíz del cual se obtienen restricciones a imponer sobre dichos polinomios
para que el resultado de la interpolación sea una función cópula. Adem#s, se presenta otro m"todo de
Introducci
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
23/324
aproimación mediante po!nom!o" de (ern"te!n el cual conduce a superficies que, si bien no interpolan
eactamente el dominio de definición de la subcópula de partida, dan lugar a cópulas de aspecto m#s suave y
apropiado para ser utilizadas con fines predictivos.
– El quinto capítulo eplica la utilidad de las funciones cópula para realizar predicciones a medio plazo. Cuando
el horizonte de predicción se prolonga, es difícil disponer de un valor fiable para todos y cada uno de los
agentes eplicativos que intervienen en el sistema. En tales circunstancias, el analista acostumbra a plantear
diferentes escenarios configurados por hipot"ticos valores de estos factores y, de acuerdo a "stos, realiza una
simulación de la evolución del sistema. Eplicaremos cómo la determinación de una función cópula que se
auste bien a los datos permite obtener una buena representación de la función de densidad de la variable a
predecir condicionada a las eplicativas 5densidad cópula condicionada6. 2a simulación de la evolución de
nuestro sistema se puede establecer a partir de la simulación de valores de la cópula condicionada.
– $inalmente el seto capítulo detalla una posible forma de aplicar este tipo de funciones para realizar
predicciones a corto plazo dada una serie temporal. 1e argumentan los posibles problemas que pueden surgir
con el empleo de este tipo de funciones cuando las variables sobre las que se definen presentan alg'n tipo de
dependencia temporal y la posibilidad de utilizarlas como m"todo alternativo al empleo de modelos de función
de transferencia para reflear la influencia de una variable eplicativa en aquella que se desea predecir.
%or otra parte, el bloque pr#ctico se compone de un 'nico capítulo 5el s"ptimo6 que consta de dos apartados orientados
respectivamente a la utilización de las funciones cópula para la predicción a corto y a medio plazo>
– El primero de los apartados trata la predicción a medio plazo 5entre o D años6 con detalle diario. %ara una
compañía del sector gasista el conocimiento del :pico; diario que puede esperarse para el invierno del año
siguiente le permite evaluar si la capacidad del gasoducto es suficiente para soportar la demanda de una
determinada población y, en función de ello, plantear una posible epansión de su infraestructura.
1i bien en esta tesis analizamos como hemos dicho, una serie de demanda de gas, la metodología seríaigualmente aplicable a una de consumo el"ctrico. %ara una compañía de este sector, el conocimiento del :pico;
diario de demanda le permite realizar planes para que sus sistemas est"n preparados ante posibles sobrecargas
de la red. En las provincias del norte peninsular, este valor punta suele darse en invierno como resultado de una
ola de frío que provoca un efecto de saturación de los sistemas de calefacción el"ctrica. En la zona sur, el
problema est# m#s asociado a la estación del verano derivado de los aires c#lidos procedentes del 1#hara
traducidos en un preocupante incremento de la venta de aparatos de aire acondicionado.
El m"todo que se detalla permite, en una primera fase, la obtención de un patrón de comportamiento diario de
la demanda a dos años vista en condiciones normales de temperatura 5patrón clim#tico6. En una fase posterior,
se describe cómo aislar el histórico de datos de demanda del efecto clim#tico para llevar a cabo la predicción a
Introducci
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
24/324
tan largo horizonte 5de FB a DVFB días6 a partir de un modelo autorregresivo y de las componentes de baa
frecuencia resultantes de la descomposición de la serie de demanda mediante funciones Lavelets o splines de
regresión. En una fase final, las funciones cópula van a permitir simular el crecimiento o decrecimiento
esperado de la demanda supuesto un incremento del valor de los agentes climatológicos respecto del patrón
est#ndar establecido. 2a relación entre la demanda y la temperatura no es lineal y adem#s presenta un
comportamiento difícil de capturar en situaciones etremas. Eisten familias de cópulas que hacen "nfasis en
la relación entre sucesos :cola; y que, como veremos, se austan bastante bien a este tipo de situaciones.
-ambi"n veremos que las cópulas obtenidas por la metodología de construcción que se describe en el capítulo
cuarto del bloque teórico, pueden ser una buena aproimación a estas familias.
– El segundo de los apartados trata la predicción a corto plazo de demanda de gas.
2os programas de una empresa responsable de la gestión de las redes de transporte de gas se establecen enfunción de los recursos disponibles 5yacimientos6, la demanda prevista que debe ser abastecida, el
cumplimiento de compromisos contractuales con empresas suministradoras y comercializadoras, etc.
2a dificultad para mantener la calidad del gas 5presión6 dentro del gasoducto ustifica la necesidad de que la
predicción no eceda en demasía el dato real de demanda> el gas calienta menos y, en consecuencia se necesita
m#s, con la consiguiente p"rdida económica para la compañía. 1i por el contrario el dato predicho se sit'a
significativamente por debao del real, los clientes industriales podrían ver reducidas sus tasas de producción y
los dom"sticos plantearse el empleo de otro combustible como forma de calefacción para su hogar.
2as principales dificultades de modelización surgen a la hora de realizar una predicción condicionada a unas
circunstancias clim#ticas especialmente desfavorables, m#s a'n cuando "stas se presentan de manera brusca e
inesperada 5olas de frío en /arzo6. Como ya hemos comentado, entre las diferentes t"cnicas que pueden ser
contrastadas, los modelos A4!/A con funciones de transferencia para reflear el efecto de las temperaturas
constituyen tal vez la alternativa que proporciona unos meores resultados. 2a idea que proponemos en su
lugar, sugerida como veremos por la manera de proceder en el auste a medio plazo, consiste en reemplazar las
funciones de transferencia por funciones cópula que cuantifiquen de manera diferente la relación de
dependencia en condiciones etremas 5pico de demanda W ola de frío6.
2os resultados de este bloque pr#ctico han sido obtenidos a partir de una relación de programas implementados
fundamentalmente con el softLare '*' dada las buenas y contrastadas referencias que de "l encontramos para
el desarrollo de proyectos de !ata Minin/ . En concreto, los módulos utilizados de esta herramienta han sido>
– '*'A)*'$ .I que soporta el lenguae de programación de la herramienta.
– '*'A1&*%# .I para todo lo referido al aspecto visual y de representación gr#fica de resultados.
Introducci
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
25/324
– '*'A'T*T .I para la obtención de estadísticas b#sicas, realización de contrastes de hipótesis y
planteamiento de modelos de regresión.
– '*'A$T' .I para la implementación de modelos A4!/A.
– '*'AB&.I para la obtención de soluciones a problemas de programación matem#tica 5lineal y no
lineal, continua y entera6.
-ambi"n se ha utilizado el paquete estadístico '%C'AW*D$$T' para la construcción de funciones
Lavelets. 1i bien "stas pueden tambi"n ser empleadas disponiendo del correspondiente módulo !/2 de '*' ,
hemos considerado que es el softLare de '%C' el que ofrece un mayor abanico de opciones asociadas a estetipo de funciones ampliando de manera notable sus posibilidades de uso. 7e todas formas, hemos programado
con '*'A)*'$ otra t"cnica de suavizado de curvas, alternativa a las funciones Lavelets, basada en splines,
con la idea de que la herramienta para el tratamiento de series de demanda energ"tica que hemos desarrollado
estuviera totalmente integrada en '*' .
En lo que a las cópulas concierne, no hemos encontrado ning'n procedimiento de '*' que permita gran
versatilidad a la hora de realizar an#lisis basados en esta teoría. -an sólo el módulo &I'( !IM$='IB=' ofrece
algunas posibilidades. %or ello, y aun cuando '%C' tiene alguna solución orientada al tratamiento con
cópulas 5'EFI=M$T&I+' 6, hemos considerado de gran utilidad, no sólo de cara a la integración con laherramienta mencionada, sino adem#s para futuros trabaos, implementar en '*'A)*'$ una relación de
macros específicas que permitan trabaar con ellas.
En el capítulo octavo de la tesis presentamos las principales conclusiones teóricas y pr#cticas a las que hemos llegado y
en el noveno, las próimas líneas de investigación que pretendemos seguir en el futuro.
$inalmente se incluye una relación de Aneos en los cuales se pueden consultar las demostraciones rigurosas de los
lemas y teoremas que proponemos en el bloque teórico y que constituyen la aportación teórica que hacemos al campo
de la teoría de cópulas.
-ambi"n se pueden consultar en este capítulo de aneos las epresiones correspondientes a las familias de cópulas m#s
populares, así como una introducción a algunos de los m"todos matem#ticos utilizados en el desarrollo pr#ctico como
son las Lavelets o los splines de regresión. %retendemos con ello dar una idea que facilite el meor entendimiento de
esta eposición.
Introducci
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
26/324
" #!nciones có$!la
).) In+ro,/i1n
8n modelo matem#tico no es m#s que una forma de intentar eplicar la realidad, una forma de medir la relación que
eiste entre las variables que definen un sistema. Cuando el obetivo es claramente predictivo, acostumbra a plasmarse
en una relación de ecuaciones param"tricas que plantean una hipótesis sobre el funcionamiento de dicha realidad. Cada
par#metro de cada ecuación tiene por finalidad cuantificar esa supuesta relación. 2ógicamente es imposible predecir el
futuro con eactitud y es por ello que una parte del modelo est" reservada al error que asume que cometer#, un t"rmino
que se considera desconocido.
Eisten muchos tipos de modelos que pueden ser utilizados para predecir, algunos lineales y param"tricos como los
modeo" de re're"!&n o los A4!/A, otros no param"tricos como los ár2oe" de de%!"!&n, algunos no lineales como las
redes neuronales, etc. -odos ellos tratan de detectar la relación de dependencia que liga a las variables del sistema y
adem#s comparten un aspecto com'n que es la necesidad de disponer de un histórico de datos sobre el que estudiar
dicha relación. Cuanto mayor sea su volumen y m#s fiable su contenido, de mayor calidad ser#n los resultados que el
modelo proporcione.
En el #mbito matem#tico, predecir consiste en conocer el comportamiento futuro de un sistema que puede ser m#s o
menos compleo. En su versión m#s simplificada, predecir es conocer el valor futuro que se espera que tome unavariable en función de su relación con otra u otras variables. 1i el comportamiento de la variable a predecir est#
condicionado por su propia historia como ocurre cuando se plantean modelos diseñados para el tratamiento de series
temporales, la relación se establecer# igualmente entre dos variables> el presente y el pasado de la misma.
Jemos empleado con cierta familiaridad dos t"rminos que tienen un equivalente matem#tico directo>
– 2a :esperana; matem#tica de una variable identifica el valor que se :e"pera8 que tome la variable.
– El t"rmino :%ond!%!onado8 presupone que eiste un conocimiento del valor de las variables que van a
intervenir como eplicativas en el modelo.
2a conunción de ambos conceptos da lugar al de :esperana condicionada7 de una variable que viene a ser el valor
que se espera que tome la variable condicionado a que se tiene un conocimiento del valor de otras que act'an como
eplicativas. El c#lculo de la esperanza condicionada de una variable al valor : @7 de otra 5u otras6 G se realiza a partir
de la distribución condicionada ∣ G = @ que es una función que permite conocer como se distribuyen los valores
de la variable cuando se sabe que la variable G toma el valor : @7. El conocimiento de esta distribución permite
Funciones c
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
27/324
localizar cu#l es el valor de que se presenta m#s habitualmente cuando G vale : @7, viendo cu#l es el valor 5o valores6
de alrededor del cual la distribución es m#s densa 5tiene mayor masa o densidad6. Xste puede ser por eemplo la
media, la mediana o la moda de la distribución y puede ser propuesto como valor esperado o predicción. Adem#s, la
distribución informa tambi"n del nivel de concentración alrededor del valor que damos como predicción, lo cual
permite proporcionar una idea de su volatilidad 5o variabilidad6. Esta medida de la dispersión esperada para la
predicción resulta de gran utilidad para analizar el riesgo derivado de la toma de una posible decisión fundamentada en
ella. &uevamente se repite el t"rmino matem#tico :esperado; y aparece uno nuevo, :dispersi
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
28/324
o menos sencillo dado que la propia representación de los valores de la variable nos puede sugerir el empleo de alguna
de las muchas distribuciones conocidas que eisten 5%oisson, 8niforme, &ormal, Eponencial, etc.6 y, aun en el peor de
los casos, siempre podemos optar por utilizar una distribución empírica.
/ucho m#s complicado resultaría proponer una epresión para la distribución conunta, entre otras cosas porque en elladebe venir representada implícitamente la relación de dependencia eistente entre las variables G e . 2a solución a este
problema no es inmediata como veremos a continuación.
1upongamos un caso muy sencillo en el que tenemos dos variables G e con sus respectivas funciones de distribución
marginales F G "@ y 1 "y. Entonces, eisten infinitas funciones de distribución bivariantes conuntas # G "@,y cuyas
marginales son F G "@ y 1 "y. /#s aun, podemos encontrarnos con pares de variables 5 G : , :6 y 5 G 2 , 26 que responden a
estructuras de dependencia diferentes aun cuando las G i y las i presentan la misma distribución y siendo adem#s el
coeficiente de correlación lineal entre G : e : el mismo que entre G 2 e 2. Es decir, pueden eistir dos funciones de
distribución conuntas y distintas # : y # 2 asociadas a 5 G, 6, que eplicarían respectivamente y de forma diferente la
relación de dependencia entre ellas.
&uestra intención es encontrar la función de distribución conunta # que meor reflee la relación entre G e Y aqu"lla
que nos garantice que la distribución condicionada que construyamos represente fielmente esa relación y pueda ser
utilizada por el analista con fines predictivos. Es en este conteto en el que aparecen en ?B? unas funciones bautizadas
por el matem#tico A2e S,ar como %&p$a", funciones que, como el autor define, unen 5o copulan6 funciones de
distribución multivariantes a sus marginales unidimensionales de igual forma que el t"rmino gramatical :cópula; sirve
de enlace entre el sueto y el predicado de una oración. Es el concepto lingRístico el que sirve de inspiración a 1Glar
para dar nombre a esta clase de funciones. Citaremos algunos referentes históricos que han sido etraídos del capítulo
de P&E21E&Q, al cual invitamos al lector a consultar para conocer m#s en detalle algunos de los hitos m#s significativos
en la historia de esta teoría.
+uiz# los precedentes m#s remotos de la teoría los encontramos en ?H@I?H, cuando 9a""!# 7oe--d!n' define una
clase de distribuciones bivariantes estandarizadas cuyo soporte est# contenido en el cuadrado PISD, SDQD y cuyas
marginales son uniformes sobre PISD, SDQ. 1eg'n S%35e!:er 5??6, si Joeffding hubiese utilizado como dominio de
definición el intervalo P@,Q en vez de PISD, SDQ, hubiese sido "l quien hubiese descubierto las cópulas.
1in embargo, el antecedente m#s claro al desarrollo de 1Glar lo encontramos en el trabao de $erón en ?B. $erón
realizó un estudio sobre distribuciones tridimensionales en el que definía unas funciones auiliares de dominio el
cuadrado unidad que le permitieron enlazar dichas distribuciones con sus marginales univariantes. 1Glar observa, seg'n
nos comenta en uno de sus artículos m#s recientes que data de ??, que funciones con características similares a las de
$erón podían ser definidas para dimensiones mayores o iguales que D, y que de igual manera servirían de enlace entre
las distribuciones conuntas y sus marginales univariantes. A partir de esta apreciación, 1Glar establece el teorema que
lleva su nombre y que constituye el pilar fundamental de una teoría que ha despertado a partir de la d"cada de los
noventa y que, dada su :corta; edad, mantiene hoy día muchas líneas de investigación abiertas.
Funciones c
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
29/324
).2 Deinii1n
2a mayor parte de los artículos que podemos encontrar sobre cópulas comienzan dando su definición sin hacer alusión aotra clase de funciones a partir de la cual podría definirse en una 'nica frase> las cópulas son subcópulas cuyo dominio
es el cuadrado unidad. Esta forma de presentarlas que hace Ne"en 5v"ase capítulo D de P&E21E&Q6 nos parece la m#s
apropiada dado que la metodología que constituye la base teórica de esta tesis se fundamenta en la posibilidad de
etender cualquier subcópula a una cópula 5v"ase el lema D.F.B de P&E21E&Q6.
1in embargo, de igual manera que desconoceríamos las tareas de un director si lo 'nico que supi"ramos de "l es que en
su ausencia es el subdirector quien las desempeña, y a pesar de las ventaas de espacio que ofrece la definición
propuesta, parece que estamos obligados a eplicar las propiedades que caracterizan a una función subcópula.
De-!n!%!&n 0;0;* 8na
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
30/324
). Teorema ,e S3lar
/uchas de las propiedades de las cópulas y las subcópulas son comunes. 1in embargo, el hecho de que se diferencien
en el dominio de definición, resulta determinante como pone de manifiesto el Teorema de S,ar 5?B?6, que
constituye el pilar fundamental y una referencia obligada en la teoría de cópulas pues establece la relación que eiste
ente las distribuciones multivariantes y sus marginales univariantes a trav"s de un cópula.
Teorema 1.1.- Teorema de Sklar
6'ean G e variales aleatorias con funciones de distriuci
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
31/324
En el caso que nos ocupa, φ=$M es monótona creciente por ser función de distribución.
= @ = F G @ ⇒ −A = F G
−A y + O =+ G = F G + G =@,A
El soporte transformado es el intervalo abierto 5@,6 dado que obviamente
F G minT @∣ @∈+ G U= F G −∞=@ y F G ma@T @∣ @∈+ G U= F G ∞=A
En consecuencia, podemos aplicar el resultado y establecer que>
0 O = f G F G −A ∗∣
∂ F G −A
∂ ∣∗ I @,A
7ado que F H G @ = f G @ ⇒ F H G F G −A = f G F G
−A , la epresión anterior es igual a>
0 O = F H G F G −A ∗∣
∂ F G −A
∂ ∣∗ I @,A =
d F G F G −A
d ∗ I @,A =
d
d ∗ I @,A = I @,A que es la
función de densidad de una uniforme en el intervalo 5@,6
En consecuencia podemos concluir que F G G =C Zd
C @,A y 1 =D Zd
C @,A y que la relación que
establece el teorema de 1Glar entre las marginales y la conunta a trav"s de la cópula + es # G @ , y=+ F G @ ,1 y=+ u , v ∀ @ , y∈ ℝ=[−∞ ,∞] .
Estos resultados ayudan a entender meor la definición de las cópulas que se presenta en P/A--E!1Q 5definición D.D6.
De-!n!%!&n 0;=;* 8na %&p$a es una función de distribución multivariante F de variables aleatorias G : ,G 2 ,...,G n cuyas
distribuciones marginales son uniformes est#ndar, es decir, G i~ F i ∀i=A,D ,... ,n
Como se puede leer en P%A--;* 2as derivadas parciales respecto de C y D , que en virtud de la monotonía de + eisten para casi todo
:u7 y :v7 respectivamente 5salvo conunto de medidas Le2e"'$e nula6, definen las denominadas %&p$a"
%ond!%!onada" asociadas a + y son>
7ado :u7 fio, la cópula condicionada a :u7 es la función de D , v + Au , v =+ v∣u =∂ + ∂ u
u , v 5.?6
7ado :v7 fio, la cópula condicionada a :v7 es la función de C , u + D u , v =+ u∣v =∂ +
∂ v u , v 5.@6
1e puede demostrar que estas funciones así definidas no sólo eisten, sino que adem#s son no decrecientes para casi
todo punto de P;,:Q 5v"ase el teorema D.K.K de P&E21E&Q6.
2a consecuencia directa de la adaptación del teorema de 1Glar para distribuciones condicionadas continuas es que las
distribuciones condicionadas de ∣ G = @ y G ∣ = y vienen dadas, respectivamente, por
# / G y=+ A F @ ,1 y 5.6
# G / @=+ D F @ ,1 y 5.D6
pues por eemplo>
Funciones c
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
32/324
∂+ ∂ u
u , v =limh @
+ u , v −+ u−h , v + u , ∞−+ u−h ,∞
Zmar/.uniformes limh@
+ F G @ , 1 y −+ F G @ −h ,1 y
F C u − F C u−h Z
'0lar
limh @
# @ , y− # @−h , y
h= # y∣ @ siendo C [ d C @,A y F C su F.!
Esta relación es para nosotros de gran importancia dado que la predicción de una variable a partir del conocimiento de
otra variable G la plantearemos a partir de la simulación de valores de la distribución condicionada ∣ G = @
mediante el m.todo de a tran"-ormada !n1er"a 5v"ase el apartado D.F de P%A4*A2Q6, siendo para ello necesario
disponer de su función de distribución #"yR@ que, como vemos, puede ser aproimada mediante una función cópula.
$inalmente, cabe hablar de función de densidad conunta asociada a las variables C y D que viene a denominarse como
densidad cópula y cuya eistencia est# igualmente garantizada en función del citado teorema D.K.K que encontramos en
P&E21E&Q.
De-!n!%!&n 0;?;* 1e define la den"!dad %&p$a condicionada asociada a una cópula + como>
+ AD u , v = ∂ + ∂ u ∂ v u , v 5.F6
%odemos encontrar en P%A--
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
33/324
El teorema emplea una función denominada cópula condicional, cuya definición tambi"n se presenta en P%A--
De-!n!%!&n 0;@;* 1e define una
. + t u,@∣ F t −A=@ + t @,v∣ F t − A=@ ∀u , v∈[@,A] 5.6
D. + t u,A∣ F t −A=u + t A,v∣ F t − A=v ∀u ,v∈[@,A] 5.K6
F. D + t [uA, uD] @ [ vA, v D]∣ F t −A=+ t uD, v D∣ F t − A−+ t uD, vA∣ F t −A−+ t uA, v D∣ F t −A+ t uA, vA∣ F t −A@
∀uA, uD, vA, vD t.K. uAuD, vAvD 5.6
En cualquiera de sus versiones, el resultado pone de manifiesto que dada una cópula + , y dos funciones de distribución
F G y 1 asociadas respectivamente a dos variables G e , es posible construir una función de distribución conunta # G
para la bidimensional 5 G, 6, que tiene por funciones de distribución marginales a F G y 1 .8na propiedad muy atractiva de las funciones cópula es su independencia con respecto a las unidades en las que son
medidas las variables G e . Así, si por eemplo φ y ψ son dos transformaciones crecientes y no lineales, entonces la
cópula asociada al par G , es la misma que la asociada al par G , , invarianza que no se mantiene
para el coeficiente de correlación.
Jan sido muchos los autores que han propuesto funciones cópula orientadas a reflear uno o varios aspectos
característicos de la relación eistente entre las variables a analizar. Cada una de ellas proporciona una función #
distinta cuando se aplica al par "F G "@,1 "y. El problema que inevitablemente surge es encontrar la cópula + que
permita la obtención de la distribución conunta # G , que meor eplique el grado de vinculación eistente entre G e .
).4 Ca5ai,a, ,e la* /nione* 15/la 5ara rele-ar relaione* ,e ,e5en,enia
2a selección de una u otra función cópula + suele estar condicionada por la forma en que "sta establece la relación de
dependencia entre las variables C y D , relación que es cuantificable de muchas formas.
Así por eemplo, el %oe-!%!ente de %orrea%!&n ρ "G, 5que se mueve entre I y 6 nos proporciona un indicador con el
que valorar la dependencia lineal que eiste entre G e . Cuanto m#s próimo a est" en valor absoluto, mayor es la
relación lineal que vincula a las variables. Adem#s, el signo de este coeficiente nos informa del :sentido; de la relación>si es positivo, G crece conforme crece , mientras que si es negativo, una y otra variable se mueven, de forma lineal, en
sentido opuesto. El hecho de que ρ "G, valga @ es representativo de ausencia de relación lineal entre G e , lo cual no
quiere decir que no pueda eistir alg'n otro tipo de relación 5no lineal6.
Eisten tambi"n las denominadas med!da" de a"o%!a%!&n8, algunas tan populares como la Ta$ de Benda y el
%oe-!%!ente de %orrea%!&n de Spearman, que cuantifican relaciones no necesariamente lineales, sino que se utilizan
directamente como funciones de evaluación del contraste de independencia>
# @J F G @ , y = F G @ F y G e indedendientes vs # AJ F G @ , y ≠ F G @ F y .
Funciones c
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
34/324
Estas medidas, se mueven tambi"n entre I y . Cuando toman alguno de estos valores etremos, reflean
respectivamente una relación de dependencia negativa o positiva :perfecta;. Conforme se alea de ellos, la medida es
sinónimo de falta de dependencia entre las variables. En t"rminos coloquiales, vienen a determinar cómo se relacionan
los valores :grandes; y :pequeños; de la variable aleatoria G con los de la variable .
El capítulo B de P&E21E&Q analiza en profundidad las diferentes vías en las que las cópulas pueden ser utilizadas paraestudiar la dependencia entre variables. Entre los resultados m#s importantes, destacamos aqu"llos que ponen de
manifiesto la relación entre una función cópula austada a las muestras asociadas a un par de variables C y D y el valor
muestral de sus medidas de asociación 5teoremas B..F y B..6.
Teorema 1.&.- ela!i$n entre una !$pula y la Tau de (endall
6'ean G e variales aleatorias continuas cuya c
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
35/324
"%" Ti$os de có$!las en &!nción de s! so$orte
1eg'n se presenta en P&E21E&Q 5epresión D.H.6 , toda cópula + se puede descomponer como
+ u , v = *+ u , v ' + u , v 5.D6
siendo *+ u , v =∫@
u
∫@
v
∂D
∂ s ∂ t + s , t dsdt la parte absolutamente continua de la cópula y ' + "u,v la parte singular.
Así, podemos hacer una primera clasificación en>
– C&p$a" "!n'$are";* aqu"llas que no tienen parte absolutamente continua,
∫@
u
∫@
v
∂D
∂ s∂ t + s , t dsdt =@⇒
∂D + s , t ∂ s∂ t
=@ para casi todo s , t ∈ I D . 1e trata de cópulas cuyo soporte
son puntos o rectas.
1on eemplos de este tipo de cópulas las populares cotas inferior y superior de Fr.%3et*7oe--d!n' dadas
respectivamente por
W u , v =ma@ @, uv−A 5.DD6
M u , v =min u , v 5.DF6.
2a importancia de estas cópulas es que proporcionan una acotación para cualquier otra función cópula
verific#ndose la siguiente relación W u , v ≤+ u , v ≤ M u , v ∀c
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
36/324
– C&p$a" a2"o$tamente %ont!n$a";* aqu"llas que no tienen parte singular, es decir, tales que ' + u ,v=@ .
8n eemplo de este tipo de cópulas es la cópula producto
u , v =u∗v 5.DB6
A trav"s de ella queda caracterizada la independencia entre las variables G e . 3asta observar que
+ A u , v=+ v∣u=v , es decir, la cópula condicionada a un valor :u7 es independiente de dicho valor 5y de
igual manera + Du ,v=+ u∣v=u 6.
El hecho de que G e sean independientes implica que el valor de cualquiera de las medidas de asociación
citadas 55.?6 o 5.D@66 sea @. Así por eemplo, para la correlación rango de 1pearman se puede comprobar
que> G =AD∬ I
D
+ u , v dudv−F=AD∫@
A
∫@
A
uvdudv−F=AD∫@
A
v∗u
D
D Q@
Adv−F=AD∫
@
Av
D=AD
vD
H Q@
A−F=@
– C&p$a" m!)ta";* aqu"llas con parte singular ' + u ,v≠@ y parte absolutamente continua *+ u ,v≠@ ,
no constituyendo ninguna de estas partes una cópula por sí misma por no tener marginales uniformes. 2a
presencia de una componente singular hace que estas cópulas sean de mayor utilidad cuando las marginales
univariantes se suponen discretas.
Alg'n eemplo es la familia de C$adra"*A$'. 5v"ase 5A!.FF66 que responde a la epresión>
+ ! u , v =P minT u , v U Q!∗P u∗v QA−! con @≤!≤A 5.D6
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
37/324
7entro de uno y otro grupo, gozan de popularidad la clase de las %&p$a" ar$!med!ana" caracterizada por la facilidad
con que pueden ser construidas y por la gran variedad de estructuras de dependencia que permiten reproducir. Este
grupo de cópulas ser# comentado en el siguiente apartado.
"%* Ti$os de có$!las en &!nción de la relación de de$endencia +!e son ca$aces de re&le,ar
2as cópulas tambi"n pueden ser clasificadas en función del tipo de relación que permiten reflear. A este respecto,
citamos algunas de las clases m#s características y frecuentemente utilizadas>
– C&p$a" de dependen%!a e)trema;* se caracterizan, como su propio nombre indica, por capturar una relación
de dependencia etrema entre las variables> dependencia positiva perfecta 5cópula M 6, dependencia negativa
perfecta 5cópula W 6 o independencia (cópula Π ).
– C&p$a" e6pt!%a";* se definen como las cópulas asociadas a las distribuciones elípticas. 1u rasgo m#s
característico es que representan relaciones de dependencia sim"tricas sin importar que se analice la cola
izquierda o derecha de las distribuciones implicadas. &ormalmente no se utilizan para an#lisis financieros y de
compañías aseguradoras en las que surgen asimetrías derivadas del hecho de que grandes p"rdidas suelen ir
acompañadas de grandes ganancias.
2os eemplos m#s populares son la cópula 'a$""!ana 5v"ase 5A!.B6 en el Aneo !6, la t*%&p$a o cópula de la t
de St$dent 5v"ase 5A!.H@66 y, como caso particular de esta 'ltima, la cópula de Ca$%3# 5v"ase 5A!.66. 2a
principal diferencia entre ellas radica en las posibilidades que presentan de cara a buscar asociaciones entrefenómenos etremos. A este respecto, la tIcópula permite tratar con colas m#s pesadas que la gaussiana.
– C&p$a" de 1aor e)tremo;* estas cópulas ser#n de gran utilidad para representar relaciones que ponen mayor
"nfasis entre los sucesos :cola; 5etremos6 de las distribuciones marginales. Como se define por eemplo en
P1E0E41Q, las cópulas de valor etremo son los posibles límites 5en caso de que eistan6 de cópulas asociadas
a los m#imos de muestras independientes e id"nticamente distribuidas. Entendamos meor esta definición.
1ea una muestra de variables aleatorias bidimensionales T5 G : , :6, ..., 5 G n , n6U independientes e id"nticamente
distribuidas de acuerdo a unas mismas marginales F G y 1 y a una misma distribución conunta # G que, en
virtud del teorema de 1Glar llevar# asociada una cópula + > # G @ , y =+ F G @ , 1 y .
1ean las variables M n=ma@ T G A, G D,... , G nU y = n=ma@ T A, D,... , n U cuyas funciones de distribución
vienen dadas por F n @= % P M n≤ @ Q y 1n y = % P = n≤ y Q y con distribución conunta
# n @= % P M n≤ @ , = n≤ y Q .
1i + es tambi"n la cópula asociada al par 5 M n ,= n6 y a su posible límite cuando :n; tiende a infinito se dice
entonces que + es una cópula de valor etremo 5C*E6. Como se eplica en P1E0E41Q, de acuerdo al teorema
de De3$e1e" una cópula + de valor etremo queda caracterizada por la condición
+
t
u
A
t
, v
A
t
=+ u , v ∀ t "@5.DK6
Funciones c
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
38/324
siendo un corolario de "sta el que las cópulas de valor etremo sólo modelizan dependencia positiva.
Adem#s, eiste un teorema propuesto por P!%,and" 5?6 que permite asociar una representación asociada a
este tipo de cópulas.
Teorema 1./.- epresenta!i$n de !$pulas de alor e0tremo
6Cna c
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
39/324
7e acuerdo a lo epuesto, queda patente la dificultad de establecer una clasificación 'nica de las cópulas conforme a un
criterio general dado que, incluso de acuerdo a un mismo criterio, pueden eistir solapamiento entre las clases
establecidas. Así, la cópula de valor etremo de G$m2e 5v"ase 5A!.6 o 5A!.B66 pertenecen tambi"n a la clase
arquimediana, si bien ninguna de las clases es subconunto de la otra pues por eemplo la cópula de 7$"er # Re!""
5v"ase 5A!.?66 es de valor etremo pero no arquimediana mientras que la cópula de Fran, 5v"ase 5A!.F66 esarquimediana pero no de valor etremo6.
En el Aneo ! se presenta un esquema que trata de ubicar las cópulas m#s populares de acuerdo a una erarquía concreta
que trata de responder a los dos 'ltimos criterios que hemos definido. El criterio de clasificación de acuerdo al soporte
5singular, absolutamente continuo o mito6 se ha obviado dado que en su mayor parte 5salvo las cotas de $r"chetI
Joeffding6 se trata de cópulas no singulares. Así>
– El primer nivel de esta erarquía se establece de acuerdo al n'mero de par#metros del que depende la familia.
– El segundo criterio clasifica conforme al tipo de relación de dependencia> cópulas de dependencia etrema,
cópulas elípticas, cópulas de valor etremo y la clase arquimediana que pudiera considerarse comodín en el
sentido de que permite reflear distintos tipos de relaciones.
Funciones c
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
40/324
' Elección de la có$!la +!e me,or re&le,a !na relación de de$endencia
2.) In+ro,/i1n al 5roblema
8no de los problemas cl#sicos en la estadística es conocer la distribución a la que responde una muestra dada de forma
que "sta quede bien caracterizada y puedan etraerse conclusiones con fines descriptivos o predictivos. 7entro del
conteto de la teoría de cópulas, este problema presenta una doble vertiente> una univariante asociada a la
especificación de las funciones de distribución F G y 1 5en adelante F y 16 correspondientes a las marginales de G e ,
y otra bivariante 5en general multivariante6 asociada a la determinación de aquella conunta # G 5en adelante # 6, de las
infinitas que comparten dichas marginales, que meor captura la relación entre ellas. 2a vertiente bivariante desemboca
en la b'squeda de una función cópula + cuyas características puedan esperarse para la verdadera distribución conunta # , siendo el teorema de 1Glar el que establece la transformación final de + en # .
En ocasiones, por las características del problema que se est# estudiando, se puede tener una idea preconcebida de la
familia de cópulas que puede ser m#s apropiada para eplicar la relación entre las variables que se manean. Así por
eemplo, si el estudio est# orientado a medir el grado de asociación para valores etremos de dos variables, que se
intuye presenta un comportamiento especial respecto del grado de asociación que pudieran tener para otros valores no
etremos, suelen ser aconseable utilizar cópulas que enfaticen la relación entre las colas de las distribuciones
marginales 5cópulas del valor etremo6, como por eemplo las pertenecientes a la familia de 0umbel.
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
41/324
F. 1elección de una cópula por familia. En el caso param"trico se trata de determinar los valores asociados a los
par#metros correspondientes a cada familia para lo cual, se suelen utilizar epresiones que permitan el c#lculo
de dichos par#metros a partir de la estimación muestral de alguna medida de asociación como el coeficiente de
correlación de 1pearman o la -au de Nendall.
H. Elección de la cópula de entre todas las que representan a cada una de las familias candidatas. A este respecto,
eisten muy diversos criterios que eponemos en el apartado D.B.
2.2 De+erminai1n ,e la* ,i*+rib/ione* mar7inale*
2a vertiente univariante conlleva la especificación de funciones de distribución asociadas a cada una de las variables.
1i bien eisten los cl#sicos contrastes de bondad de auste que permiten evaluar el grado de parentesco con alguna
distribución conocida, una buena aproimación podría venir dada por la la versión continua de la función de
distribución empírica de cada variable que, como eplica De Matte!" 5v"ase capítulo H de P/A--E!1Q6, se calcula de la
siguiente manera>
7ada la muestra T @: , @2 , ..., @nU etraída de la variable G , la función de distribución empírica 5discreta6 viene dada por
% F n @ =A
n&i=A
n
A[ G i @ ] 5D.6.
Consideremos entonces :a7 y :7 dos n'meros reales tales que a≤ @A, @D,... , @n y - @A, @D,... , @n .
$lecci
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
42/324
2. ro5/e*+a ,e /n on-/n+o iniial ,e amilia* ,e 15/la* an,i,a+a*
El eperto en cópulas conoce las propiedades que caracterizan a las diferentes familias eistentes y que las pueden
hacer m#s o menos apropiadas para reflear alg'n tipo de relación que, a priori, puede presuponer que eista entre las
variables. Así por eemplo, seg'n cit#bamos en el apartado .B.F, las familias elípticas resultan m#s convenientes para
reflear relaciones sim"tricas mientras que las definidas como cópulas de valor etremo enfatizan asimetrías que ganan
fuerza entre los sucesos :cola; de las distribuciones.
7ebe ser el conocimiento del analista sobre la relación subyacente a los datos y el que tiene sobre las características de
las familias de cópulas a su alcance, los factores principales que le lleven a descartar de antemano alguna de estas
familias y seleccionar algunas otras como candidatas de partida.
2.4 De+erminai1n ,e la 15/la 15+ima ,en+ro ,e /na amilia
1i bien como decíamos, el conocimiento del eperto puede llevarle a hacerse una idea de cu#l es la familia m#s
conveniente para su problema en función del tipo de relación que sospeche eiste entre sus variables, tambi"n
admitimos que esta intuición puede no eistir si el analista desconoce la relación que cabe esperar a priori. -ambi"n
puede darse el caso de que el analista encuentre varias familias que desempeñan papeles parecidos y no termine de ver
claro cu#l de ellas es la m#s apropiada. En estas ocasiones, resulta beneficioso disponer de una amplia gama de familias
candidatas para poder seleccionar de cada una de ellas un representante 5aquella cópula que meor se austase a la
muestra de datos disponible6 entre los cuales acabar# eligiendo uno.
En este conteto, las cópulas arquimedianas, que presentamos en el capítulo anterior, suelen resultar especialmente
$lecci
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
43/324
'tiles pues gracias a su gran diversidad permite recoger relaciones de muy distintos tipos. Como tambi"n se eplica en
el capítulo H de P/A--E!1Q, el procedimiento para determinar la cópula que meor se austa a una muestra aleatoria
bivariante de 6n7 observaciones T5 @: ,y:6, ..., 5 @n ,yn6U comienza asumiendo que "sta ha sido generada por una distribución
bivariante desconocida #"@,y con marginales continuas F"@ y 1"y y cópula arquimediana +"u,v. Jecha esta
consideración, se trata de determinar a qu" familia pertenece + , o lo que es lo mismo, la forma del generador $ dela cópula que, recordemos, caracteriza a la cópula arquimediana. 1e podr# disponer de varias familias candidatas
'+ !(!∈) 5con varios tipos de generadores $! 6 y, para cada una de ellas, elegir un representante + !B%T . Como
cita 7e /atteis, para la estimación de θ , eisten diferentes alternativas>
– Estimar en un primer paso las funciones de distribución marginales mediante m"todos param"tricos o no
param"tricos y, posteriormente, a partir de ellas, estimar θ mediante el principio de m#ima verosimilitud.
– -ambi"n es posible hacer la estimación de las marginales y del par#metro θ en un sólo paso. En este caso, laestimación de θ puede hacerse de dos formas>
– Empleando un m"todo param"trico como es el procedimiento de estimación de m#ima verosimilitud,
siendo la función de verosimilitud " α,θ ,G, donde α identifica a los par#metros de las marginales.
– Empleando un m"todo no param"trico, recomendado por Gene"t # R!1e"t 5??F6 donde θ es estimado en
un sólo paso, con independencia de las funciones de distribución marginales. 2a estimación se hace
empleando la correlación rango de Nendall.
%rocediendo de la forma que describe P/A--E!1Q para cada una de las familias candidatas, el resultado es un conunto
de cópulas 5una por familia6 entre las que ser# necesario hacer la selección final.
2. Selei1n ,e la me-or amilia a 5ar+ir ,e la* 15/la* re5re*en+an+e*
En este apartado se proponen algunos de los criterios m#s utilizados para decantarse por la selección de una
determinada cópula dentro de un conunto de candidatas. 7icho conunto puede haber sido el resultado de alguno de los procesos descritos en el apartado anterior. 2a decisión obviamente lleva implícita el optar por una determinada familia.
'%" -.todo "/ Em$leo de la có$!la em$)rica
2as %&p$a" emp6r!%a" fueron estudiadas originalmente por 7eheuvels 5?K?6. 2a idea consiste en construir una
función cópula a partir de valores muestrales T5 @: ,y:6, ..., 5 @n ,yn6U recogidos para las variables univariantes sin establecer
dependencia de ning'n par#metro. 7e esta forma, la cópula es no param"trica y queda definida 'nicamente a partir de la
muestra de datos disponible.
$lecci
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
44/324
2a definición de la cópula empírica puede encontrarse en P&E21E&Q 5definición B.B.6 y responde a la epresión>
+ ni
n ,
?
n=
nS de pares @ , y enla muestra talesKue @ @i e y y ?
n5D.D6
para T5 @: ,y:6, ..., 5 @n ,yn6U muestra de una distribución bivariante conunta, y siendo @"i e y" con A≤i , ?≤n los
estadísticos de orden definidos a partir de dicha muestra.Este primer m"todo, citado por Ca$d!o Romano 5v"ase el apartado H.D de P4
dn %+ ,+ 0 =&t A= A
T
...&t n=A
T
%+ t A
T ...
t n
T −+ 0
t A
T ...
t n
T
D
A /D
5D.F6
1i bien estamos partiendo de que ya disponemos de una cópula concreta dentro de cada una de las familias y esta
distancia nos va a ayudar a seleccionar una de ellas, tambi"n es posible aplicar esta medida a todas las cópulas de una
misma familia para determinar el valor del par#metro m#s conveniente. Es decir, podríamos prescindir del paso previo
de estimación que hemos comentado 5la solución param"trica o la no param"trica de 0enest y 4ivest6 y hacer la
selección de la cópula dentro de cada una de las familias vali"ndonos de dn . Como se eplica en P4
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
45/324
( + + F G , 1 ~C @,A . *aldría nuevamente un gr#fico -plot asociado a las funciones de
distribución : (7 correspondientes a cada una de las cópulas candidatas para terminar decant#ndose por aqu"lla
que m#s se aproime a la recta y N @.
'%* -.todo */ A$ro(imación anal)tica de los m.todos gr&icos
1i bien los m"todos gr#ficos anteriores pueden proporcionar una idea bastante buena de cu#l es la cópula m#s
apropiada, se puede eliminar la subetividad asociada a la agudeza visual del analista y plantear un test de hipótesis para
contrastar si las distribuciones de + : "F"@,1"y o ( c "t se aproiman a una 85@,6.
A este respecto, en P/A--E!1Q 5apartados H.H. y H.H.D6 se citan los dos contrastes cl#sicos de bondad de auste a una
distribución dada, el de la C3!*%$adrado y el de Bomo'oro1*Sm!rno1. %ara llevar a cabo estos contrastes se trocea el
rango de variación de la distribución a contrastar en una serie de intervalos y se comprueba si el n'mero de valores
muestrales observados en cada una de ellos 5Bi6 se parece al n'mero de ellos que cabría esperar 5 $ i6 bao el supuesto de
que siguieran una distribución 85@,6. %ara una descripción m#s detallada de estos contrastes se puede consultar el
Aneo *!!!.
– Contra"te de a C3!*%$adrado 2a"ado en e e"tad6"t!%o de Pear"on
2a muestra de partida es el conunto de valores + : "F"@i ,1"yi 5o ( c "t i 6 que nos proporcionar# las frecuencias
observadas 5Bi6 dadas por el n'mero de pares 5 F"@i ,1"yi 6 que caen en cada uno de los intervalos. El obetivo
es contrastar si "stas frecuencias se aproiman a las esperadas 5 $ i6 para una distribución uniforme est#ndar.
Aquella cópula + cuya condicionada + : d" un mayor grado de proimidad entre estas frecuencias 5menor valor
del estadístico de %earson6 ser# la propuesta para representar la relación entre G e .
– Contra"te de Bomo'oro1*Sm!rno1 2a"ado en e e"tad6"t!%o Dn
En este caso, + : "F"@i ,1"yi 5o ( c "t i 6 proporcionar# la muestra de valores a partir de la cual se construir# la
función de distribución empírica F n. El obetivo es ver si "sta se parece a la función de distribución de una
85@,6. Así, la cópula + cuya condicionada + : nos proporcione un valor del estadístico !n m#s pequeño ser#
aqu"lla para la que la muestra de valores se aproime m#s a una distribución uniforme est#ndar y por tanto, la
m#s apropiada para representar la relación entre G e .
'%1 -.todo 1/ Criterio de in&ormación de A2ai2e 3AIC4
-
8/16/2019 Teoría de Cópulas Aplicada a La Predicción
46/324
de par#metros que se estima.
8tilizar el criterio de AGaiGe supone decantarse por aquel :modelo; que presenta un menor valor del *I+ lo cual es
representativo de un modelo m#s parsimonioso 5menos par#metros6 y que meor se austa a los datos 5menor error de
predicción6. 7ado que representa la probabilidad de que la muestra quede bien representada por los par#metros,
interesa que sea próima a lo cual se traducir# en que el logaritmo de se aproime a @. Es por ello que un *I+ pequeño es indicativo de que el estimador