propuestas de una estadística moderna en estudios relacionados con el cambio climático ana justel
DESCRIPTION
Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel Departamento de Matemáticas Universidad Autónoma de Madrid. Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel - Universidad Autónoma de Madrid. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/1.jpg)
Propuestas de una Propuestas de una estadística moderna en estadística moderna en estudios relacionados con estudios relacionados con el cambio climáticoel cambio climático
Ana Justel Ana Justel Departamento de MatemáticasDepartamento de MatemáticasUniversidad Autónoma de MadridUniversidad Autónoma de Madrid
![Page 2: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/2.jpg)
Propuestas de una estadística moderna en estudios relacionados con el cambio climático
Ana Justel - Universidad Autónoma de MadridAna Justel - Universidad Autónoma de Madrid
En los últimos años la estadística se enfrenta a la necesidad de desarrollar nuevos En los últimos años la estadística se enfrenta a la necesidad de desarrollar nuevos métodos para métodos para extraer la información rápida y eficazmente de grandes bases de extraer la información rápida y eficazmente de grandes bases de
datos, pero también que nos permitan aprender de datos problemáticos y escasos.datos, pero también que nos permitan aprender de datos problemáticos y escasos. En esta conferencia se presentarán varios problemas reales, relacionados con indicadores para el estudio del cambio climático, que en la mayoría de los casos han motivado el desarrollo de nuevos procedimientos estadísticos. Muchos
de los trabajos tienen su origen en el análisis de los datos registrados en la Antártida por el equipo del proyecto Limnopolar, uno de los lugares donde las condiciones de trabajo son más extremas por el aislamiento, la dificultad de acceso y la meteorología. Los problemas estadísticos que trataremos incluyen el concepto de tendencia para datos
funcionales en el estudio de series de temperaturas en la región de la Península Antártica, aprovechando datos “defectuosos” y escasos. Cluster de series temporales para agrupar países con intereses comunes frente a los
compromisos del Protocolo de Kyoto. Selección de variables en análisis cluster para identificar diferencias en las pautas de consumo eléctrico de los hogares. Detección de cambios de variabilidad en series de temperaturas para
predecir indirectamente el momento en que se congela/descongela un lago antártico, y así estimar el número de días con actividad biológica. Estimación robusta de parámetros relacionados con la presencia de especies como
bioindicadores. Análisis de la varianza para seleccionar indicadores de impacto en áreas protegidas de la Antártida .
![Page 3: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/3.jpg)
1.1. Cluster de series temporales para Cluster de series temporales para agrupar países con intereses agrupar países con intereses comunes frente a los compromisos del Protocolo de Kyotocomunes frente a los compromisos del Protocolo de Kyoto
2.2. Selección de variables en análisis cluster para Selección de variables en análisis cluster para identificaridentificar diferencias en las pautas de consumo eléctrico de los diferencias en las pautas de consumo eléctrico de los hogareshogares
3.3. Concepto de tendencia para datos funcionales en el Concepto de tendencia para datos funcionales en el estudio de estudio de series de temperaturas en la región de la Península series de temperaturas en la región de la Península AntárticaAntártica, aprovechando datos “defectuosos” y escasos, aprovechando datos “defectuosos” y escasos
4.4. Detección de cambios de variabilidad en series temporales para Detección de cambios de variabilidad en series temporales para predecir indirectamente el momento en que se predecir indirectamente el momento en que se congela/descongela un lago antártico, y estimar el número congela/descongela un lago antártico, y estimar el número de días con actividad biológicade días con actividad biológica
5.5. Estimación robusta de parámetros relacionados con la Estimación robusta de parámetros relacionados con la presencia presencia de especies como bioindicadoresde especies como bioindicadores
6.6. Análisis de la varianza para seleccionar Análisis de la varianza para seleccionar indicadores de impacto indicadores de impacto en áreas protegidas de la Antártidaen áreas protegidas de la Antártida
![Page 4: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/4.jpg)
Series temporale
s
Análisis multivariant
e
Problemas estadísticosProblemas estadísticos
Cluster de series temporales para agrupar Cluster de series temporales para agrupar países con intereses comunes frente a los países con intereses comunes frente a los
compromisos del Protocolo de Kyotocompromisos del Protocolo de Kyoto
![Page 5: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/5.jpg)
Problemas estadísticosProblemas estadísticos
Selección de variables en análisis cluster Selección de variables en análisis cluster para identificar diferencias en las pautas de para identificar diferencias en las pautas de
consumo eléctrico de los hogaresconsumo eléctrico de los hogares
Series temporale
s
Análisis multivariant
e
Datos funcionale
s
![Page 6: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/6.jpg)
Problemas estadísticosProblemas estadísticos
Concepto de tendencia para datos funcionales Concepto de tendencia para datos funcionales en el estudio de series de temperaturas en la en el estudio de series de temperaturas en la
región de la Península Antártica, aprovechando región de la Península Antártica, aprovechando datos “defectuosos” y escasosdatos “defectuosos” y escasos
Datos funcionale
s
Series temporale
s
Análisis multivariant
e
![Page 7: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/7.jpg)
Problemas estadísticosProblemas estadísticos
Detección de cambios de variabilidad en series Detección de cambios de variabilidad en series temporales para predecir indirectamente el temporales para predecir indirectamente el momento en que se congela/descongela un momento en que se congela/descongela un
lago antártico, y estimar el número de días con lago antártico, y estimar el número de días con actividad biológicaactividad biológica
Robustez
Series temporale
s
Análisis multivariant
e
Datos funcionale
s
![Page 8: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/8.jpg)
Problemas estadísticosProblemas estadísticos
Estimación robusta de parámetros Estimación robusta de parámetros relacionados con la presencia de relacionados con la presencia de
especies como bioindicadoresespecies como bioindicadores
Series temporale
s
Análisis multivariant
e
Datos funcionale
sRobustez
![Page 9: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/9.jpg)
Problemas estadísticosProblemas estadísticos
Análisis de la varianza para Análisis de la varianza para seleccionar indicadores de impacto seleccionar indicadores de impacto en áreas protegidas de la Antártidaen áreas protegidas de la Antártida
Análisis de la
varianza
Series temporale
s
Análisis multivariant
e
Datos funcionale
sRobustez
![Page 10: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/10.jpg)
Problemas estadísticosProblemas estadísticos
Series temporale
s
Análisis multivariant
e
Datos funcionale
sRobustez
Análisis de la
varianza
![Page 11: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/11.jpg)
Cluster de series temporales basado Cluster de series temporales basado en densidades de predicciónen densidades de predicción
Andrés M. AlonsoAndrés M. AlonsoUniversidad Carlos III de MadridUniversidad Carlos III de Madrid
José Ramón BerrenderoJosé Ramón BerrenderoUniversidad Autónoma de MadridUniversidad Autónoma de Madrid
Adolfo HernándezAdolfo HernándezUniversidad Complutense de MadridUniversidad Complutense de Madrid
Ana JustelAna JustelUniversidad Autónoma de MadridUniversidad Autónoma de Madrid
1.1. Cluster de series temporales para Cluster de series temporales para agrupar países con intereses agrupar países con intereses comunes frente a los compromisos del Protocolo de Kyotocomunes frente a los compromisos del Protocolo de Kyoto
![Page 12: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/12.jpg)
Emisiones de CO2 en 24 países industrializados
Observamos los datos históricos de emisiones de CO2 y
queremos clasificar en grupos o “CLUSTERS” “CLUSTERS” a los países
Planteamiento del problemaPlanteamiento del problema
![Page 13: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/13.jpg)
El objetivo de las técnicas estadísticas de ANÁLISIS ANÁLISIS CLUSTERCLUSTER o de CONGLOMERADOSCONGLOMERADOS es identificar grupos de individuos con características comunes a partir de la observación de varias variables en cada uno de ellos
Esta técnica no debe ser confundida con el análisis discriminante y los métodos de asignación, que parten de un conocimiento previo de los grupos (seguimiento de pacientes sometidos que reciben tratamiento o placebo)
Planteamiento del problemaPlanteamiento del problema
![Page 14: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/14.jpg)
Un CLUSTERCLUSTER es un grupo de individuos que, cuando la dimensión lo permite, el ojo humano identifica como homogéneos entre sí y separados de los individuos de los otros clusters
Planteamiento del problemaPlanteamiento del problema
![Page 15: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/15.jpg)
Métodos para encontrar clustersMétodos para encontrar clusters
Cluster jerárquico.Cluster jerárquico. Se parte de tantos clusters como datos tiene la muestra y en cada paso se van juntando dos clusters siguiendo algún criterio especificado, hasta obtener un único cluster con todos los datos
Criterios de optimización.Criterios de optimización. Producen una partición de los objetos en un número especificado de grupos siguiendo un criterio de optimización. El más conocido es kk-MEDIAS-MEDIAS
En general, se busca HOMOGENEIDADHOMOGENEIDAD dentro de los gruposdentro de los grupos y
HETEROGENEIDADHETEROGENEIDAD entre gruposentre grupos
Planteamiento del problemaPlanteamiento del problema
![Page 16: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/16.jpg)
Planteamiento del problemaPlanteamiento del problema
¿Podemos utilizar las técnicas habituales del análisis ¿Podemos utilizar las técnicas habituales del análisis multivariante para encontrar los clusters?multivariante para encontrar los clusters?
Observamos series temporales y queremos clasificarlas en grupos o “CLUSTERS”“CLUSTERS”
![Page 17: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/17.jpg)
• Procedimientos cluster tradicionales ignoran la estructura de autocorrelación de la serie y no proporcionan buenos resultados
• Necesidad de desarrollar nuevos procedimientos cluster para series temporales
• Algunos trabajos previos se basan en los modelos que generan las observaciones, o en el último dato observado
• El problema se complica mucho más con SERIES SERIES TEMPORALES MULTIVARIANTESTEMPORALES MULTIVARIANTES, cuando observamos más de una variable para cada individuo a lo largo del tiempo
Planteamiento del problemaPlanteamiento del problema
![Page 18: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/18.jpg)
Planteamiento del problemaPlanteamiento del problema
Observamos SERIES TEMPORALES MULTIVARIANTESSERIES TEMPORALES MULTIVARIANTES y queremos clasificarlas en grupos o “CLUSTERS”“CLUSTERS”
Proyectamos Proyectamos en el futuroen el futuro
XXX
XXX
n
Tp
n
T
n
T
TpTT
)(
,
)(
,2
)(
,1
)1(
,
)1(
,2
)1(
,1
X
X
(n)
1,1
(1)
1,1
XX)n(
,1p
)n(
,12
XXX
XXX
n
hTp
n
hT2
n
hT1
1
hTp
1
hT2
1
hT1
ˆˆˆ
ˆˆˆ
)(
,
)(
,
)(
,
)(
,
)(
,
)(
,
![Page 19: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/19.jpg)
En muchas situaciones en la vida real, estamos interesados en las PREDICCIONESPREDICCIONES en un momento específico del futuro
Los resultados, en general, serán diferentesserán diferentes
Planteamiento del problemaPlanteamiento del problema
Futuro
Modelo Presente
![Page 20: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/20.jpg)
En muchas situaciones en la vida real, estamos interesados en las PREDICCIONESPREDICCIONES en un momento específico del futuro
Planteamiento del problemaPlanteamiento del problema
Fuente: Manuel Ruiz, UAM
Daxi Village, China
0
10
20
30
40
50
60
70
1973 1976 1979 1982 1985 1988 1991 1994 1997 2000 2003 2006
percen
t o
f in
co
me
agriculture
forestry
off-farm
Dam construction
![Page 21: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/21.jpg)
¿Por qué clusters de predicciones?¿Por qué clusters de predicciones?
Se reduce la dimensionalidad del problema
Se incluye información tanto del presente como del pasado de las series
En muchos problemas, el interés real se centra en el comportamiento futuro ó en si las series convergen o no a un cierto nivel
― Desarrollo sostenible― Emisiones de CO2 (Protocolo de Kyoto)― Convergencia económica
Planteamiento del problemaPlanteamiento del problema
![Page 22: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/22.jpg)
Además, nuestro método se basa en clasificar las series por las distancias entre las DENSIDADES DE LAS DENSIDADES DE LAS PREDICCIONESPREDICCIONES, no sólo en la predicciones puntuales.
Esto permite distinguir entre situaciones donde las predicciones puntuales son similares, pero las densidades completas proporcionan más información.
Planteamiento del problemaPlanteamiento del problema
![Page 23: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/23.jpg)
PASO 1.PASO 1. Calcular las densidades de predicción
PASO 2.PASO 2. Calcular la matriz de discrepancias entre las series (usando las densidades de predicción)
PASO 3.PASO 3. Aplicar análisis cluster tradicional
Metodología para clasificar series temporalesMetodología para clasificar series temporales
![Page 24: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/24.jpg)
PASO 1.PASO 1. Calcular las densidades de predicción
A. Si no asumimos ninguna distribución para los datos necesitamos usar métodos de remuestreo (“sieve bootstrap”) para calcular la densidad de predicción
B. Con el bootstrap extraemos B valores de la distribución de la predicción en el momento específico del futuro que nos interesa
C. Estimamos la densidad de la predicción aplicando métodos no paramétricos a los B valores bootstrap
Metodología para clasificar series temporalesMetodología para clasificar series temporales
Se puede desarrollar una versión más sencilla de implementar asumiendo normalidad o basando la agrupación en predicciones puntuales
![Page 25: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/25.jpg)
Metodología para clasificar series temporalesMetodología para clasificar series temporales
Esquema del procedimiento BOOTSTRAPEsquema del procedimiento BOOTSTRAP
![Page 26: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/26.jpg)
PASO 2.PASO 2. Calcular la matriz de discrepancias (D)
A. Para cada par de series calculamos la distancia L2 entre las funciones de densidad de las predicciones
Metodología para clasificar series temporalesMetodología para clasificar series temporales
B. Estimamos cada distancia con , que se calcula a partir de los estimadores no paramétricos de las estimadores no paramétricos de las
densidades de prediccióndensidades de predicción usando la muestra de predicciones bootstrap
C. Hemos probado que es estimador consistente de Dij
D. Hemos hecho unas simulaciones para comparar Dij y
![Page 27: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/27.jpg)
PASO 3.PASO 3. Aplicar análisis cluster tradicional
A. La matriz de discrepancias obtenida se utiliza como input de un procedimiento cluster
B. Los métodos jerárquicos se pueden ejecutar conociendo sólo la MATRIZ de DISCREPANCIASMATRIZ de DISCREPANCIAS, los que se basan en criterios de optimización no nos sirven
Metodología para clasificar series temporalesMetodología para clasificar series temporales
![Page 28: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/28.jpg)
1. Enlace sencillo (single linkage)(single linkage): unir por la distancia al individuo más cercano del grupo
2. Enlace promedio (average linkage)(average linkage): unir por la media de las distancias a todos los individuos del grupo
3. Enlace completo (complete linkage)(complete linkage): unir por la distancia al individuo más alejado del grupo
4. ...
Criterios para unir grupos en métodos jerárquicosCriterios para unir grupos en métodos jerárquicos
Metodología para clasificar series temporalesMetodología para clasificar series temporales
![Page 29: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/29.jpg)
DendogramaDendograma
Los clusters están representados mediante trazos horizontales y las etapas de la fusión mediante trazos verticales
Metodología para clasificar series temporalesMetodología para clasificar series temporales
Tests formales, intuición (conocimiento del problema)¿Cuántos cluster hay?¿Cuántos cluster hay?
{1,2},3,{4,5}
![Page 30: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/30.jpg)
Impone límites en las emisiones de CO2 y otros cinco
gases, “responsables” del calentamiento global.
Negociado en Kyoto en 1997, entra en vigor en 2005 con la ratificación de Rusia (cuando es aceptado por los países responsables del 55% de las emisiones a nivel mundial).
El objetivo es reducir al menos un 5% (respecto de los niveles de 1990) antes de 2012, pero con objetivos distintos según regiones (UE 8%, Japón 6%)
Aplicamos la técnica de CLUSTER PARA SERIES CLUSTER PARA SERIES TEMPORALESTEMPORALES para crear grupos de países con intereses comunes que puedan compartir experiencias o políticas para alcanzar las reducciones comprometidas
Protocolo de KyotoProtocolo de Kyoto
El caso de las emisiones de COEl caso de las emisiones de CO22
![Page 31: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/31.jpg)
Protocolo de Kyoto Protocolo de Kyoto - Emisiones de CO2 1960-1999 - Emisiones de CO2 1960-1999 Toneladas Toneladas per capita per capita En 24 países industrializadosEn 24 países industrializados
El caso de las emisiones de COEl caso de las emisiones de CO22
![Page 32: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/32.jpg)
Basado en el dato de 1999Basado en el dato de 1999
El caso de las emisiones de COEl caso de las emisiones de CO22
Basado en la predicción de 2012Basado en la predicción de 2012
![Page 33: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/33.jpg)
Basado en el dato de 1999Basado en el dato de 1999
El caso de las emisiones de COEl caso de las emisiones de CO22
Basado en la densidad de la predicción de 2012Basado en la densidad de la predicción de 2012
![Page 34: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/34.jpg)
Protocolo de Kyoto Protocolo de Kyoto - ¿Cluster con el último dato o con - ¿Cluster con el último dato o con las predicciones?las predicciones?
El caso de las emisiones de COEl caso de las emisiones de CO22
![Page 35: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/35.jpg)
Protocolo de Kyoto Protocolo de Kyoto - ¿Cluster con el último dato o con - ¿Cluster con el último dato o con las predicciones?las predicciones?
El caso de las emisiones de COEl caso de las emisiones de CO22
![Page 36: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/36.jpg)
Selección de variables para análisis Selección de variables para análisis clustercluster
Ricardo FraimanRicardo FraimanUniversidad de San Andrés, ArgentinaUniversidad de San Andrés, Argentina
Ana JustelAna JustelUniversidad Autónoma de MadridUniversidad Autónoma de Madrid
Marcela SvarcMarcela SvarcUniversidad de San Andrés, ArgentinaUniversidad de San Andrés, Argentina
2.2. Selección de variables en análisis cluster para Selección de variables en análisis cluster para identificaridentificar diferencias en las pautas de consumo eléctrico de los hogaresdiferencias en las pautas de consumo eléctrico de los hogares
Data source: Cuesta–Albertos and Fraiman (2006)
![Page 37: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/37.jpg)
Consumo eléctrico en 88 hogares argentinosConsumo eléctrico en 88 hogares argentinos
Se miden 96 variables:Se miden 96 variables: consumo de electricidad en intervalos de 15 minutos en un día – Datos funcionales– Datos funcionales
Cuesta–Albertos y Fraiman (2006) encuentran dos clusters con un método kk-medias para datos funcionales-medias para datos funcionales
El primer cluster tiene 33 hogares, y el segundo 55
![Page 38: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/38.jpg)
Buscamos el subconjunto de variables más subconjunto de variables más pequeñopequeño posible que explique las agrupaciones de los datos que hemos encontrado, o un porcentaje alto de ellas.
ObjetivoObjetivo
AplicacióAplicaciónn
Análisis exploratorio de datos. Análisis exploratorio de datos. Ayuda a interpretar los cluster que se forman
Reducir la dimensión. . Para nuevos conjuntos de datos
Es habitual que el número de variablesnúmero de variables, que no debemos confundir con la cantidad de cantidad de informacióninformación, sea demasiado elevado.
![Page 39: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/39.jpg)
Trataremos de eliminar variables— “ “RUIDOSAS”RUIDOSAS”,, que son las no informativasy/o— REDUNDANTESREDUNDANTES, que no aportan información que no este contenida en otras variables
Selección de variablesSelección de variables
![Page 40: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/40.jpg)
1.1. Encontrar los grupos con Encontrar los grupos con un método cluster un método cluster
2.2. Seleccionar las variablesSeleccionar las variables
““AFTER-CLUSTER” AFTER-CLUSTER” Método de selección de variablesMétodo de selección de variables
Proponemos un método:- consistente estadísticamenteconsistente estadísticamente - no paramétricono paramétrico - fácil de usarfácil de usar
El método cluster es bueno
El método cluster genera una partición del espacio
![Page 41: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/41.jpg)
Optimizing criteria
Optimizing criteria
Hierarchical
Hierarchical clustering
clustering
K-medias
![Page 42: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/42.jpg)
Cuando se elimina la información de las variables “ruidosas”. Esperamos que NO CAMBIENNO CAMBIEN los clusterslos clusters
SELECCIÓN DE VARIABLES “AFTER” CLUSTERSELECCIÓN DE VARIABLES “AFTER” CLUSTER
(los datos se quedan en la misma partición)
La CLAVE está en tener en cuenta que CLAVE está en tener en cuenta que la partición se la partición se define en el espacio de variables original,define en el espacio de variables original, así que para reasignar los datos a los cluster no puedo eliminar variables aunque sean ruidosas
EN LUGAR DE ELIMINAR VARIABLES DEBEMOSEN LUGAR DE ELIMINAR VARIABLES DEBEMOS “DESACTIVARLAS” “DESACTIVARLAS”
Probamos a clasificar sólo con las variables de todos los subconjuntos posiblessubconjuntos posibles y elegimos el ÓPTIMO: más ÓPTIMO: más pequeño y que más expliquepequeño y que más explique
![Page 43: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/43.jpg)
Que una variable sea ruidosa significa que su DISTRIBUCIÓN DE PROBABILIDADDISTRIBUCIÓN DE PROBABILIDAD es la misma en todos los clusters
Esto nos sugiere “cancelar” el efecto de una variable sustituyendo todos los valores que toma por la MEDIAMEDIA
Desactivar variables ruidosasDesactivar variables ruidosas
![Page 44: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/44.jpg)
Resultados con datos simuladosResultados con datos simulados
El método para seleccionar variables funciona muy El método para seleccionar variables funciona muy bien para eliminar variables ruidosas, pero es incapaz bien para eliminar variables ruidosas, pero es incapaz de detectar variables con información redundante.de detectar variables con información redundante.
![Page 45: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/45.jpg)
Ejemplo con datos simuladosEjemplo con datos simulados
Data source: Tadesse, Sha and Vannucci (2005)
![Page 46: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/46.jpg)
La extensión más natural es cambiar MEDIASMEDIAS por MEDIAS CONDICIONALESMEDIAS CONDICIONALES
El mejor predictor de El mejor predictor de
XXii basado en las basado en las
variables del variables del subconjuntosubconjunto
Eliminar variables redundantesEliminar variables redundantes
En la practica, calculamos la media condicional con una regresión no paramétrica que hace uso de la información local, de un número de VECINOS MÁS VECINOS MÁS CERCANOSCERCANOS que tenemos que fijar
También probamos que este método de También probamos que este método de selección de variables es consistenteselección de variables es consistente
![Page 47: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/47.jpg)
Data source: Tadesse, Sha and Vannucci (2005)
Método basado en la Método basado en la media condicionalmedia condicional
Ejemplo con datos simuladosEjemplo con datos simulados
![Page 48: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/48.jpg)
El método basado en la MEDIA CONDICIONAL MEDIA CONDICIONAL sirve para eliminar las variables “RUIDOSAS” “RUIDOSAS” y las REDUNDANTESREDUNDANTES, pero requiere
El método basado en la MEDIA MARGINALMEDIA MARGINAL es más simple.
- Un tamaño muestral grande para calcular la esperanza condicionada
- Elegir el número adecuado de vecinos más cercanos, que es un problema sin resolver
- Mucho esfuerzo computacional
![Page 49: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/49.jpg)
96 variables: consumo eléctrico en intervalos de 15 minutos en un día
Un número demasiado elevado para calcular todas las posibles combinaciones
Consumo de electricidad – Datos funcionalesConsumo de electricidad – Datos funcionales
Data source: Cuesta–Albertos and Fraiman (2006)
Diseñamos un algoritmo de busqueda forward-algoritmo de busqueda forward-backward backward para encontrar las “ventanas de tiempo” más relevantes para el procedimiento de cluster.
![Page 50: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/50.jpg)
Resultados con 100 permutacionesResultados con 100 permutaciones
Para calcular la media Para calcular la media condicionada, condicionada,
consideramos 5, 10 and consideramos 5, 10 and 33 vecinos más 33 vecinos más
cercanoscercanos
Usar el algoritmo de la media algoritmo de la media condicionadacondicionada, en lugar del de la media que es más rápido, significa reduccir del número de intervalos que caracterizan a los dos tipos de consumidores
Consumo de electricidad – Datos funcionalesConsumo de electricidad – Datos funcionales
![Page 51: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/51.jpg)
La elección del número de vecinos más cercanos (NN)vecinos más cercanos (NN) afecta al resultado (es un problema importante que resolver)
Los resultados con 5-NN son bastante satisfactoriosLos resultados con 5-NN son bastante satisfactorios
Resultados con 100 permutacionesResultados con 100 permutaciones
Consumo de electricidad – Datos funcionalesConsumo de electricidad – Datos funcionales
![Page 52: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/52.jpg)
Los intervalos no sombreados Los intervalos no sombreados corresponden a las variables corresponden a las variables
seleccionadasseleccionadas
• Madrugada (3:00 a 4:00)Madrugada (3:00 a 4:00)• Mañana (7:00 a 9:00) • Mañana (7:00 a 9:00) • Tarde (15:00 a 19:00)• Tarde (15:00 a 19:00)• Noche (21:00 a 24:00)• Noche (21:00 a 24:00)
Consumo de electricidad – Datos funcionalesConsumo de electricidad – Datos funcionales
![Page 53: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/53.jpg)
MadrugadaMadrugada(3:00 a 4:00)(3:00 a 4:00)
Data source: Cuesta–Albertos and Fraiman (2006)
MañanaMañana(7:00 a 9:00)(7:00 a 9:00)
TardeTarde(15:00 a 19:00)(15:00 a 19:00)
NocheNoche(21:00 a 24:00)(21:00 a 24:00)
Consumo de electricidad – Datos funcionalesConsumo de electricidad – Datos funcionales
![Page 54: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/54.jpg)
La información redundanteLa información redundante, especialmente de tarde y noche, queda resumidaresumida con el algoritmo de la media algoritmo de la media condicional con 5-NNcondicional con 5-NN
Cuando aceptamos algunos errores de clasificación, se reduce la eficiencia y deja de ser importante el y deja de ser importante el comportamiento en la madrugadacomportamiento en la madrugada
Consumo de electricidad – Datos funcionalesConsumo de electricidad – Datos funcionales
![Page 55: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/55.jpg)
Se obtienen resultados similares para 10-NN y 33-NNSe obtienen resultados similares para 10-NN y 33-NN
Consumo de electricidad – Datos funcionalesConsumo de electricidad – Datos funcionales
![Page 56: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/56.jpg)
Nociones de tendencia para series de Nociones de tendencia para series de datos funcionales: Aplicación al estudio datos funcionales: Aplicación al estudio del calentamiento global en la Antártida del calentamiento global en la Antártida
Ricardo FraimanRicardo FraimanUniversidad de San Andrés, ArgentinaUniversidad de San Andrés, Argentina
Ana JustelAna JustelUniversidad Autónoma de MadridUniversidad Autónoma de Madrid
Pamela LlopPamela LlopUniversidad Nacional del Litoral, ArgentinaUniversidad Nacional del Litoral, Argentina
3.3. Concepto de tendencia para datos funcionales en el Concepto de tendencia para datos funcionales en el estudio de estudio de series de temperaturas en la región de la Península Antárticaseries de temperaturas en la región de la Península Antártica, , aprovechando datos “defectuosos” y escasosaprovechando datos “defectuosos” y escasos
![Page 57: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/57.jpg)
![Page 58: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/58.jpg)
Temperaturas registradas en la Base Antártica Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI)Española Juan Carlos I (BAE-JCI)
![Page 59: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/59.jpg)
Temperaturas registradas en la Base Antártica Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI)Española Juan Carlos I (BAE-JCI)
![Page 60: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/60.jpg)
Temperaturas registradas en la Base Antártica Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI)Española Juan Carlos I (BAE-JCI)
![Page 61: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/61.jpg)
DATOS CON INTERPOLACIÓN “shape preserving”
![Page 62: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/62.jpg)
![Page 63: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/63.jpg)
DATOS CON INTERPOLACIÓN “shape preserving”
![Page 64: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/64.jpg)
DATOS CON INTERPOLACIÓN “shape preserving”
![Page 65: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/65.jpg)
SeasonSeason Percentage of Percentage of observed dataobserved data
First observed First observed datadata
Last observed Last observed datadata
1987/1988 6.53 1864 2160
1988/1989 65.42 645 2158
1989/1990 71.11 230 2086
1990/1991 61.90 433 2158
1991/1992 71.39 539 2160
1992/1993 5.13 1243 2131
1993/1994 65.79 529 2040
1994/1995 59.03 143 2160
1995/1996 69.91 87 1720
1996/1997 31.30 1478 2160
1997/1998 84.40 185 2102
1998/1999 95.23 71 2160
1999/2000 90.42 168 2160
2000/2001 93.33 67 2160
2001/2002 97.17 1 2160
2002/2003 99.35 1 2160
2003/2004 90.23 1 1976
2004/2005 92.08 14 2160
2005/2006 100 1 2160
2006/2007 100 1 2160
Eliminadas Eliminadas (insuficientes datos)
1076 datos 1076 datos empleados empleados cada añocada año
S = 17S = 17T = 1076T = 1076
![Page 66: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/66.jpg)
Estadístico 1 de tendencia de funciones Estadístico 1 de tendencia de funciones
Se define como el vector de rangos medios en cada instante
LSE linear LSE linear trendtrend
![Page 67: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/67.jpg)
Robust Robust linear trendlinear trend
Estadístico 1 de tendencia de funciones Estadístico 1 de tendencia de funciones
Se define como el vector de rangos medios en cada instante
![Page 68: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/68.jpg)
Non parametric Non parametric trendtrend
Estadístico 1 de tendencia de funciones Estadístico 1 de tendencia de funciones
Se define como el vector de rangos medios en cada instante
![Page 69: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/69.jpg)
Estadístico 2 de tendencia de funciones Estadístico 2 de tendencia de funciones
Cada conjunto de barras corresponde a una curva y cuenta el número de veces a lo largo del tiempo en que el rango es 1, 2, …, 17
![Page 70: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/70.jpg)
Estadístico 2 de tendencia de funciones Estadístico 2 de tendencia de funciones
Se define para cada curva
se puede interpretar como un vector de “rango” de las curvas
![Page 71: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/71.jpg)
Dinámica del comportamiento de los Dinámica del comportamiento de los lagos de la Antártida en tres años con lagos de la Antártida en tres años con diferentes condiciones climáticas diferentes condiciones climáticas
Antonio QuesadaAntonio Quesada11, , Antonio CamachoAntonio Camacho22, , Eduardo Fernández-ValienteEduardo Fernández-Valiente11, , Carlos RocheraCarlos Rochera22, Ana Justel, Ana Justel11, , Manuel ToroManuel Toro33, Eugenio Rico, Eugenio Rico11, , Manuel BañónManuel Bañón44
11Universidad Autónoma de MadridUniversidad Autónoma de Madrid22Universidad de ValenciaUniversidad de Valencia33CEDEX, Ministerio de FomentoCEDEX, Ministerio de Fomento44Instituto Nacional de MeteorologíaInstituto Nacional de Meteorología
4.4. Detección de cambios de variabilidad en series temporales para Detección de cambios de variabilidad en series temporales para predecir indirectamente el momento en que se predecir indirectamente el momento en que se congela/descongela un lago antártico, y estimar el número congela/descongela un lago antártico, y estimar el número de días con actividad biológicade días con actividad biológica
![Page 72: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/72.jpg)
Con los datos de la temperatura del agua, una serie de la que ya tenemos cinco años de historia, estimamos indirectamente cuándo se congelan los lagos en la Península Byers (Islas Shetland del Sur, Antártida)
Esta variable es muy importante porque determina el tiempo que dura el ciclo de actividad biológica
Nunca hemos estado allí para verlo
BUSCAMOS EL MOMENTO EN EL QUE SE PRODUCE EL BUSCAMOS EL MOMENTO EN EL QUE SE PRODUCE EL CAMBIO EN LA VARIABILIDAD DE LAS TEMPERATURAS DEL CAMBIO EN LA VARIABILIDAD DE LAS TEMPERATURAS DEL AGUA COMO INDICADOR DE LA CONGELACIÓNAGUA COMO INDICADOR DE LA CONGELACIÓN
Incluso este método indirecto presenta muchos problemas, la falta de energía durante algún invierno provocó fallos en los registros, la serie está llena de datos “missing” y atípicos
![Page 73: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/73.jpg)
Lago LIMNOPOLARLago LIMNOPOLAR
![Page 74: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/74.jpg)
Batimetría del Lago LIMNOPOLARBatimetría del Lago LIMNOPOLAR
Superficie estimada 22.172,5 mSuperficie estimada 22.172,5 m22
Volumen estimado 58.577,81 mVolumen estimado 58.577,81 m33
Profundidad media estimada 2,64 m.Profundidad media estimada 2,64 m.Profundidad máxima estimada 5,45 mProfundidad máxima estimada 5,45 m
![Page 75: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/75.jpg)
Cuando el lago está congelado se estima Cuando el lago está congelado se estima un incremento del 121% con respecto al un incremento del 121% con respecto al volumen normal del lagovolumen normal del lago
![Page 76: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/76.jpg)
Lake Year Thaw date Freeze date Ice-free days
Limnopolar 2002 Dec 22, 2001 Mar 26, 2002 95
Somero 2002 Dec 22, 2001 Mar 27, 2002 96
Somero 2003Jan 20, 2003Apr 10, 2003
Mar 7, 2003Apr 28, 2003
66
Somero 2004 Feb 11, 2004 Mar 23, 2004 41
![Page 77: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/77.jpg)
Utilización del fitoplacton como indicador Utilización del fitoplacton como indicador biológico para la evaluación de la biológico para la evaluación de la eutrofización en los embalses españoles eutrofización en los embalses españoles
5.5. Estimación robusta de parámetros relacionados con la Estimación robusta de parámetros relacionados con la presencia presencia de especies como bioindicadoresde especies como bioindicadores
Carlos NuñoCarlos NuñoCEDEX, Ministerio de FomentoCEDEX, Ministerio de Fomento
Caridad HoyosCaridad HoyosCEDEX, Ministerio de FomentoCEDEX, Ministerio de Fomento
Ana JustelAna JustelUniversidad Autónoma de MadridUniversidad Autónoma de Madrid
![Page 78: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/78.jpg)
UTILIZACIÓN DEL FITOPLACTON COMO INDICADOR BIOLÓGICO PARA LA EVALUACIÓN UTILIZACIÓN DEL FITOPLACTON COMO INDICADOR BIOLÓGICO PARA LA EVALUACIÓN DE LA EUTROFIZACIÓN EN LOS EMBALSES ESPAÑOLESDE LA EUTROFIZACIÓN EN LOS EMBALSES ESPAÑOLES
C. NUÑO, C. DE HOYOS, A. JUSTEL
Óptimos y rangos de tolerancia de especies fitoplactónicas
![Page 79: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/79.jpg)
u k = óptimo de la especie k
t k = tolerancia de la especie k
Yik = abundancia de la especie k en la muestra i
X i = magnitud de la variable ambiental estudiada en la muestra i
n
iik
n
iiik
k
y
xyu
1
1 2
1
1 1
2/
n
i
n
iikkikikk yuxyt
![Page 80: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/80.jpg)
¿ Box-plot o barra de error ?¿ Box-plot o barra de error ?
UTILIZACIÓN DEL FITOPLACTON COMO INDICADOR BIOLÓGICO PARA LA EVALUACIÓN UTILIZACIÓN DEL FITOPLACTON COMO INDICADOR BIOLÓGICO PARA LA EVALUACIÓN DE LA EUTROFIZACIÓN EN LOS EMBALSES ESPAÑOLESDE LA EUTROFIZACIÓN EN LOS EMBALSES ESPAÑOLES
C. NUÑO, C. DE HOYOS, A. JUSTEL
Óptimos y rangos de tolerancia de especies fitoplactónicas
clorofila
0,00
20,00
40,00
60,00
80,00
100,00
120,00
110,51126,67363,64
538,46
1351,35
130,56
Casos ponderados por nºcelulas
clorofila
0,00
2,50
5,00
7,50
10,00
12,50
Casos ponderados por nºcelulas
En la mayor parte de los casos la barra de error y el box-plot dan
el mismo resultado
Algunas especies no son consideradas indicadoras debido al amplio rango de tolerancia (barra de error)
Si utilizamos la mediana y el rango intercuartílico pasan a
ser especies indicadoras
![Page 81: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/81.jpg)
Medición del impacto de la actividad Medición del impacto de la actividad humana en los suelos de una Zona humana en los suelos de una Zona Especialmente Protegida de la AntártidaEspecialmente Protegida de la Antártida
5.5. Estimación robusta de parámetros relacionados con la Estimación robusta de parámetros relacionados con la presencia presencia de especies como bioindicadoresde especies como bioindicadores
Pablo TejedoPablo Tejedo11, , Ana JustelAna Justel22, , Eugenio RicoEugenio Rico11, , Javier BenayasJavier Benayas11, , Antonio QuesadaAntonio Quesada33
11Departamento de Ecología, UAMDepartamento de Ecología, UAM22Departamento de Matemáticas, UAMDepartamento de Matemáticas, UAM33Departamento de Biología, UAMDepartamento de Biología, UAM
![Page 82: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/82.jpg)
• Estudio del impacto de los investigadores de la Estudio del impacto de los investigadores de la expedición LIMNOPOLARexpedición LIMNOPOLAR
• Lugar: Península Byers, SPA Nº. 126, Livingston Lugar: Península Byers, SPA Nº. 126, Livingston Island, Archipiélago South Shetland. AntártidaIsland, Archipiélago South Shetland. Antártida
• El principal objetivo es contrastar la El principal objetivo es contrastar la efectividad de las recomendaciones que efectividad de las recomendaciones que hace el SCAR para minimizar el impacto hace el SCAR para minimizar el impacto ambiental que causan las expediciones ambiental que causan las expediciones científicascientíficas
• Modelo para la gestión de los campamentos o del turismo que aumenta cada año a un ritmo exponencial
![Page 83: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/83.jpg)
Relacionan el nivel de uso de un sendero (estimado en pisadas) con su degradación física y biológica
La efectividad de los indicadores se prueba en dos zonas experimentales de suelo no pisado, bajo condiciones controladas. Las medidas obtenidas con diferentes intensidades de uso muestran la evolución de los indicadores en función del número de pisadas.
II11- - ABUNDANCIA DE FAUNA EDÁFICAABUNDANCIA DE FAUNA EDÁFICA
II22 - - RESISTENCIA A LA COMPACTACIÓNRESISTENCIA A LA COMPACTACIÓN
II33 - - DENSIDAD APARENTEDENSIDAD APARENTE
Indicadores de impacto
![Page 84: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/84.jpg)
Los tres indicadores muestran que el impacto siempre crece cuando aumenta el número de pisadas
Indicadores de impacto
![Page 85: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/85.jpg)
Los tres indicadores muestran que el impacto siempre crece cuando aumenta el número de pisadas El indicador de fauna edáfica es susceptible de sufrir los efectos de una distribución patching de las especies
Indicadores de impacto
![Page 86: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/86.jpg)
Los tres indicadores muestran que el impacto siempre crece cuando aumenta el número de pisadas El indicador de fauna edáfica es susceptible de sufrir los efectos de una distribución patching de las especies
Existe una alta correlación entre las medidas de densidad aparente y resistencia a la compactación. La densidad aparente no proporciona información relevante que no proporcione la resistencia a la compactación, mucho más sencilla de medir
Use level
Resistance to compre
Apparent density
Indicadores de impacto
![Page 87: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/87.jpg)
Use level
54321
Re
sis
tan
ce
to
co
mp
ressio
n
7
6
5
4
3
2
1
0
-1
ANOVA ANOVA pp-valor < 0,0001-valor < 0,0001
No hay No hay diferencias diferencias
significativassignificativas
La presencia de los investigadores supone un impacto estadísticamente significativo sobre los frágiles suelos antárticos, aunque la alteración no es estadísticamente apreciable con un uso ocasional de nivel 2
![Page 88: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/88.jpg)
Tent
4,03,02,01,00,0-1,0
Resis
tance t
o c
om
pre
ssio
n
Entrance path
4,03,02,01,00,0-1,0
River path
4,03,02,01,00,0-1,0
Camp path
4,03,02,01,00,0-1,0
>4,5>4,5>4,5
Exit path
4,03,02,01,00,0-1,0
El impacto y la capacidad de recuperación a corto plazo (del suelo depende del nivel de uso al que haya sido sometido el sendero. Los cambios en la capa activa del permafrost pueden influir en la regeneración
![Page 89: Propuestas de una estadística moderna en estudios relacionados con el cambio climático Ana Justel](https://reader035.vdocuments.site/reader035/viewer/2022062804/56814a3e550346895db75a75/html5/thumbnails/89.jpg)
Muchas gracias
Agradecimiento a mis coautores Andrés Alonso
Manuel Bañón Javier Benayas José Ramón Berrendero Antonio Camacho Eduardo Ferdz-Valiente Ricardo Fraiman Adolfo Hernández Caridad Hoyos Pamela Llop Carlos Nuño Antonio Quesada Eugenio Rico Carlos Rochera Marcela Svarc Pablo Tejedo Manuel Toro