análisis estadístico de datos...
TRANSCRIPT
Análisis Estadístico de
Datos Climáticos
Análisis Estadístico de
Datos Climáticos
2015
Análisis exploratorio de datos univariados
DATOS UNIVARIADOS
Robustez y Resistencia
Medidas numéricas de localización, dispersión, asimetría ….
Técnicas gráficas
Distribuciones
…………..
Transformaciones
Anomalías
Hace 8 ºC afuera, ¿está frío?
En general se definen respecto del ciclo anual(o eventualmente el ciclo diario si fuera el caso)
Es entonces el promedio de la variable para cada mes.
Dónde, a qué hora, en qué estación del año, etc.
z=x-mean(x)
z=x-mean(x,2)*ones(1,ax)
Dim
[lx,ax]=size(x)
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 20000
0.5
1
1.5
2
2.5
3
3.5
4x 10
10 20 30 40 500
0.5
1
1.5
2
x 105
Caudales
Ciclo anual
Semanas
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 20000
0.5
1
1.5
2
2.5
3
3.5
4x 10
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
3x 10
5 Anomalías
Anomalías estandarizadas
Z no tiene unidades
Z tiene media 0 y desviación estándar 1
Esto facilita compara variables diferentes
z=(x-mean(x))/std(x)z=(x-mean(x,2)*ones(1,ax))./(std(x,0,2)*ones(1,ax))
Dim
Flag (N-1 o N)
[lx,ax]=size(x)
DATOS APAREADOS
Dos series de datos simultáneas(misma variable en distintos puntos o diferente variable en mismo punto)
de los que quiere explorar si hay alguna relación
Diagramas de dispersión (“scatter plots”)
Correlaciones de Pearson
Correlaciones de Spearman (rango)
Diagrama de dispersión
Un punto por instante de tiempo, una variable en cada eje: plot(x,y,’+’)Da una primera idea de la relación entre las variables, o su ausencia
100 200 300 400 500 600 700 800 900 10000
5
10
15
20
25
30
35
Radiación W/m2
Te
mp
era
tura
ºC
Correlación de Pearson
Cociente de las covarianzas entre el producto de las desviaciones estándar, adimensionado
Operando, queda el promedio de las anomalías estandarizadas
corr(x,y)
Correlación de Pearson
Indica la fracción de la varianza de una de las dosvariables que está descrita linealmente por la otra
No es ni robusta (caracteriza relaciones lineales)ni resistente (sensible a outliers)
Correlación de Spearman (de rango)
Consiste en hacer lo mismo que en Pearson pero a los rangos de los datos.
Como los números son naturales, haciendo cuentas, se puede expresar la correlación como:
Donde
Es robusta y resistente
corr(x,y,’Type’,’Spearman’)
Correlación de Spearman (de rango)
Así como Pearson captura la relación lineal, Spearman captura una relación monotónica
r_Pearson=0.85
r_Spearman=1
0 1 2 3 4 5 6 70.5
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
DATOS APAREADOS CONSIGO MISMO
AUTOCORRELACIONES desfasados(Podrían estudiarse también correlaciones desfasadas -“lagged”- entre variables distintas)
Se calcula:
Pero es simplemente la correlación (usualmente, pero no necesariamente, de Pearson) entre la serie y sí misma con un corrimiento de un lugar.
Caso de i=1, …. n
Funciones de Auto-correlaciónLo mismo que antes pero en función del desfasaje, por lo que obtengo una función
Para cualquier k, puedo calcular la auto-correlación con desfasaje k, ojo que a medida que k aumenta cada vez tengo menos datos.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15-0.2
0
0.2
0.4
0.6
0.8
Lag
Sam
ple
Au
toc
orr
ela
tio
n
Sample Autocorrelation Function
autocorr(x)
Funciones de Auto-correlación
Horas
Tiempo de persistencia (tal que autocorrelación = e-1): 7.5 horas
Módulo Viento
0 6 12 18 24 30 36 42 48-0.2
0
0.2
0.4
0.6
0.8
Lag
Sam
ple
Au
toco
rrela
tio
n
Sample Autocorrelation Function
Funciones de Auto-correlación
Lo mismo pero a 48 horas
Funciones de Auto-correlación
Caso de sin(ti) i=1, …. N
Hago integral en períodos completos para simplificar
¿Caso de cos(ti) i=1, …. N ?