mejor solución no siempre es la misma: 1) trabajar con datos incompletos … · 2008-10-22 · pp:...
TRANSCRIPT
PP: gran cantidad de faltantes
Mejor solución no siempre es la misma:
1) Trabajar con datos incompletos (ojo con no sesgar la serie!!)
2) Completar con algún método
Definición: Homegeneidad
2 estaciones A y B
Est A Est BA1 b1A2 b2..
..Aj bj
An bnAn+1....
A = Σ AiB = Σ bi en el período coincidente
Qi = bi/Ai
A y B son homogéneas cuando:
σ (Q) < σ (A) y σ (Q) < σ (B)
Primer método de estimación de faltantes
Condición: A y B homogéneasbj: faltante
Est A Est BA1 b1A2 b2..
..Aj bj
An bnAn+1....
A = Σ AiB = Σ bien el período coincidente sin contar ni Aj ni bj
Q = B/A
bj se estima como:
bj = Aj Q
Segundo método de estimación de faltantes
Idea: Establecer si las 2 estaciones están relacionadas a través de una relación linealY cuantificar esa relación
Método de las mínimos cuadradosP2 E1b
y = 3,2052+0,4978*x
4 6 8 10 12 14 16 18 20 22 24 26
x
2
4
6
8
10
12
14
16
18
20
y
x:y: r2 = 0,3897; r = 0,6243| p = 0,0015; y = 3,20524017 + 0,497816594*x
Estacion B = bo +b1 Estación A
Pendienteb1 =(Σxi yi –n xm ym)/(Σxi2 – n xm2)
Ordenada al origen
Estacion B
Estación A
P2 E1by = 3,2052+0,4978*x
4 6 8 10 12 14 16 18 20 22 24 26
x
2
4
6
8
10
12
14
16
18
20
y
x:y: r2 = 0,3897; r = 0,6243| p = 0,0015; y = 3,20524017 + 0,497816594*x
SSE
SSRSST
SST = SSR + SSE
Suma total de los cuadrados
ΣΣ(yi-ym)2
Suma de los cuadrados debida a la regresiónΣ(Ŷ-ym)2
Suma de los cuadrados de errorNo explicado por la recta
Σ (yi-Ŷ)2
Ŷ= b1 x * bo
Cómo sabemos si el ajuste es bueno?????
Coeficiente de determinación: mide la proporción de la variación que esexplicada por la variable independiente del modelo
R2 = SSR/SST = 1 – SSE/SST
Ejemplo:
R2 = 0.91 indica que el modelo lineal entre Y y X explica un 91% de la variabilidad de Y.
TEST DE SIGNIFICANCIA
1) TEST NORMAL. R ~ N(0 ; 1/(N-2)1/2 )
R > 1.96/ (N-2)1/2 SIGNIFICATIVO CON 95% DE CONFIANZA
R > 2.58/ (N-2)1/2 SIGNIFICATIVO CON 99% DE CONFIANZA
2) Test T Ho : R=0T = ( R (n-2) ½) / (1-R2)
Cuándo puede usarse para el caso de relaciones no lineales??
y = c edx
Ln y = ln c + d x lneLn y = ln c + d x
Llamando:Y´ = ln yb = ln c
Y´= b + d x es una relación lineal
También pueden usarse ajustes no lineales
Con Excel:
GraficoDispersionAgregar línea de tendenciaLineal (o cualquier otro ajuste)Mostrar ecuación y R
Con STATISTICA:
StatisticsMultiple regresion
Resultados:R2 porcentaje de varianza explicada por la rectaF = SSR/SSE debe ser lo más grande posible para que el ajuste sea buenoP debe ser menor que el nivel de significancia con el que se quiere trabajarCoeficientes B: ordenada al origen y pendiente y los respectivos test para ver si difieren de cero.
Tercer método de estimación de faltantes
Se cuenta sólo con la serie A y falta un dato intermedio.
P2 E1by = 3,2052+0,4978*x
4 6 8 10 12 14 16 18 20 22 24 26
x
2
4
6
8
10
12
14
16
18
20
y
x:y: r2 = 0,3897; r = 0,6243| p = 0,0015; y = 3,20524017 + 0,497816594*x
Estacion A = bo +b1 TiempoEstación A
Tiempo
Solo interpolación!!!Ojo extrapolación!!
Reducción de Promedios a Períodos de igual Longitud
Est A Est BA1 b1A2 b2..
..Aj bj
An bnAn+1..An+k..
Estimar el promedio de B para n+k años:
Período coincidente: hasta año n
A1 = Σ Ai/n promedio primeros n años
B1 = Σ bi/n promedio primeros n años
Q = B / A
A2 = Σ Ai/(n+k) promedio n+k años
Estimo:
B2 = Σ bi/(n+k) = Q A2
VARIABILIDAD MEDIA = Σ ІAi – ĀІ / n
VARIABILIDAD SECUENCIAL = Σ ІAi – Ai-1І / (n-1)
VARIABILIDAD RELATIVA = VARIABILIDAD SECUENCIAL / Ā
Ai precipitación en el tiempo i; serie temporal de n términos
Análisis de variabilidad de la precipitación:
Indice de pluviosidad implica realizar la siguiente transformación:
Pi = pi /Pmedia * 100 porcentaje de la precipitación normal esperada
Pj > 100 pp superiores a las normales
Pj < 100 pp inferiores a las normales
Método de los Quintiles para precipitación mensual
Se necesita tener una muestra de datos ordenada
-------------------------------------------------------------------------------- pp
20% 40% 60% 80% 100%
Quintil1
Percentil 20
Quintil 4
Percentil 80
Quintil 3
Percentil 60
Quintil 2
Percentil 40
Extsubnormal sub normal sobre Ext sobre
Ver: ejemplosparaclase.xls
Pagina PPMENSUAL
Ejercicio 11
Método de los Quintiles para precipitación diaria
N días en total N-k días con pp
Método de los quintiles
OJO!!! Distinguir pp nula de dato faltante
Ver: ejemplosparaclase.xls
Pagina PPDIARIA
Ejercicio 12
AJUSTE POR FUNCIONES DE PROBABILIDAD
Cálculo de probabilidades
Con serie original de datos: HistogramaOjiva
Si la distribución es simétrica: ajuste NORMAL
Si no es simétrica: transformación: LOG NORMAL
Ejercicio 13 y 17
Ejercicio 14 y 15
probabilidad
ojiva
pp
Para variables positivas: precipitación, presión de vapor, evaporación, agua precipitable
Distribución GAMMA : X tiene distribución γ (α ; β) cuando la función de densidad probabilística es:
F (x) = 1 / β α Г(α) x α-1 e -x/β
Donde
Г es la función gamma
Α = (1 + (1+4/3 A)1/2) / 4 A
α= ln (xmedio) – Σ(ln x) / n
β = xmedio /α
Planilla de cálculo de distribución gamma: AJUSTEGAMMA.XLS
Calcula ln (pp), parámetros α y β,Probabilidad con la función DISTR.GAMMA (x; α; β; Argumento)Argumento = verdadero probabilidad acumuladaArgumento = falso función de densidad
Si se conocen los parámetros de la distribución, se puede estimar el valor de pp por debajo del cual caen los valores con un determinado nivel de probabilidad:
DIST.GAMMA.INV (probabilidad; α; β)
probabilidad
Función de distribución acumulada
ppx
Ajuste por distribución Normal y Log Normal:
**** Con Excel:
DISTR.NORMAL (x; media; desvío; Argumento)
DISTR.LOG.NORMAL (x; media; desvío)
**** Con STATISTICA:
StatisticDistribution Fitting
Elegir la distribución
Da las frecuencias observadas y las esperadas con el ajuste
Período de retorno: es el tiempo promedio (en años) esperado para la repetición de determinado evento
Un suceso que ocurre m veces en n años tiene probabilidad de ocurrencia:
P = m/n
El intervalo medio entre sucesivas recurrencias será el período de retorno:
T = n/m = 1/P
Ejemplo:
Si existe un 2% de riesgo de que se produzca una tormenta intensa quiere decir que
P(tormenta intensa) =0.2
T = 1/0.2 = 50 años
Esto no quiere decir que la tormenta se produzca regularmente cada 50 años sinoque en un período largo (por ejemplo 500 años), es posible que la tormenta serepita 10 veces!!!!
Probabilidad de excedencia:
Probabilidad de que, dado un determinado período de retorno T, o bien la probabilidad p de determinado evento (p= 1/T), el mismo ocurra al menos una vez en el intervalo de tiempo de n años:
P (T,n) = 1 – (1- 1/T) n
Ejemplo:
cuál es la probabilidad de que una tormenta cuyo período de retorno es 50 años, ocurra al menos 1 vez en los próximos 5 años:
P(50; 5) = 1- (1- 1/50)5 = 0.096 = 9.6%
INTENSIDAD DE UNA TORMENTA
Es la cantidad de lluvia caída en un intervalo de tiempo dado
Para analizar la evolución de una tormenta se toman intervalos cada vez más
pequeños y se compara la intensidad.Intensidad (mm/h)
tiempo
hietograma
Pico de intensidad en un intervalo de tiempo:
Máximo cambio de precipitación en ese intervalo durante toda la tormenta
Ejemplo:
Tiempo (min) pp(mm)
5 110 715 1520 625 330 2
Total de pp caída en la tormenta:1+7+15+6+3+2 = 34 mm
Tiempo de duración de la tormenta:30 minutos
Pico de intensidad para 5 min:El máximo es que entre 10 y 15 min llovieron 15 mm:15mm/5min = 180 mm/h
Pico de intensidad en 10 minutos:Tiempo(min) 10 20 30Pp (mm) 8 21 521mm/10min = 126 mm/h
Intensidad media de la tormenta:Pptotal/tiempo total = 34 mm/30min = 68 mm/h