nociones de estadística 2015 - climatología...
TRANSCRIPT
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Nociones de Estadística 2015Climatología 2015
Departamento de Ciencias de la AtmósferaUniversidad de la República, Uruguay.
Setiembre 2015
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 1 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Contenido
1 Tipos de datos
2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión
3 Anomalías
4 Técnicas gráficas de visualización
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 2 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Contenido
1 Tipos de datos
2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión
3 Anomalías
4 Técnicas gráficas de visualización
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 3 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Datos Climáticos
Observaciones (datos medidos; datos interpolados)
Salidas de modelos numéricos: Simulaciones opronósticos (posibilidad de variar condiciones inicialeso de borde)
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 4 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Datos Climáticos
Observaciones (datos medidos; datos interpolados)
Salidas de modelos numéricos: Simulaciones opronósticos (posibilidad de variar condiciones inicialeso de borde)
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 4 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Contenido
1 Tipos de datos
2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión
3 Anomalías
4 Técnicas gráficas de visualización
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 5 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Tipos de parámetros para caracterizar una serie
Posición: dividen un conjunto ordenado de datos engrupos con la misma cantidad de individuos.
Centralización: se refiere a valores respecto a loscuales parecen agruparse los datos.
Dispersión: indican mayor o menor concentración delos datos alrededor del valor central.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 6 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Tipos de parámetros para caracterizar una serie
Posición: dividen un conjunto ordenado de datos engrupos con la misma cantidad de individuos.
Centralización: se refiere a valores respecto a loscuales parecen agruparse los datos.
Dispersión: indican mayor o menor concentración delos datos alrededor del valor central.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 6 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Tipos de parámetros para caracterizar una serie
Posición: dividen un conjunto ordenado de datos engrupos con la misma cantidad de individuos.
Centralización: se refiere a valores respecto a loscuales parecen agruparse los datos.
Dispersión: indican mayor o menor concentración delos datos alrededor del valor central.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 6 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Resistencia
Un método es resistente si no es influidoconsiderablemente por unos pocos datos atípicos(“outliers”).
Ejemplo:
0 0.5 1 1.5 2 2.5
x 104
−25
−20
−15
−10
−5
0
5
10
15
20
25
car
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 7 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Resistencia
Un método es resistente si no es influidoconsiderablemente por unos pocos datos atípicos(“outliers”).
Ejemplo:
0 0.5 1 1.5 2 2.5
x 104
−25
−20
−15
−10
−5
0
5
10
15
20
25
car
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 7 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Medidas de posición
1 Tipos de datos
2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión
3 Anomalías
4 Técnicas gráficas de visualización
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 8 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Medidas de posición
Medidas de posición
Se llama Pr (percentil r) a un valor tal que el r % de lasobservaciones son iguales o menores que él y el (100 %-r %)de las observaciones son mayores a él.
Algunos percentiles importantes:
P50: separa al 50 % de los valores menores del 50 % de lasobservaciones mayores:
q0,5 =
{X(n+1)/2, si es impar(Xn/2 + X(n/2+1))/2, si es par
Cuartiles: Separa al conjunto ordenado de observacionesen 4 partes iguales , cada una de ellas formada por un25 % de los valores.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 9 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Medidas de posición
Medidas de posición
Se llama Pr (percentil r) a un valor tal que el r % de lasobservaciones son iguales o menores que él y el (100 %-r %)de las observaciones son mayores a él.
Algunos percentiles importantes:
P50: separa al 50 % de los valores menores del 50 % de lasobservaciones mayores:
q0,5 =
{X(n+1)/2, si es impar(Xn/2 + X(n/2+1))/2, si es par
Cuartiles: Separa al conjunto ordenado de observacionesen 4 partes iguales , cada una de ellas formada por un25 % de los valores.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 9 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Medidas de posición
Medidas de posición
Se llama Pr (percentil r) a un valor tal que el r % de lasobservaciones son iguales o menores que él y el (100 %-r %)de las observaciones son mayores a él.
Algunos percentiles importantes:
P50: separa al 50 % de los valores menores del 50 % de lasobservaciones mayores:
q0,5 =
{X(n+1)/2, si es impar(Xn/2 + X(n/2+1))/2, si es par
Cuartiles: Separa al conjunto ordenado de observacionesen 4 partes iguales , cada una de ellas formada por un25 % de los valores.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 9 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Medidas de posición
Ejemplo: Calcular el percentil 50 (mediana)
Serie: [13 3 7 2 9 10 2 6 4 0 9 1 5]
Paso 1- ordenar de manera ascendente:
[0 1 2 2 3 4 5 6 7 9 9 10 13]
Paso 2- Ver si la cantidad de componentes de la serie espar o impar
Paso 3- Calcular la mediana con la fórmula anterior.
En este caso es 5.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 10 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Medidas de posición
Ejemplo: Calcular el percentil 50 (mediana)
Serie: [13 3 7 2 9 10 2 6 4 0 9 1 5]
Paso 1- ordenar de manera ascendente:
[0 1 2 2 3 4 5 6 7 9 9 10 13]
Paso 2- Ver si la cantidad de componentes de la serie espar o impar
Paso 3- Calcular la mediana con la fórmula anterior.
En este caso es 5.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 10 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Medidas de posición
Ejercicio
Para la serie [13 3 7 2 9 10 2 6 4 0 9 1 5 100]
Calcular:MedianaPercentil 25Percentil 75
Son estas medidas resistentes?
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 11 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Centralización
1 Tipos de datos
2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión
3 Anomalías
4 Técnicas gráficas de visualización
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 12 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Centralización
Centralización
Esta medida nos permite identificar y ubicar el valoralrededor del cual se tienden a reunir los datos (“PuntoCentral”).
Media: promedio.Mediana: valor que cumple que la mitad de los datosson menores y la otra mitad son mayores.Moda: valor que mas veces se repite en los datos; silos que más se repiten son 2 valores, se llamabimodal, si son varios, multimodal.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 13 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Centralización
Ejemplo
Tengo las siguiente muestra:
[30 20 27 22 21 18 18 25 26 20]
[0 20 27 22 21 18 18 25 26 20]
• Buscar media y moda
• Son estas medidas resistentes?
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 14 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Centralización
Media Vs. Mediana
Coinciden si la distribución es simétrica
Si no coinciden, es preferible la mediana (por ser masresistente, es decir, poco sensible a datos atípicos)
La media siempre es única (a diferencia de la mediana)
La media es muy representativa para algunas variablescomo temperatura media mensual pero no esrepresentativa en otras variables como precipitaciónmensual.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 15 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Centralización
Media Vs. Mediana
Coinciden si la distribución es simétrica
Si no coinciden, es preferible la mediana (por ser masresistente, es decir, poco sensible a datos atípicos)
La media siempre es única (a diferencia de la mediana)
La media es muy representativa para algunas variablescomo temperatura media mensual pero no esrepresentativa en otras variables como precipitaciónmensual.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 15 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Centralización
Media Vs. Mediana
Coinciden si la distribución es simétrica
Si no coinciden, es preferible la mediana (por ser masresistente, es decir, poco sensible a datos atípicos)
La media siempre es única (a diferencia de la mediana)
La media es muy representativa para algunas variablescomo temperatura media mensual pero no esrepresentativa en otras variables como precipitaciónmensual.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 15 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Centralización
Media Vs. Mediana
Coinciden si la distribución es simétrica
Si no coinciden, es preferible la mediana (por ser masresistente, es decir, poco sensible a datos atípicos)
La media siempre es única (a diferencia de la mediana)
La media es muy representativa para algunas variablescomo temperatura media mensual pero no esrepresentativa en otras variables como precipitaciónmensual.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 15 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Medidas de dispersión
1 Tipos de datos
2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión
3 Anomalías
4 Técnicas gráficas de visualización
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 16 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Medidas de dispersión
Medidas de dispersión
Nos dicen en que medida las observaciones difieren entre si.
Rango: menor-mayor valor
Rango intercuartil (IQR): es la distancia entre el primer ytercer cuartil
Varianza: promedio del cuadrado de las distancias entre cadavalor y la media.
Var = 1N∑
(xi − µ)2
Siendo µ la media y N la cantidad de Valores
Desviación estandar: raíz cuadrada de la varianza (σ)
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 17 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Medidas de dispersión
Medidas de dispersión
Nos dicen en que medida las observaciones difieren entre si.
Rango: menor-mayor valor
Rango intercuartil (IQR): es la distancia entre el primer ytercer cuartil
Varianza: promedio del cuadrado de las distancias entre cadavalor y la media.
Var = 1N∑
(xi − µ)2
Siendo µ la media y N la cantidad de Valores
Desviación estandar: raíz cuadrada de la varianza (σ)
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 17 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Contenido
1 Tipos de datos
2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión
3 Anomalías
4 Técnicas gráficas de visualización
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 18 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Anomalías
¿Cómo se definen usualmente las anomalías en estudiosdel clima?
Las anomalías se definen con respecto al ciclo anual.
Por ejemplo, para datos medios mensuales, el ciclo anualse define como el promedio de todos los eneros,febreros, etc, del período del registro.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 19 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Anomalías
¿Cómo se definen usualmente las anomalías en estudiosdel clima?
Las anomalías se definen con respecto al ciclo anual.
Por ejemplo, para datos medios mensuales, el ciclo anualse define como el promedio de todos los eneros,febreros, etc, del período del registro.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 19 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Anomalías
¿Cómo se definen usualmente las anomalías en estudiosdel clima?
Las anomalías se definen con respecto al ciclo anual.
Por ejemplo, para datos medios mensuales, el ciclo anualse define como el promedio de todos los eneros,febreros, etc, del período del registro.
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 19 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Ejemplos
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 20 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Ejemplos
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 21 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Contenido
1 Tipos de datos
2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión
3 Anomalías
4 Técnicas gráficas de visualización
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 22 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Ejemplo: Gráfico de lineas
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 23 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Ejemplos: Histogramas
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 24 / 25
Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización
Ejemplos
Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 25 / 25