medidas de variabilidad
DESCRIPTION
Medidas de VariabilidadTRANSCRIPT
¿Los tres grupos tienen igual media?
¿Los tres grupos tienen características similares?
MEDIDAS
DE VARIABILIDAD
VARIABILIDAD
•Es la medida de las diferencias que presentan los datos entre si. • Para medirla se aprovecha el echo, que si los datos son semejantes entre si, están más cerca a la media aritmética, entonces se dice que tienen poca variabilidad ó que son homogéneos. • Por el contrario si son muy diferentes entre si, estarán muy dispersos respecto a la media aritmética y se dice de ellos que son muy variables o que son heterogéneos. • ES PREFERIBLE SIEMPRE QUE LOS DATOS SEAN HOMOGÉNEOS
LAS MEDIDAS DE VARIABILIDAD O DISPERSION SON AQUELLAS QUE MIDEN EL GRADO DE SEPARACION DE LOS DATOS CON RESPECTO A UN VALOR CENTRAL.
LAS PRINCIPALES MEDIDAS DE DISPERSION SON: EL RANGO (R) EL RANGO INTERCUARTILICO (RI) EL RANGO INTERPERCENTILICO (RIP) LA VARIANZA [ V(X) ó S2(X) ] LA DESVIACION ESTANDAR [S(X)] COEFICIENTE DE VARIACION [ CV(X) ]
EL RANGO (R)
El Rango de variación o recorrido de una serie de datos, esta representado por la diferencia entre sus valores máximo y mínimo.
R = Xmáx – Xmín Donde: Xmáx : Valor Máximo Xmín : Valor Mínimo
EL RANGO INTERCUARTILICO (RI) Es la diferencia entre el tercer cuartil y el primer cuartil.
RI = Q3 – Q1
El Rango Intercuartilico es una medida que excluye el 25% más alto y el 25% más bajo, dando un rango dentro del cual se encuentra el 50% de datos centrales, lo que evita el efecto causado por valores extremos. Si el rango intercuartilico es muy pequeño entonces indica alta uniformidad o pequeña variación de los valores centrales.
EL RANGO INTERPERCENTILICO (RIp)
Es una medida que se calcula en base a los percentiles respectivos. Por ejemplo si queremos calcular el Rango interpercentilico del 80% de datos centrales tendremos que:
RI80 = P90 – P10 Si se desea hallar el Rango interpercentilico del 90% de datos centrales, tendremos que:
RI90 = P95 – P5
LA VARIANZA
* VARIANZA POBLACIONAL
a) DATOS NO AGRUPADOS: N
NXXV
N
ii
2
1
2
)(
b) DATOS AGRUPADOS: N
NfXXV
i
k
ii
2
1
2
)(
Xi : i-ésima observación N: total de observaciones :media poblacional
Xi : marca de clase fi : frecuencia absoluta k: número de intervalos
* VARIANZA MUESTRAL
a) DATOS NO AGRUPADOS:
1
2
1
2
2
n
XnXS
n
ii
b) DATOS AGRUPADOS:
1
2
1
2
2
n
XnfXS
i
k
ii
Xi : i-ésima observación n: total de datos de la muestra : media muestral
X
Xi : marca de clase fi: frecuencia absoluta k: número de intervalos
LA DESVIACION ESTANDAR
La varianza se mide en unidades al cuadrado, por ejemplo si los datos están expresados en metros, la varianza se medirá en metros al cuadrado. Esto trae dificultades para la interpretación de los resultados obtenidos. Es por ello que en ocasiones se prefiere el uso de la Desviación Estándar, definido como:
Desviación Estándar Poblacional: )(XV Desviación Estándar Muestral:
2ss
INTERPRETACION:
El valor numérico de la varianza y la desviación estándar cuantifican el grado de dispersión de los valores de la variable respecto a su media, es por ello que a mayor variabilidad o dispersión le correspondera una mayor varianza o una mayor desviación estándar.
EJEMPLO1:
HALLAR LA VARIANZA Y DESVIACIÓN ESTÁNDAR DE: 17, 19, 19, 19, 19, 18, 18, 20, 21, 19, 18, 17, 20, 20, 17 X X2
17 289
19 361
19 361
. .
. .
x
2x
495.114
7333.18x155285S
5285X
7333.1815
281x281X
22
2
n=15
22.1495.1S * La dispersión de los datos respecto a la media es 1.22
1
2
1
2
2
n
XnXS
n
ii
EJEMPLO2:
HALLAR LA VARIANZA Y DESVIACION ESTANDAR PARA LA SIGUIENTE DISTRIBUCIÓN DE DATOS:
INTERVALOS Xi fi
[0 , 3 > 1.5 2
[3 , 6 > 4.5 3
[6 , 9 > 7.5 5
[9 , 12 > 10.5 4
[12 , 15 > 13.5 1
INTERVALOS Xi fi
[ 0 – 3> 1.5 2 3 4.5
[ 3 – 6> 4.5 3 13.5 60.75
[ 6 – 9> 7.5 5 37.5 281.25
[ 9 – 12> 10.5 4 42 441
[ 12 – 15> 13.5 1 13.5 182.25
TOTAL n =15 109.5 969.75
ii fX i2i fX
17.1214
3.7x1575.969S
3.715
5.109x
22
49.317.12S
1
2
1
2
2
n
XnfXS
i
k
ii
PROPIEDADES DE LA VARIANZA 1) V(X)>0 (la varianza siempre es positiva)
2) Si c es una constante entonces: V(c)=0
3) Si Y=X+c entonces: V(Y) = V(X+c) = V(X)
4) Si Y=bX entonces: V(Y) = V(bX) = b2 V(X)
5) Si Y=bX+c entonces: V(Y) = V(bX+c) = b2V(X)
EJEMPLO: Si V(X)= 2 , C = 5 y b = 3
Si Y = X+5 entonces V(Y) = V(X+5) = V(X) = 2 Si Y = 3X entonces V(Y) = V(3X) = 32 V(X) = 9x2 = 18 si Y = 3X+5 entonces V(Y) = V(3X+5) = 32 V(X) = 9x2 =18
EL COEFICIENTE DE VARIACION
Es una medida de variación relativa (adimensional) puesto que no tiene unidades, lo que permite poder usarla cuando se desean comparar grupos de datos con diferentes unidades de medida, o grupos de datos con diferentes medias. Se calcula mediante la siguiente formula:
CV (X) = S
X
CV (X) % = S
X
x100 también:
CRITERIOS PARA COMPARAR LA VARIABILIDAD DE DOS O MAS GRUPOS DE DATOS
CASO1 A
SA
AX
B
SB
BX
A
XB
XSi y son iguales o aproximada- mente iguales y expresadas en las mismas
unidades, entonces usar la desviación estándar para la comparación. Esto es, la que tenga menor desviación estándar será el grupo más homogéneo.
CASO2 A B
SA
AX
SB
BX
Si AX
BXy no son iguales y los datos
presentan diferentes unidades, entonces usar el coeficiente de variación para la comparación.Esto es, el que tenga menor menor coeficiente de variación será el grupo más homogéneo.
UNIDADES DE MEDIDA IGUALES
UNIDADES DE MEDIDA DIFERENTES
“MEDIAS IGUALES”
desviación estándar
Coeficiente de variabilidad
“MEDIAS DIFERENTES”
Coeficiente de variabilidad
Coeficiente de variabilidad
En resumen si los grupos tienen:
EJEMPLO: Un Administrador debe decidir la compra de una de dos máquinas, tiene la siguiente información con respecto al tiempo diario que requiere cada máquina para su mantenimiento.
Promedio Varianza
Máquina A 27 min 4.5 min2
Máquina B 35 min 5 min2
Utilizando la medida de variabilidad adecuada.Cuál de las dos máquinas tiene menos variabilidad en cuanto al tiempo de mantenimiento?
Solución: Dado que las unidades es la misma para ambos grupos pero las medias no son iguales,entonces utilizamos el coeficiente de variación para comparar
CVA = 275.4
A
A
XS
= = 0.07856 CVB = B
B
XS
= 35
5 = 0.06388
ó 7.86 % ó 6.39 %
Entonces la máquina B es menos variable.
VARIANZA TOTAL
Se utiliza cuando se desea hallar la varianza de dos o más grupos reunidos en uno solo, donde cada grupo interviene con su respectiva varianza y su respectivo número de datos (es una especie de varianza ponderada).
2
T
i
2k
1i
ii
T xn
)sx(n V
2
k: número de grupos ni: tamaño del i-ésimo grupo n: tamaño total
MEDIDAS DE FORMA Es una medida que nos determina la forma de una distribución de datos como un primer paso al estudio de esta. Se estudiará la deformación de una distribución tanto en el sentido horizontal como vertical con respecto a la forma de la curva normal.
I. ASIMETRÍA
La asimetría o sesgo es el grado de deformación horizontal de una distribución, con respecto a la distribución normal.
Asimetría Negativa: cuando la“cola”más larga de la distribución está a la izquierda, esto significa que el grueso de los datos están concentrados a la derecha. Asimetría Positiva: cuando la“cola”más larga de la distribución está a la derecha, esto significa que el grueso de los datos están concentrados a la izquierda.
Para medir la Asimetría de una distribución se emplea el coeficiente de Pearson:
S
)MeX(3Ak
Si Ak = 0 se tiene simetría perfecta Si Ak >0 se tiene asimetría positiva Si Ak <0 se tienen asimetría negativa
EJEMPLO: encuentre la forma de una distribución con media igual a 7.87, mediana igual a 7.80 y desviación estándar 1.293
Ak = 3(7.87- 7.80)
1.293 = 0.162
Ak = 0.162 > 0 se tiene una asimetría positiva
(distribución con cola a la derecha)
II. CURTOSIS
Analiza la deformación vertical de una distribución de datos respecto a la normal, es decir el grado de elevación o apuntamiento de la curva. Para medir la Curtosis se emplea el coeficiente de curtosis:
)PP(2
PPK
1090
2575U
El coeficiente de curtosis se compara con un valor referencial “0.263” de la siguiente manera, si:
KU > 0.263 la distribución es Leptocúrtica (Distribución Elevada)
KU = 0.263 la distribución es Mesocúrtica (Distribución Normal)
KU < 0.263 la distribución es Platicúrtica (Distribución Aplanada)
EJEMPLO: evalue la curtosis para una distribución con: P75 = 8.8 P25 = 7.0 P90 = 9.7 P10 = 6.1
Ku = 8.8 – 7.0
2 (9.7 – 6.1) = 0.25
Ku = 0.25 < 0.263 entonces se tiene una distribución Platicúrtica
(aplanada)