medidas de variabilidad
Post on 28-Dec-2015
26 Views
Preview:
TRANSCRIPT
Medidas de Dispersión o Variabilidad
¿Qué tan separados están nuestros datos?
¿Qué tan "desparramados" están los datos?
Estas medidas nos permiten analizar la DISPERSIÓN o
VARIABILIDAD de los datos.
Características Parámetro EstadísticoPromedio o media
mediana
Moda
Varianza
Desviación típica
Proporción
Número de datos
xX~
mo
2
p̂
Me
Mo2SS
pN n
y
Variable X Y Z
Algunas medidas de variabilidad son:
1.- Rango
2.- Varianza
3.- Desviación estándar
4.- Coeficiente de variación
5.- Rango intercuartílico
Entre otras….
1.- RANGOUna alternativa como medida de dispersión es el RANGOCorresponde a la diferencia entre el mayor y el menor de nuestras observaciones
Claramente influenciado por valores extremos
Por esta razón no es una buena medida de dispersión.
mínmáx datodatoRango
2.- VARIANZA
Y
3.- DESVIACIÓN ESTÁNDAR
(DESVIACIÓN TÍPICA)
Cuantifica la cantidad de variabilidad o dispersión en relación a la media (o promedio) de las observaciones
Ejemplo 1Una marca de alimentos para mascotas, esta probando si su alimento tiene
efectos positivos significativos, para esto, mide la altura de 5 perros:
Las alturas (hasta los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
1.- Identifique la variable con su unidad de medida, unidad de análisis y el número de datos.2.- ¿Es una muestra o población? 3.- Observe como están los datos.4.- En un plano cartesiano, colocar en el eje horizontal cada perrito y en el eje vertical la altura de cada perrito. Poner un punto a cada altura. 5.- Calcule el promedio (Poner su respectiva unidad de medida.6.- El valor del promedio situarlo en el plano construido. Poner una recta horizontal a la altura del promedio.7.- Calcule la distancia entre cada dato y el promedio8.- De los valores obtenidos, eleve al cuadrado cada uno de ellos.9.- Sume los valores obtenidos en el paso anterior.10.- El resultado obtenido en el paso anterior, lo divide para: N, si los datos provienen de una población. n-1, si los datos provienen de una muestra.11.- El valor obtenido en el paso anterior se llama varianza12.- A la varianza, obténgale la raíz cuadrada.13.- A ese ultimo valor, se le denomina desviación tipica.
N
x
=
n
1ii
2
2
1-n
x
=
n
1ii
2
2x
S
A.- Datos no tabulados
1
2
n
x
S
n
1iix
=
N
n
1iix
=
2
**Varianza
**Desviación típica
Para los datos no tabulados, puede usar la opción
desviación estándar (Insertar/función/estadística/stdev)
Para los datos no tabulados, puede usar la opción
varianza: (Insertar/función/estadística/var)
Ejemplo 2
En el Hospital Universitario de la ciudad de Guayaquil, se tomó el ritmo cardíaco de 11 pacientes (pulsaciones/min) y estos fueron los resultados:
167-125-120-150-150-90-136-120-150-136-115 a.-) Determine la unidad de análisis, tamaño de muestra, nombre de la variable, tipo de variable.
b.-) Calcule la varianza del ritmo cardíaco de estos pacientes.
c.-) Calcule la desviación típica del ritmo cardíaco de estos pacientes.
d.-) Construya el diagrama de cajas . Interprete
e.-) Calcule el rango y el rango intercuartílico.
B.- DATOS TABULADOS
N
X
=
n
1ii
2
if*2
1-n
XX
=
n
1i
i
2
if
S
*2
Número deempleados
Número deempresas
10 15012 8015 9017 7019 40
Ejemplo 3Algunas de las microempresas ubicadas en el sector norte de la ciudad de Guayaquil se las ha clasificado por el número de empleados que tienen.a.-) Determine la unidad de análisis, número de datos, nombre de la variable, tipo de variable. b.-) Hallar la varianza y la desviación típica del número de empleados
B.1.- Sin Clase
N
fi
n
1iiX
=
*2
1
*2
n
f
Si
n
1ii XX
=
40,13430
57601
n
fxx
k
iii
Número deempleados
Número deempresas
10 150 1500
12 80 960
15 90 1350
17 70 1190
19 40 760430 5760
ii fx *
Número deempleados
Número deempresas
10 150 11,53 1729,26
12 80 1,95 155,76
15 90 2,57 231,74
17 70 12,99 909,55
19 40 31,41 1256,48430 4282,79
2)( xxi ii fxx *)( 2
98,9
429
79,4282
1-n
*XX=
n
1i
2
i2
ifS
16,3
1
*XX=
n
1i
2
i
n
fS
i
En conclusión:
En la práctica, la desviación estándar se utiliza con más frecuencia que la varianza
Una de las razones es que se expresa en las mismas unidades de medida de la variable.
2 2S=S
Visualización de la desviación estándar
05
101520253035404550
1 3 5 7 9 11 13 15 17 19 21 23
1
2
3
Peso de Corderos: s=40 kg ; = 98 kgPeso de Toros: s=50 kg; = 400 kgPeso de Elefantes: s=120 kg; = 1500 kg
¿Qué grupo presenta la menor dispersión?
4.- COEFICIENTE DE VARIACIÓN
Es una medida relativa de variabilidad de los datos. Permite comparar la variabilidad de dos o más conjuntos de datos. Y así decidir qué conjunto de datos es más homogéneo o más estable, más equitativo.
Mientras más grande es el coeficiente de variación, más variación tiene el conjunto de datos, por consiguiente es menos equitativo, menos homogéneo, menos estable.
Como el coeficiente de variación no tiene unidad de medida, permite comparar variabilidad entre distintos conjuntos de datos.
Se define como el cociente entre LA DESVIACIÓN ESTÁNDAR y LA MEDIA:
X
S=cv
=CV
APLICACIONES DEL COEFICIENTE DE VARIACIÓN
1.- Comparar variabilidad de conjuntos de datos de una misma variable con unidades de medida
distintas.
Estatura (X) de los estadounidenses
Estatura (Y) de los chilenos
Comparar la variabilidad de estos dos conjunto de datos
5
3,172
yS
Y
3
2,70
xS
X
1 cm = 0,3937 plg1 plg = 2,54 cm
Ejemplo 5
Comparar la estatura de los estadounidenses (en pulgadas) con la estatura de los chilenos (en cm).
2.- Comparar variabilidad de conjuntos de datos de variables distintas.
Estatura (X) Peso (Y)
128,5
8,4X
X
S
9,4
4,36
YS
Y
Comparar la variabilidad de estos dos conjuntos de datos.
Ejemplo 6
Comparar la estatura en cm y el peso en kg. de los 20 niños seleccionados de gimnasia artística:
Peso de Corderos: s=40 kg ; = 98 kgPeso de Toros: s=50 kg; = 400 kgPeso de Elefantes: s=120 kg; = 1500 kg¿Qué grupo presenta la menor dispersión?
3.- Comparar la variabilidad de conjunto de datos de una misma variable con distintos sujeto de estudio.
X
X
X
Ejemplo 7
La Hacienda, “La Dauleña” está interesada en comparar el peso que tienen los corderos, toros y elefantes.
Ejercicio 8Los gastos mensuales de una empresa A, que está ubicada en Estados Unidos, tienen una media de $100.000 y una desviación típica de $12.500. La empresa B, ubicada en España, la media es 15.000 euros, y la desviación típica, 2.500 euros. ¿Cuál de las dos tiene menor estabilidad?.
Ejercicio 9
En el crucero “El inestable” a cuatro grupos de turistas sometidas a diferentes dietas se les ha medido el nivel de colesterol. Las medias y las desviaciones típicas son las que figuran en esta tabla:
¿Qué grupo es más homogéneo?
top related