medidas de dispersion.[1]
TRANSCRIPT
-
7/28/2019 Medidas de Dispersion.[1]
1/41
BIOESTADSTICA
Tatiana Burga.Wilver Rodrguez.
Medidas deDispersin
FACULTAD DE MEDICINA HUMANA
FILIAL NORTE
-
7/28/2019 Medidas de Dispersion.[1]
2/41
Las medidas de dispersin o variabilidad
Son tiles porque:
Permiten juzgar la confiabilidad de la
medida de tendencia central.
Los datos demasiados dispersos tienen
un comportamiento especial.
Es posible comparar dispersin de
diversas muestras.
-
7/28/2019 Medidas de Dispersion.[1]
3/41
AMPLITUD TOTAL: A RANGO: R
Se obtiene de la diferencia entre el dato mayor yel dato menor.
Ejemplo:Los siguientes datos representan los pesos de 10pacientes. Calcule el rango.
60, 58, 80, 70, 75, 55, 76, 60, 68, 70
Amplitud Total Rango = 80 - 55 = 25
Interpretacin
La diferencia entre el paciente con mayor peso y el paciente con
menor peso es 25 kilos.
-
7/28/2019 Medidas de Dispersion.[1]
4/41
Clculo a partir de datos agrupados
Se utiliza la siguiente formula:
Amplitud Total o Rango = ( Ls - Li) + 1
donde:
Ls : Limite superior de la ltima clase
: Limite inferior de la primera clasei
L
-
7/28/2019 Medidas de Dispersion.[1]
5/41
Ejemplo:
La distribucin de frecuencias siguiente representa
las estancia hospitalaria(das) de una muestra de
pacientes. Calcule e interprete el rango
Rango = (20 - 1) + 1
R = 20
Interpretacin: la diferencia de das entre elpaciente que ms das hospitalarios y el pacientecon menos das hospitalarios es de 20 das.
N Das N de Pacientes
1 - 4 4
5 - 8 89 - 12 15
13 - 16 23
17 - 20 10
Total 60
-
7/28/2019 Medidas de Dispersion.[1]
6/41
Ventajas
fcil de calcular
fcil de entender e interpretar
Desventajas
slo considera los valores extremos
no toma en cuenta ni el nmero de datos ni el
valor de stos
no es posible de calcular en tablas con
extremos abiertos.
-
7/28/2019 Medidas de Dispersion.[1]
7/41
LA VARIANZA
Es una medida de dispersin e indica la desviacinpromedio con respecto a la media aritmtica
a) Clculos a partir de datos no agrupados.
para una muestra
para un poblacin
1
1
2
)X(2
n
n
iix
S
N
N
ii
1
2
)X(2
-
7/28/2019 Medidas de Dispersion.[1]
8/41
8 8 - 10 = 2 4
10 10 - 10 = 0 0
5 5 - 10 = 5 25
12 12 - 10 = 2 4
10 10 - 10 = 0 0
15 15 - 10 = 5 25
Ejemplo:La siguiente informacin se refiere a los das de
hospitalizacin de 6 pacientes en un centro de salud:8, 10, 5, 12, 10, 15. Calcule la varianza.
Elaboramos un cuadro de la forma siguiente
x X xi 2X xi
60X
0X x
i
10
6
60
x
x
582 xiX
-
7/28/2019 Medidas de Dispersion.[1]
9/41
58X 2xi
1
)(X2
2
n
i
S
x
2das6,11
16
582
S
-
7/28/2019 Medidas de Dispersion.[1]
10/41
LA DESVIACION ESTANDAR
Es la raz cuadrada de la varianza, seapoblacional o muestral.
a) Clculos a partir de datos no agrupados
Para la muestra
Para la poblacin
1
1
2
2
n
n
ii x)(X
S s
N
N
ii
1
2
2
)X(
-
7/28/2019 Medidas de Dispersion.[1]
11/41
Ejemplo:En relacin al ejemplo anterior. Calcular la desviacin
estndar de los siguientes das hospitalarios:8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 = 11,6 das2.
Entonces:
s2
S
das3,4S
das6,11S 2
-
7/28/2019 Medidas de Dispersion.[1]
12/41
DESVIACIN ESTANDAR
1
)( 22
n
n
xfxf
S
iiii
Donde: fi: frecuencias absolutas simples
Xi: puntos medios de los intervalos de clase
-
7/28/2019 Medidas de Dispersion.[1]
13/41
Ejemplo:Calcular la desviacin estndar de la siguiente
distribucin de frecuencias:
N de Das
Hospitalarios Xi fi Xi*fi Xi2*fi
2 - 4 3 4 12 36
5 - 7 6 10 60 360
8 - 10 9 15 135 1215
11 - 13 12 30 360 432014 - 16 15 5 75 1125
17 - 19 18 1 18 324
Total 65 660 7380
-
7/28/2019 Medidas de Dispersion.[1]
14/41
DESVIACIN ESTANDAR
165 65
6607380
S
25.3S
-
7/28/2019 Medidas de Dispersion.[1]
15/41
-3 -2 - + +2 +3
68.3 %
95.5 %
99.7 %
Teorema de Chebyshev
-
7/28/2019 Medidas de Dispersion.[1]
16/41
El coeficiente de variacin
Es una medida de variabilidad relativa de los
datos, permite comparar la variabilidad de dos o
ms conjuntos de datos expresados en unidades
diferentes (peso; kg. y libras).
a) Calculos a partir de datos no agrupados
Para la muestra:
Para la poblacin:
100xCV
s
100
CV
-
7/28/2019 Medidas de Dispersion.[1]
17/41
Ejemplo:A continuacin se presentan los pesos en dos grupos de pacientes
Cul de los grupos tiene un peso ms estable?.
I grupo II grupo
40,70,60,48,52,65,58 70,35,150,140,82,110,140,120
Calculamos la media y desviacin estndar para
cada uno de los grados
-
7/28/2019 Medidas de Dispersion.[1]
18/41
Grupo I
40 -16,14 260,50
70 13,86 192,10
60 3,86 14,90
48 -8,14 66,26
52 -4,14 17,14
65 8,86 78,50
58 1,86 3,46
x X xi 2X xi
14567
3931 ,
n
x
n
i i
X
393X 0X xi 86,632X2xi
-
7/28/2019 Medidas de Dispersion.[1]
19/41
866322 ,xiXSi
271017
86632
1
1
2
,
,( )
n
n
ii xX
S
100S
xCV
2918100 ,56,14
10,27CV
-
7/28/2019 Medidas de Dispersion.[1]
20/41
Grupo II
70 -35,87 1286,6569
35 -70,87 5022,5569
150 44,13 1947,4569
140 34,13 1164,8569
82 -23,87 569,7769
110 4,13 17,0569
140 34,13 1164,8569
120 14,13 199,6569
x X xi 2
X xi
871058
8471
,
n
i
x
n
i
X
847X
04,0X xi 88,11372X2
xi
-
7/28/2019 Medidas de Dispersion.[1]
21/41
88113721
2,
n
i
ixXSi
304018
8811372
1
1
2
,
,)(
n
n
ii xX
S
100S
xCV 06,30100
105,87
40,30CV
El II grupo presenta una mayor variabilidad en sus
pesos que el I grupo.
-
7/28/2019 Medidas de Dispersion.[1]
22/41
CONSIDERACIONES
15/04/2013
SI:
C.V 33% La distribucin se puede considerar
aproximadamente simtrica.
C.V 33% La distribucin puede ser asimtrica
-
7/28/2019 Medidas de Dispersion.[1]
23/41
Curvas simtricas: Cuandoal trazar una lnea el rea sedivide en dos partes iguales. Curvas asimtricas o
sesgadas: Concentrados enel extremo inferior o superior
del eje horizontal.La cola indica el tipo de
sesgo.
Medidas Forma:
-
7/28/2019 Medidas de Dispersion.[1]
24/41
p = 3 (X - Me)
S
X=Me=Mo Mo
-
7/28/2019 Medidas de Dispersion.[1]
25/41
Refleja el grado de agudeza.
(a) Leptocrtica (concentracin al centro)
(b) Mesocrtica (distribuidos simtricamente)
(c) Platicrtica (aplanada).
Coeficiente de Curtosis
-
7/28/2019 Medidas de Dispersion.[1]
26/41
USO DE LAS DIFERENTES
MEDIDAS DE DISPERSION La desviacin estndarse emplea cuando
tambin es apropiado el uso de la media,es decir, con distribuciones simtricas(no
sesgadas) de datos numricos. Percentiles y rango intercuartilicos se
emplean, cuando la distribucin no essimtrica(sesgada) y es apropiado el usode la mediana.
-
7/28/2019 Medidas de Dispersion.[1]
27/41
USO DE LAS DIFERENTES
MEDIDAS DE DISPERSION El rango es una medida apropiada para
datos numricos cuando el propsito es
enfatizar valores extremos.
El coeficiente de variacin es til cuando
la intencin es comparar dos
distribuciones numricas medidas en
escalas diferentes.
-
7/28/2019 Medidas de Dispersion.[1]
28/41
El Boxplot (Diagrama de Caja)
Al igual que el histograma y el grfico deTallo y Hoja permite tener una idea visualde la distribucin de los datos (simetra y
variabilidad) Permite detectar outliers (valores
extremos).
Permite comparar la media y lavariabilidad de varios grupos (alternativagrfica a pruebas estadsticas)
-
7/28/2019 Medidas de Dispersion.[1]
29/41
Boxplot: Procedimiento
1. Dibujar una caja cuyo lmite inferior ser
Q1 y el superior Q3. Dentro de la caja
trazar una lnea que localice la mediana.
2. Calcular el rango intercuartlico:
R.I. (Q) = RIQ = Q3 Q1
3. Dibujar un bigote del borde inferior de
la caja hasta Q1-1.5xRIQ .
-
7/28/2019 Medidas de Dispersion.[1]
30/41
Boxplot: Procedimiento
5. Dibujar otrobigote del borde
superior de la caja hasta
Q3+1.5xRIQ .6. Dibujar cualquier observacin que
se ubique fueras de los bigotes
(estos sern los outliers).
-
7/28/2019 Medidas de Dispersion.[1]
31/41
BoxPlot: Ejemplo
0
10
20
30
40
50
Datos
-
7/28/2019 Medidas de Dispersion.[1]
32/41
OTRA ALTERNATIVA DEANALIZAR LA DISPERSIN DE
UN CONJUNTO DE DATOS:GRFICO DE TALLO - HOJAS
-
7/28/2019 Medidas de Dispersion.[1]
33/41
Grfico de Tallo - Hoja
Un diagrama de tallos y hojas consiste en una serie de
hileras horizontales de nmeros. El nmero utilizado
para designar una hilera es un tallo y el resto de
nmeros en la hilera se denominan hojas.
-
7/28/2019 Medidas de Dispersion.[1]
34/41
Se tienen los siguientes datospermetro
ceflico (cm) de recin nacidos, que
constituye una muestra obtenida de unapoblacin de recin nacidos:33.1 33.4 33.6 33.7 33.7 33.8 33.9 34.0
34.1 34.2 34.2 34.2 34.2 34.2 34.3 34.334.5 34.5 34.6 34.6 34.6 34.7 34.7 34.834.9 35.1 35.1 35.2 35.2 35.3 35.6 35.836.0 36.1 36.5
-
7/28/2019 Medidas de Dispersion.[1]
35/41
Para la clasificacin de datos, se deben
identificar los valores entre los cuales se
encuentra la distribucin, es decir, el dato
menor y el dato mayor.
Dato menor: 33.1cm
Dato mayor: 36.5cm
33.1 33.4 33.6 33.7 33.7 33.8 33.9 34.034.1 34.2 34.2 34.2 34.2 34.2 34.3 34.334.5 34.5 34.6 34.6 34.6 34.7 34.7 34.834.9 35.1 35.1 35.2 35.2 35.3 35.6 35.836.0 36.1 36.5
-
7/28/2019 Medidas de Dispersion.[1]
36/41
Se deben identificar los tallos -los nmeros que
van a designar las hileras- los cuales deben
contener a todos los valores de la distribucin (del
33.1 al 36.5). La eleccin de los tallos depende dela unidad con la que se quiera trabajar: enteros,
dcimas, centsimas... En el caso del ejemplo, los
datos estn dados indicando dcimas por lo que
trabajar con tallos enteros es la opcin ms
precisa y cmoda.
Los tallos seran entonces: 33, 34, 35 y 36.
-
7/28/2019 Medidas de Dispersion.[1]
37/41
Sin embargo, no se puede realizar un diagrama de
tallos y hojas con menos de 5 tallos. Por lo tanto, los
tallos propuestos se deben dividir (desdoblar) en una
especie de intervalo, produciendo el doble. La divisindel tallo debe distinguirse visualmente:
33.1 33.4 33.6 33.7 33.7 33.8 33.9 34.034.1 34.2 34.2 34.2 34.2 34.2 34.3 34.334.5 34.5 34.6 34.6 34.6 34.7 34.7 34.834.9 35.1 35.1 35.2 35.2 35.3 35.6 35.836.0 36.1 36.5
-
7/28/2019 Medidas de Dispersion.[1]
38/41
Seguidamente, se realiza el proceso de clasificacinen s. Todos los datos, dependiendo de su valor, secolocan a lado de su respectivo tallo. En el ejemplo,los datos cuyo valor se encuentre entre 33.0 y 33.4se deben colocar en la hilera del tallo 33*. Se debe
indicar el valor decimal exacto de cada dato a laderecha del tallo. En el ejemplo hay 2 valores entre33.0 y 33.4. Para clasificar el primero (33.1) seagrega al diagrama de tallos y hojas de la siguientemanera:
33*1 Para clasificar el segundo dato que corresponde a este
tallo (33.4): 33*14
-
7/28/2019 Medidas de Dispersion.[1]
39/41
Lo mismo se realiza con cada tallo y lovalores que le correspondan:
En la hilera del tallo 33. se debe colocar los
nmeros 67789, correspondientes a losvalores 33.6, 33.7, 33.7, 33.8, 33.8 y 33.9.
A la hilera del tallo 34*se debe colocar
012222233 correspondientes a los valoresque se encuentran entre 34.0 y 34.4.
etc.
-
7/28/2019 Medidas de Dispersion.[1]
40/41
Al clasificar todos los valores en sus tallos
respectivos, se obtiene el diagrama:
-
7/28/2019 Medidas de Dispersion.[1]
41/41
Anlisis de la distribucin usando Tallos y Hojas
Las principales caractersticas de ladistribucin que se observan fcilmenteen el diagrama de tallos y hojas son: Hay 35 observaciones. El dato menor es 33.1cm.
El dato mayor es 36.5cm. El rango de los valores
observados es de 3.4cm (dato mayor dato menor).
De los 35 datos, 18 estn alrededor de34cm.
Los casos mayores a 36cm son pocos. La distribucin de los datos es asimtrica:
distribucin heterognea.