universidad cooperativa de colombiaraulagudeloucc.weebly.com/uploads/4/6/9/3/46938641/... ·...
TRANSCRIPT
Universidad Cooperativa de Colombia
ELABORACIÓN DE TABLA PARA VARIABLE CONTINUA
Febrero de 2020
SIMBOLOGÍA ESTADÍSTICA
56, 57, 57, 59, 60, 64, 64, 64, 65, 65, 65, 65, 65,66, 66, 66, 66, 68, 68, 68, 68, 68, 68, 68, 68, 70,70, 71, 72, 72, 72, 73, 74, 74, 75, 80
𝑁 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑜 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑜
𝑛 = 𝑆𝑒 𝑑𝑒𝑛𝑜𝑚𝑖𝑛𝑎 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑥𝑖 = 𝑀𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 (𝑝𝑢𝑛𝑡𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜)
𝑛𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎.
𝑚 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑚 = 1 + 3,3𝑙𝑜𝑔n
𝑥𝑖−1´ = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑟𝑣𝑎𝑙𝑜; 𝑥𝑖
´ = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
ℎ𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎.𝑛𝑖𝑛∗ 100. 𝑠𝑒 𝑖𝑛𝑡𝑒𝑟𝑝𝑟𝑒𝑡𝑎 𝑒𝑛 %
𝑁𝑖− = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑚𝑒𝑛𝑜𝑠 𝑑𝑒: 𝑁𝑖
− = 𝑛1 + 𝑛2 +⋯ 𝑛𝑘
𝑁𝑖+ = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑚á𝑠 𝑑𝑒: 𝑁𝑖
+= 𝑛𝑘 + 𝑛𝑘−1 +⋯ 𝑛
𝐻𝑖− = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑚𝑒𝑛𝑜𝑠 𝑑𝑒: 𝐻𝑖
− = ℎ1 + ℎ2 +⋯ ℎ𝑘
𝐻𝑖+ = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑚á𝑠 𝑑𝑒: 𝐻𝑖
+= ℎ𝑘 + ℎ𝑘−1 +⋯ 𝑛
Procedimiento
Para formar la distribución de frecuencias, se sugiere lo
siguiente:
1. Determinar el mayor (Xmax) y el menor (Xmin) entre los
datos registrados.
2. Se determina el Rango (R) o recorrido que es la diferencia
entre Xmax y Xmin. R = Xmax – Xmin.
3. Determinar el número de intervalos (m) el cual no debe ser
menor de 5 o mayor de 16, con la fórmula de Sturges.
m = 1 + 3.3*logn. Se aproxima a número entero.
4. Se calcula la amplitud del intervalo C=R/m. Se aproxima a
número entero por encima.
Procedimiento
5. Definimos el nuevo rango NR= C*m
6. Se redefine si es necesario los nuevos límites Xmax y
Xmin.
7. Se define el criterio del Límite Superior. (a-b]
8. Determinar el número de observaciones que caen
dentro de cada intervalo, es decir, encontrar la
frecuencia absoluta (ni).
9. Se Calcula la marca de clase Xi como el promedio de
los límites de cada intervalo.
Ejercicio de proceso completo
Las calificaciones obtenidas y ordenadas por 50 alumnos
en la asignatura de Economía son las siguientes:
50 53 54 55 59 60 60 60 61 61
62 62 63 65 66 68 68 68 69 71
73 73 74 74 75 75 75 75 76 77
78 78 78 79 79 82 82 84 85 87
88 88 89 90 93 93 94 95 95 99
I. Rango
1. Rango (R): En una serie de datos, constituye la
diferencia entre el Valor Máximo (Xmax) y el Valor
Mínimo (Xmin) de la variable.
𝑹 = 𝑿𝒎𝒂𝒙 – 𝑿𝒎𝒊𝒏
Xmax = 99 Xmin = 50
con la fórmula: R = 99 – 50 = 49
II. Número de Intervalos
Cabe mencionar que el número de intervalos
recomendado por algunos investigadores oscila entre
6 - 15.
Formula de Sturges (m): Sugiere un número de clases,
con las que podremos agrupar nuestros datos.
A continuación la fórmula: m = 1 + 3,3*Log n
donde
n = Total de frecuencias
m = Número de intervalos
Log n = Logaritmo decimal de n
III. Número de Intervalos
Solución: n = 50
m= 1+3,3 Log n
m= 1+3,3 Log 50
m = 1+3,3 (1.698970004)
m = 6,61 ≈ 7 Se aproxima a Número entero
m = 7 intervalos
IV. Amplitud del Intervalo
Una vez conocido el número de intervalos sugeridos (m), se
determina la amplitud del intervalo (C) sugerido con la
aplicación de la siguiente fórmula:
𝐶 =𝑅
𝑚=
𝑋𝑚𝑎𝑥 −𝑋𝑚𝑖𝑛
1+3,3 𝐿𝑜𝑔 𝑛
Con el ejemplo anterior, el Xmax = 99 y Xmin = 50.
𝐶 =𝑅
𝑚=
𝑋𝑚𝑎𝑥 −𝑋𝑚𝑖𝑛
1+3,3 𝐿𝑜𝑔 𝑛=
99−50
7=
49
7= 7
En este caso el nuevo rango NR=c*m=7*7=49 es igual al
Rango, Los límites quedan iguales.
V. Marcas de clase
(Li - Ls ]
Frecuencia
Absoluta ni
Marcas de
Clase (Xi)
( 50 – 57 ]
( 57 – 64 ]
( 64 – 71 ]
( 71 – 78 ]
( 78 – 85 ]
( 85 – 92 ]
( 92 – 99 ]
4
9
7
13
6
5
6
53,5
60,5
67,5
74,5
81,5
88,5
95,5
Total 50
Marcas de Clase: Son números que se emplean para formar las clases. El
menor de ellos se llama límite inferior (Li) y el mayor, el límite superior
de la clase (Ls).
En la primera clase:
Xi = (50 + 57)/2 = 53,5
En la segunda clase:
Xi = (57 + 64)/2 = 60,5
En la tercera clase:
Xi = (64 + 71)/2 = 67,5
VI. Nuevo Rango – Intervalos de Clase
Vamos a suponer que C=8
Una vez conocido el ancho de clase, se determina el NuevoRango(NR) sugerido con la aplicación de la siguientefórmula: NR = C*m = 8*7= 56
La diferencia del nuevo rango (56) y el rango inicial (50)hace que se recalculan los nuevos límites.
el Xmax = 99+3= 102 y Xmin = 50-3= 47
Primer Intervalo: ( 47 – 55 ]
Segundo Intervalo: ( 55 - 63 ]
Tercer Intervalo: ( 63 - 71 ]
Séptimo Intervalo: ( 95 - 103 ]
VI. Marcas de clase
(Li - Ls ]
Frecuencia
Absoluta ni
Marcas de
Clase (Xi)
( 47 – 55 ]
( 55 – 63 ]
( 63 – 71 ]
( 71 – 79 ]
( 79 – 87 ]
( 87 – 95 ]
( 95 – 103 ]
4
9
7
15
5
9
1
51
59
67
75
83
91
99
Total 50
Marcas de Clase: Son números que se emplean para formar las clases. El
menor de ellos se llama límite inferior (Li) y el mayor, el límite superior
de la clase (Ls).
En la primera clase:
Xi = (47 + 55)/2 = 51
En la segunda clase:
Xi = (55 + 63)/2 = 59
En la tercera clase:
Xi = (63 + 71)/2 = 67
Importante
1. En muchos casos el investigador utiliza un número
prefijado de clases y por lo tanto ya no es necesario fijar
la fórmula de Sturges.
2. El número de clases debe ser número entero, por tanto,
si el resultado de la operación es un número decimal, se
aproximara al número entero inmediato superior.
3. Hasta donde sea posible, debe omitirse trabajar tanto
con clases de anchos diferentes, como con clases
abiertas.
4. El ancho de clase no necesariamente será número
entero, en algunos casos podrá ser un decimal.
5. No existe el logaritmo de un número negativo.
Bibliografía
Pardo Merino, A., Ruiz Díaz, M. (2017) SPSS 11. Guía para el
análisis de datos. Madrid: McGRAW-HILL/INTERAMERICANA DE
ESPAÑA.