Organizar los datos
Las distribuciones de frecuencia es la organización de
datos crudos en forma de tablas, organizando dichos
datos en clases y frecuencias
Las gráficas o diagramas proveen de inmediato un
sentido de proporción.
Se debe explicar por sí misma y cumplen con especificaciones de presentación.
Un listado de todas las puntuaciones observadas (o de
las categorías) de una variable y de la frecuencia, f , de
cada puntuación o categoría
Presenta los valores de los datos y su frecuencia o las
veces que se repite la observación
La frecuencia de una puntuación o de una categoría
no ofrece mucha información por sí mismo así que computamos proporciones y porcentajes
Representaciones
gráficas
Histogramas
Polígonos de frecuencia Ojivas
Gráficas de pie
Diagramas de Pareto Gráficas de series
Scatter plot (diagrama de puntajes)
Diagramas de relaciones entre variables
Hay dos tipos de
distribuciones:
Categórica- es para las variables nominales
/ordinales
use gráficas circulares y gráficas de barras o
diagrama de Pareto
Frecuencias agrupadas- es para las variables de
intervalo/razón
use histograma, polígono de frecuencia(gráfica de
líneas), gráfica de frecuencia acumulada (ojiva).
Gráfica circular
El propósito principal es ofrecerle al lector una idea de la relación entre las partes y el todo de la variable nominal u ordinal que se está presentando.
Recuerde que:
Un círculo que se divide desde su centro, cada rebanada representa la frecuencia proporcional de una categoría nominal/ordinal
La proporción se multiplica por 360 grados par obtener el área del circulo que corresponde a la frecuencia
El área del círculo es 360
La proporción de la variable entre sus partes es 100
Evitar engañar al informar los datos
Ejemplo gráfica circular
Cuáles serían las
circunstancias de estas
varibles?
F % F Relatiava * 360
EMPLEADO 45 77.58621 279.3103448
DESEMPLEADO 13 22.41379 80.68965517
58
Gráfica de barras
0
5
10
15
20
25
30
35
40
45
50
EMPLEADO DESEMPLEADO
EMPLEADO
DESEMPLEADO
◦ Tiene dos ejes uno vertical o eje de Y (ordernadas) y el otro horizontal o eje de X (absisas)
◦ Cada eje debe tener un titulo breve y explícito
◦ Gráfica de barras
Datos nominales u ordinales Una barra por categoría
La altura representa la frecuencia el orden es arbitrario
Empleado= 45
Desempleado=13
Otra forma de verlo
Punto medio =limite real superior + limite real
inferior/2
Histogramas y polígonos de frecuencia
Para representar intervalos o proporciones
Un intervalo por cada clase colocando el punto medio en el eje horizontal
La altura de cada barra representa la frecuencia o el porcentaje en cada categoría Calcular los limites reales para cada categoría
Determinar el punto medio
Es similar al histográma, cumple la misma
función
Polígono de Frecuencia
De intervalo/razón en el eje horizontal y las frecuencias de las puntuaciones están representadas por las alturas de puntos localizados sobre las puntuaciones y conectados mediante líneas
Se utilizan los puntos medios de la clase
Límite de clase inferior + límite de clase superior /2 = al punto medio de la clase
Qué medimos
La ojiva o gráfica de
frecuencias acumuladas Muestra cómo se
acumulan las frecuencias en una distribución de datos.
Se utiliza para observar cuántos casos hay bajo o sobre un límite superior de clase.
Se comienza con el primer límite superior de la clase.
Se utiliza para obtener percentilas y comparar puntuaciones.
Frecuencias de datos agrupados
• Para manejar muchos datos (casos)
• Se establecen los intervalos de clase ( class limits) estableciendo la amplitud de la clase.
• Primero se establece el Rango o Recorrido. Valor mínimo y máximo.
Frecuencias de
datos
• Ejemplo: 134-100= 34; si
arbitrariamente
determinamos que vamos a
calcular 7 clases, entonces,
34/7 = 4.9 = 5 clases. Por
lo tanto, la amplitud de la
clase es 5.
• Se establecen los límites
inferior y superior para cada
clase y los puntos medios,
frecuencias, frecuencias
acumuladas y frecuencias
relativas, según se necesite
información para su
representación gráfica.
Repasemos las reglas
para la determinación
de las clases
1. Puede haber entre 5 a 20 clases.
Se conocen como intervalo de clase
Se pueden determinar como límites reales del intervalo al
extender .05 a cada límite. Los limites reales de una puntuación o
categoría es el rango de valores posibles de una puntuación
Mitad de la unidad de medida por encima y por debajo del
valor.
Ejemplo: 100- 101-102-103-104 = 99.5-104.5
2. Se recomienda que incluya amplitud en números no pares. Punto medio límite inferior + límite superior / 2
3. Los intervalos de clase deben ser mutuamente excluyentes
4. Los intervalos de clase deben ser continuos
5. Los intervalos de clases deben ser exhaustivos
6. Los intervalos de clases deben ser de igual amplitud Excepción cuando es necesario distribuciones abiertas al comienzo o al final de la
distribución. Esto es en casos que hay pocos casos en una gran amplitud devalores.
También las frecuencias pueden agruparse y
determinarse de forma relativa
En vez de los datos crudos se determinan las
frecuencias se determinan en proporciones.
Para dar uniformidad, poder comparar y cuando es
más importante la proporción de los valores en los
intervalos de clases.
Se obtiene dividiendo la frecuencia para cada intervalo
de clase dividido entre el total de observaciones.
La frecuencia relativa, así como la frecuencia
acumulada relativa debe dar 1.00 (proporción de 100)
Ejemplo: récord de
temperatura
Estos son los récord de temperatura en °F en 50 estados en USA durante el 2000.
112, 110, 107, 116, 120, 100, 118, 112,
108, 113, 127, 117, 114, 110, 120, 120, 116, 115, 121, 117, 134, 118, 118, 113, 105, 118, 122, 117, 120, 110, 105, 114, 118, 119, 118, 110, 114, 122, 111, 112, 109, 105, 106, 104, 114, 112, 109, 110, 111, 114
Continuación Ejemplo
Determinar amplitud de los intervalos de
clases
Determinar 7 intervalos de clases
Determinar los límites reales de los intervalos
de clases
Determinar los puntos medios
Determinar las frecuencias acumuladas
Hacer histograma
Bin Frequency Cumulative %
104.5 2 4.00%
109.5 8 20.00%
114.5 18 56.00%
119.5 13 82.00%
124.5 7 96.00%
129.5 1 98.00%
134.5 1 100.00%
More 0 100.00%
50
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
0
2
4
6
8
10
12
14
16
18
20
104.5 109.5 114.5 119.5 124.5 129.5 134.5 More
Fre
qu
en
cy
Bin
Histogram
Frequency
Cumulative %
OJO FALTA ALGO
Distribución de frecuencia relativa ◦ Indica la proporción del numero total
de datos que aparecen en cada intervalo
Distribución de porcentajes acumulados ◦ indica el porcentaje de datos que
caen por debajo del límite real superior de cada intervalo. ◦ Porcentaje acumulado= Frecuencia acumulada *100
N
◦ Son útiles para determinar rangos percentiles
Percentiles and
Quartiles
Bin Frequency
12.5 6
13.5 1
14.5 3
15.5 6
16.5 8
17.5 2
18.5 3
19.5 1
N 30
0
2
4
6
8
10
12.5 13.5 14.5 15.5 16.5 17.5 18.5 19.5
Fre
qu
en
cy
millas por galón
Histogram
Frequency
0
1
2
3
4
5
6
7
8
9
12.5 13.5 14.5 15.5 16.5 17.5 18.5 19.5
Fre
qu
en
cy
millas por galón
Polígono de Frecuencia
Frequency
Proveer
ejemplo
Medidas de posición se utilizan para describir la ubicación de una observación en relación con los demás datos.
Percentil es el valor debajo del cual cae un porcentaje dado de los datos de la distribución.
El punto percentil divide los datos en 100 partes iguales.
Los decil dividen los datos en 10 partes iguales
y los quartiles en cuatro partes iguales.
Ejemplo el punto percentil 50 o P50 es el valor debajo del cual cae el 50% de los datos en la distribución.
Percentilas
?QUÉ EJEMPLOS
CONOCEMOS?
Tabla 2-11Cuartiles de una distribucion de las calificaciones en un examen parcial
Calificacion
en el examen
(X)
f f Percent
Cumulative
Percent Ubicacion de los cuartiles
31 1 5 5
58 1 5 10
64 1 5 15
68 1 5 20
69 1 5 25 Q1 = percentiil 25
72 1 5 30
76 1 5 35
77 1 5 40
82 1 5 45
84 1 5 50 Q2 = percentiil 50
85 1 5 55
86 2 10 65
88 1 5 70
91 1 5 75 Q3 = percentiil 75
93 2 10 85
94 1 5 90
95 1 5 95
97 1 5 100%
Total 20 100%
En conclusión
Las tablas y gráficas nos sirven para:
organizar datos con significado
que el lector analiza la naturaleza, forma y distribución de los datos
facilitar cómputos para otras estadísticas descriptivas como lo son las medidas de tendencia central y dispersión
comunicar datos en un lenguaje uniforme
poder hacer comparaciones entre diferentes datos