XPXPAnálisisde los datos
XPXPIntroducción• El análisis de la datos depende del enfoque y del tipo de
investigación que se haya seleccionado, como también de los objetivos que se hayan planteado.
• Existen dos grandes familias de técnicas de análisis de datos:– Técnicas cualitativas: en las que los datos son presentados de
manera verbal (o gráfica) - como los textos de entrevistas, las notas, los documentos…
– Técnicas cuantitativas: en las que los datos se presentan en forma �numérica.
• Estas dos modalidades son especies radicalmente diferentes y utilizan conocimientos y técnicas completamente diferenciadas.
XPXPProgramas informáticos para el análisis de datos
• Para el análisis de datos cuantitativos, tenemos en la actualidad programas como el SAS, SPSS, MINITAB, SVSTAT, RESAMPLING, STATGRAPHIS.
• Para el análisis de datos cualitativos existen programas como el QUALPRO, ETHNOGRAPH, NUDIST, AQUAD.
XPXPLa estadística
• La estadística se constituye en una herramienta fundamental para el análisis de los datos.
• La estadística es fundamental para resolver problemas de descripción de datos, análisis de muestras, contrastación de hipótesis, medición de relaciones y predicciones.
XPXPLa estadística• El término estadística proviene de la palabra
Estado que fue originalmente utilizado para designar el levantamiento de datos estatales para orientar sus decisiones.
• Definición de estadística– La estadística es la rama de la matemática usado para
la recolección, organización, resumen, análisis e interpretación de un grupo de números u observaciones.
XPXPDivisión de la estadística
• La estadística se divide en dos grandes ramas: estadística descriptiva y estadística inferencial.
La estadística descriptiva es parte de la estadística que tiene por objeto describir los datos observados . Incluye: recolección, organización, resumen y presentación de datos.
La estadística inferencial es parte de la estadística que tiene como objetivo obtener y generalizar los resultados para una población a partir de una muestra, a través del cálculo de probabilidades.
XPXPVariables, valores, escalas• Datos
– Los datos son los valores que las variables asumen y son usados para describir un evento.
• Variables– Es la característica de cada sujeto (cada caso).– Llamamos “variable” precisamente porque “varía” de sujeto a sujeto.– Cada sujeto tiene un valor para cada variable.
• Ejemplos:– Variable “sexo”; Valores “hombre” y “mujer”– Variable “edad en su último cumpleaños”; Valores: 0, 1, 2, 3– Variable “ingresos anuales”; Valores: cualquier número entre 0 y cientos de miles o millones de Bs.
• Escalas– Conjunto de valores que puede tomar una variable se llama la escala de esa
variable
XPXPEstadística descriptiva• Permite describir resumir y analizar la
información obtenida de la muestra.• Para tal fin se recolecta la información, se
tabula, se grafica y en muchos casos se obtienen medidas que resuman los datos.
• Básicamente hay tres tipos de medidas de resumen: – medidas de tendencia central, – medidas de dispersión o variabilidad de los datos y – medidas de ubicación.
XPXP
DISTRIBUCIÓN DE FRECUENCIAS
XPXPLa distribución de frecuencias• Una distribución de frecuencias es la
organización de datos en forma tabular, usando clases (intervalos) y frecuencias.
• La frecuencia (ni) de un valor de dato es el número de veces que ocurre el dato en el conjunto de datos.
XPXPDistribución de Frecuencias para variables cualitativas
• Cuando se observa un rasgo cualitativo de un conjunto de unidades, las observaciones se clasifican en categorías.
• Tales datos se organizan en tablas de frecuencia que muestra los recuentos de las categorías individuales.
• La comprensión de los datos se refuerza si también se calcula la proporción (frecuencia relativa) de las observaciones en cada categoría.
XPXP
• La representación de la tabla de distribución de frecuencias es como sigue:
XPXPEjemplo:• Los tipos de sangre de 20 donadores se listan abajo. Resumir
los datos usando una tabla de frecuencias .ROH+ ROH- ROH+ ROH- ROH- ROH+ ROH-ROH+ ROH- ROH- ROH+ ROH- ROH+ ROH-ROH- ROH+ ROH- ROH+ ROH- ROH-
Solución
Interpretación:• 12 donadores tienen tipo de sangre ROH-.• el 40% de los donadores tienen tipo de sangre ROH+ y 60% ROH-.
XPXPEjercicio• Se ha clasificado a 20 individuos según su nivel
de estudios que puede tomar valores:
Nivel de estudios =
• Y se han obtenido los siguientes datos: 1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3 Resumir los datos usando una tabla de frecuencias y calcular las frecuencias.
XPXPDistribución de frecuencias para variables cuantitativas de datos no agrupados
• La distribución tendrá la forma:
1
XPXPDistribución de frecuencias de variables cuantitativas de datos no agrupados• Donde, los elementos que la componen son:– Número total de observaciones (N).– Variable en observación (xi).– Frecuencia absoluta (ni). Numero de veces que se repite xi.– Frecuencia relativa (fi). Porcentaje de elementos
pertenecientes a cada clase. – Frecuencia absoluta acumulada (Ni). Suma de frecuencias
absolutas de una clase con las frecuencias absolutas de todas las clases anteriores.
– Frecuencia relativa acumulada (Fi). Suma de frecuencias relativas de una clase con las frecuencias relativas de todas las clases anteriores.
XPXPEjemplo• El número de hijos de 30 familias son como se
muestran:1 4 3 2 3 4 5 22 1 2 5 1 4 2 1 3 2 4 1 2 3 2 3 2 1 4 3 2 5
• Resumir los datos usando una tabla de frecuencias.
XPXPSolución
• Interpretación:– 6 familias tienen 3 hijos.– 27 familias tienen de 1 a 4 hijos.– El 10% de las familias tienen 5 hijos.– 53% de las familias tienen de 1 a 2 hijos.
XPXPEjercicio• En un Instituto existen 2200 estudiantes
matriculados que se distribuyen por edades de la siguiente forma: 215 de 14 años, 437 de 15, 421 de 16, 396 de 17, 512 de 18, 124 de 19 y 95 de 20. Construir una TDF.
XPXPDistribución de frecuencias de variables cuantitativas para datos agrupados• Se utiliza para representar variables continuas o datos que
tienen un gran número de observaciones, siendo la mayoría de ellos distintas. En esta tabla se agrupan los datos en subgrupos llamados clases. Para la construcción de la TDF se debe seguir los siguientes pasos
• Paso 1. Definición del número de clases (k)– Existen dos maneras distintas para determinar este valor:– Se puede utilizar la regla de Sturges: – Regla del cuadrado: .
• Paso 2. Cálculo del rango o amplitud muestral . Es la diferencia entre el dato máximo y el mínimo.
XPXPDistribución de frecuencias de variables cuantitativas para datos agrupados
• Paso 3. Cálculo de la amplitud o ancho de intervalos de clases (C) . Resulta de dividir el rango entre el número de clases.
XEl valor resultante se redondea al entero superior más próximo.
• Paso 4. Escoger los límites de clase. Esto implica hallar los límites inferior y superior de cada intervalo. – Para la primera clase, es el valor más pequeño de los datos y es el límite
inferior sumado el ancho de clase.– Para las demás clases, es el límite superior de la anterior clase y es el
límite inferior sumado el ancho de clase.
• Paso 5. Calcular los demás elementos de la distribución.
infL supL
infL supL
XPXP
• La distribución tendrá la forma:
XPXPEjemplo• Los pesos en libras de 30 postulantes a la
Academia de Policía son:143 151 136 127 132 132126 138 119 104 113 90126 123 121 133 104 99112 129 107 139 122 137112 121 140 134 133 123.
• Resumir los datos usando una tabla de frecuencias.
XPXPSolución
XPXPEjercicio• Sean las notas de 50 estudiantes.
60 85 33 52 65 77 84 6574 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89• Construir la tabla de distribución de frecuencias.