Download - Clase final afi 02
Víctor Daniel Gil Vera [email protected]
Análisis de datos (1/2)Consiste en la realización de las operaciones a las que el investigador someterá los datos con la finalidad de alcanzar los objetivos del estudio.
Análisis de datos (2/2)
Recolecta, clasifica, tabula, describe, interpreta resultados, realiza estimativos y proyecciones.
Análisis e interpretación (1/4)
Al analizar los datos se pretende descubrir patrones y tendencias para poder interpretarlos.
Análisis e interpretación (2/4)
La meta es aclarar los datos, no cambiarlos fundamentalmente.
Análisis e interpretación (3/4) Al publicar los datos y las técnicas que usaron para analizarlos e interpretarlos, los científicos le dan a la comunidad la oportunidad de revisar los datos y de usarlos en investigaciones futuras.
Análisis e interpretación (4/4) Las interpretaciones científicas no son verdades absolutas ni opiniones personales: son inferencias, sugerencias, o hipótesis sobre lo que significan los datos, basadas en el conocimiento científico y la interpretacion individual.
Fuentes de error (1/3)
Siempre que se hacen medidas tenemos fuentes potenciales de error.
Fuentes de error (2/3)
Si por ejemplo, el instrumento usado estaba calibrado y la persona fue cuidadosa al tomar los datos el porcentaje de error será pequeño y estará distribuido al azar cerca a la medida verdadera.
Fuentes de error (2/3)
Esto se conoce como el error experimental y usualmente representa un error estadístico.
Fuentes de error (3/3)
El error estadístico no puede ser eliminado, pero si puede ser medido y reducido cuando se hacen repetidas observaciones de un evento específico.
Error sistemático (1/3)
Otro tipo de error es el introducido humanamente. Por ejemplo, por calibración incorrecta o inconsistencia al tomar datos.
Error sistemático (2/3)Este error afecta los resultados ampliando por encima o por debajo del valor real la variabilidad de los datos obtenidos. O simplemente dando valores completamente erróneos y lejanos al valor real.
Error sistemático (3/3)
Al contrario del error estadístico, el error sistemático puede ser compensado, o algunas veces eliminado, si su fuente se identifica.
Podemos minimizar errores (1/5)
Con el calibrado de instrumentos o medidas contra estándares conocidos.
Podemos minimizar errores (2/5)
Con el reporte de todos los límites de detección de instrumentos
Podemos minimizar errores (3/5)
Con la implementación de procedimientos estándares para minimizar el error humano.
Podemos minimizar errores (4/5)
Con la documentación completa de los métodos de investigación.
Podemos minimizar errores (5/5)
Con la duplicación de las medidas para determinar la presición.
¿Qué es la estadística? (1/2)
La Estadística es la ciencia de: Recolectar, Describir, Organizar e Interpretar datos para transformarlos en información, para la toma mas eficiente de decisiones.
¿Quiénes usan la estadística?
Organismos oficiales Diarios y revistasPolíticos Deportes.Marketing Control de calidad.Administradores Investigadores científicos.Médicos
Tema 1: Introdución 22Bioestadística. U. Málaga.
La Estadística es una ciencia que permite:
• Sistematizar, recoger, ordenar y presentar datos referentes a un fenómeno
• Deducir las leyes que rigen esos fenómenos
• Hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
Descriptiv
a
Probabilidad
Inferencia
PoblaciónConjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia.
Población
Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.
Muestra
Es un subconjunto de la población de interés.
Población y Muestra
Población
Muestra
Tamaño de la Muestra
Muestreo Probabilístico Muestreo Probabilístico Aleatorio o al azar
EstratificadoRacimos o conglomerados
Muestreo No Muestreo No probabilístico o probabilístico o
IntencionalIntencional
Accidental. Por cuotas.
SujetosExpertos
28
TIPOS DE VARIABLESTIPOS DE VARIABLES
Variables CuantitativasVariables Cuantitativas
VariableVariable: corresponde a la característica de la Unidad de Análisis: corresponde a la característica de la Unidad de Análisis
DISCRETADISCRETA
Variables CualitativasVariables Cualitativas
CONTINUACONTINUA
Toma valores enteros Toma valores enteros Ejemplos: Ejemplos: Número de HijosNúmero de Hijos, , Número de Número de empleados de una empresaempleados de una empresa, , Número de Número de asignaturas aprobadas en un semestreasignaturas aprobadas en un semestre, etc., etc.
Toma cualquier valor dentro de un intervalo Toma cualquier valor dentro de un intervalo Ejemplos: Ejemplos: Peso; Estatura; Temperatura, etc.Peso; Estatura; Temperatura, etc.
ORDINALORDINALNOMINALNOMINAL
Característica o cualidad Característica o cualidad cuyas categorías no tienen cuyas categorías no tienen un orden preestablecido. un orden preestablecido. Ejemplos: Ejemplos: Sexo, Deporte Sexo, Deporte FavoritoFavorito, etc., etc.
Característica o cualidad cuyas Característica o cualidad cuyas categorías tienen un orden categorías tienen un orden preestablecido. preestablecido. Ejemplos: Calificación (S, N, A); Ejemplos: Calificación (S, N, A); Grado de Interés por un tema, etc.Grado de Interés por un tema, etc.
Tablas de frecuencia (1/2)Corresponden a una agrupación o clasificación de los datos, con el fin primordial de determinar la frecuencia con que se repite un atributo o valor que toma la variable.
Tablas de frecuencia (2/2)
Una distribución de frecuencia es una tabla en la que aparecen todos los intervalos y las frecuencias de datos correspondientes a cada intervalo.
Variable Cualitativa
El sexo, estado civil, profesión, cargo, ocupación, aficiones, estudios realizados, se clasificación como cualidades o atributos.
Frecuencia Relativa NOTA:NOTA:Frecuencia relativa, es el cociente entre la frecuencia absoluta y el tamaño de la muestra.
Ejemplo
Se realiza una encuesta a fumadores sobre su preferencia por una marca, cuyos resultados se muestran en la siguiente tabla.
Marcas FumadoresAndino 12
Derby 28
Kool 10
Lucky 7
Marlboro 20
Pielroja 13
TOTAL 90
Los siguientes datos corresponden a los lugares favoritos de vacaciones de los empleados de una empresa:
Mar – Montaña – Campo Mar – Mar – Montaña Campo – Mar – Mar Montaña – Campo – Mar Campo
Ejemplo
Completa la siguiente tabla y luego obtén al menos dos conclusiones:
Lugar Frecuencia Absoluta
Frecuencia Relativa %
CampoMar
MontañaTotal
Ejemplo
Lugar Frecuencia Absoluta
Frecuencia Relativa %
Campo 4 30,769Mar 6 46,153
Montaña 3 23,076Total 13 99,998
¿ Qué conclusión puedes inferir?
Ejemplo
Variable Cuantitativa
En la elaboración de una tabla de frecuencia es necesario familiarizarse con algunos símbolos, ya que continuamente se emplean
• Xi: Es la manera de simbolizar el valor de cada observación.
• fi: Se denomina frecuencia absoluta y corresponde al número de veces que se repite cada valor de la variable.
• Fi: Frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra
• Hi: frecuencia absoluta acumulada, es la suma de las frecuencias absolutas de los valores menores o iguales a Xi
• Ni: frecuencia relativa acumulada, es la suma de las frecuencias relativas de los elementos iguales o menores a Xi
EjemploUn profesor tiene la lista de las notas en matemáticas de 30 alumnos de su clase. Las notas son las siguientes:
Ejemplo
Ejercicio propuestoEjercicio propuesto
En una clase de 30 alumnos se ha preguntado el número de hermanos que tienen, el resultado ha sido el siguiente:
2 1 1 0 1 2 1 5 3 6
3 2 0 3 0 1 1 2 3 4
4 2 1 1 1 2 0 3 1 1
Si presentamos esta información en una tabla de frecuencias , queda como sigue:
N ° dehermanos
Xi
FrecuenciaAbsoluta
fi
Frecuencia relativa
porcentual Fi %
Frecuencia absoluta
acumulada, Hi
Frecuencia relativa
acumulada porcentual, Ni
Si presentamos esta información en una tabla de frecuencias , queda como sigue:
N ° dehermanos
Xi
FrecuenciaAbsoluta
fi
Frecuencia relativa
porcentual Fi %
Frecuencia absoluta
acumulada, Hi
Frecuencia relativa
acumulada porcentual, Ni
0 1 2 3 4 5 6
412 6 4 2 1 1
13,33340,00020,00023,3336,6663,3333,333
4162226282930
13,33353,33373,33386,66693,33396,666
100
¿ Qué conclusión puedes inferir?
El tratamiento de los niños con desórdenes de la conducta puede ser complejo. El tratamiento se puede proveer en una variedad de escenarios dependiendo de la severidad de los comportamientos.
Ejemplo
Además el reto que ofrece el tratamiento, se encuentran la falta de cooperación del niño/niña y el miedo y la falta de confianza de los adultos.
Ejemplo
Para poder diseñar un plan integral de tratamiento, el siquiatra de niños y adolescentes puede utilizar la información del niño, la familia, los profesores y de otros especialistas médicos para entender las causas del desorden.
Ejemplo
Para ello, un siquiatra local ha considerado una muestra aleatoria de 20 niños, anotando el tiempo necesario que requiere en cada niño para lograr un plan integral del tratamiento, obteniéndose lo siguiente (en horas):
Ejemplo
Preguntas…???
– Organice los datos en una distribución de frecuencia adecuada.
– ¿Cuántos niños requieren un tiempo mayor a 8 horas?– ¿Qué porcentaje de niños requieren menos de 7 horas?– ¿Cuánto tiempo demoran en realizar la prueba la mitad
de los niños?– ¿Cuánto tiempo demoran en realizar la mayoría de los
niños?
Definiciones:
•Rango: Diferencia entre el máximo y el mínimo valor de una variable.
Variable Cuantitativa
Definiciones:
•Marca de clase: Representante de un intervalo, y corresponde al promedio entre los extremos de éste.
Variable Cuantitativa
Definiciones:
•Tamaño de un intervalo: Es el cociente entre el valor del rango y la cantidad de intervalos que se desea obtener. Se recomienda tomar como longitud de los intervalos un valor entero que sea mayor o igual al cociente obtenido.
Variable Cuantitativa
Nivel de colesterol en la sangre de una muestra de hombres estadounidenses que tienen entre 25 y 34 años de edad , que fueron atendidos en centros médicos de New York y sufren de hipertensión arterial , en el año 2001
Nivel de Colesterol (mg/100 ml)
Cantidad de hombres
80-120 13120-160 15160-200 44200-240 29240-280 9
¿Cuál es la variable de interés?
¿Qué se mide?
Observa: El rango de cada intervalo es de 40.Observa: El rango de cada intervalo es de 40.
El peso de 50 trabajadores de una empresa se representan en la siguiente tabla de distribución de frecuencias.
Preguntas…???
– Organice los datos en una distribución de frecuencia adecuada.
– ¿Cuántos niños requieren un tiempo mayor a 8 horas?– ¿Qué porcentaje de niños requieren menos de 7 horas?– ¿Cuánto tiempo demoran en realizar la prueba la mitad
de los niños?– ¿Cuánto tiempo demoran en realizar la mayoría de los
niños?
Ejemplo
Un grupo de psicólogos ha diseñado un test que permite identificar los 9 tipos de personalidad que se ilustran en la siguiente figura. Este test, que evalúa 16 factores emocionales y cognitivos, genera una puntuación entre 100 y 200 puntos.
Ejemplo
Ejemplo
La Tabla 1 muestra la escala de medición del test; en ella se indican los puntajes que corresponden a cada tipo de personalidad. El test fue aplicado a 50 empleados de una empresa con el fin de determinar las características de recurso humano con las que cuenta.
Ejemplo
Los resultados obtenidos se muestran en la Tabla 2. Tenga en cuenta que a cada empleado se le identifica con un único tipo de personalidad.
Tabla 1 – Escala de Medición del test de personalidad
CRITERIO / PREGUNTA Cantidad Porcentaje
¿Cuántos empleados son pacíficos y leales?¿Cuántos empleados obtuvieron más de 150 puntos en el test?¿Cuántos empleados obtuvieron máximo 130 puntos?¿Cuántos empleados no son entusiastas y triunfadores?¿Cuántos empleados son individualistas, pacíficos y colaboradores?
Preguntas…???
CRITERIO / PREGUNTA Cantidad Porcentaje
¿Cuántos empleados son pacíficos y leales? 10 20%¿Cuántos empleados obtuvieron más de 150 puntos en el test?
12 24%
¿Cuántos empleados obtuvieron máximo 130 puntos?
32 64%
¿Cuántos empleados no son entusiastas y triunfadores?
44 88%
¿Cuántos empleados son individualistas, pacíficos y colaboradores?
32 64%
Solución
72
TIPOS DE GRÁFICOSTIPOS DE GRÁFICOS1. Gráfico de Sectores Circulares (de 1. Gráfico de Sectores Circulares (de Torta)Torta)
Distribución de las unidades de análisis de acuerdo a variable 1
A20%
D10%
C40%
B30%
Distribución de las unidades de análisis de acuerdo a variable 1
B30%
C40%
D10% A
20%
Distribución de las unidades de análisis de acuerdo a variable 1
B30%
C40%
D10%
A20%
75
TIPOS DE GRÁFICOSTIPOS DE GRÁFICOS2. Gráfico de Barras2. Gráfico de Barras
Numero de unidades de análisis de acuerdo a variable 1
0
100
200
300
400
500
A B C D
variable 1
Nº
Porcentaje de unidad de análisis de acuerdo a variable 1
0 20 40 60 80 100
A
B
C
D
varia
ble
1
% unidad de análisis
-Este tipo de gráfico se utiliza generalmente para Este tipo de gráfico se utiliza generalmente para representar la frecuenciarepresentar la frecuencia de las categorías de una de las categorías de una variable cualitativa. variable cualitativa. -Cuando una variable es cuantitativa se puede utilizar Cuando una variable es cuantitativa se puede utilizar este tipo de gráfico sólo si la variable se ha este tipo de gráfico sólo si la variable se ha transformada en categorías.transformada en categorías.-Hay distintas versiones de estos gráficos (por ejemplo Hay distintas versiones de estos gráficos (por ejemplo en Excel), y en algunos casos son muy útiles para en Excel), y en algunos casos son muy útiles para describir el comportamiento de una variable en distintos describir el comportamiento de una variable en distintos grupos.grupos.
Proporción de unidad de análisis de acuerdo a variable 1
0 0,2 0,4 0,6 0,8 1
A
B
C
D
varia
ble
1
Proporción de unidad de análisis
77
HistogramaHistograma- Permite la representación de - Permite la representación de la frecuencia de una variable la frecuencia de una variable Cuantitativa.Cuantitativa.- El eje x se refiere a la El eje x se refiere a la variable.variable.- El eje y se refiere a la El eje y se refiere a la frecuencia (Nº , %).frecuencia (Nº , %).- Cada barra representa la Cada barra representa la frecuencia de la variable en la frecuencia de la variable en la población en estudio (o la población en estudio (o la muestra). muestra). -El histograma se puede El histograma se puede construir desde los datos de la construir desde los datos de la tabla de frecuencia de la tabla de frecuencia de la variable en estudio.variable en estudio.
3. Histograma3. Histograma
1413121110987
15
10
5
0
edad
Frec
uenc
iaN
ºN
º
edadedad
Histograma Distribución de los hijos de trabajadores Histograma Distribución de los hijos de trabajadores de la empresa de acuerdo a edadde la empresa de acuerdo a edad
EjemploEjemploEn el gráfico se puede observar el número de En el gráfico se puede observar el número de hijos , de menor edad (7-8 años), las de mayor hijos , de menor edad (7-8 años), las de mayor edad (13-14 años); y además que la mayoría de edad (13-14 años); y además que la mayoría de hijos de los trabajadores están entre los 10 y 12 hijos de los trabajadores están entre los 10 y 12 años.años.
TIPOS DE GRÁFICOSTIPOS DE GRÁFICOS
RANGO f H F N20-22 12 12 7% 7%
23-25 34 46 20% 27%26-28 43 89 26% 53%29-31 67 156 40% 93%32-34 12 168 7% 100%
168 100%
79
5. Polígono de Frecuencia5. Polígono de Frecuencia
edadedad
1413121110987
15
10
5
0
edad
Fre
cuen
cia
Nº
Nº
Distribución de los hijos de trabajadores de Distribución de los hijos de trabajadores de
la empresala empresa de acuerdo a edadde acuerdo a edad
-Esta representación se basa en Esta representación se basa en el Histograma.el Histograma.-Sólo es útil para variables Sólo es útil para variables cuantitativas.cuantitativas.-El eje x se refiere a la El eje x se refiere a la variable.variable.- El eje y se refiere a la El eje y se refiere a la frecuencia (Nº , %). frecuencia (Nº , %). -Los puntos que permiten la Los puntos que permiten la unión de las líneas representa unión de las líneas representa el el centro de clase (o marca de centro de clase (o marca de clase)clase)..
TIPOS DE GRÁFICOSTIPOS DE GRÁFICOS
81
6. Otros6. Otros
Número de alumnos matriculados en la Carrera A según año de ingreso
020406080
100
1998 1999 2000 2001 2002 2003
año de ingreso
Nº d
e al
umno
s
Número de alumnos matriculados en la Carrera B según año de ingreso
020406080
100
1998 1999 2000 2001 2002 2003
año de ingreso
Nº d
e al
umno
s
Número de alumnos matriculados en las Carreras según año de ingreso
0
50
100
150
200
1998 1999 2000 2001 2002 2003
año ingreso
Nº d
e al
umno
s
Carrera BCarrera A
año de ingreso Carrera A Carrera B1998 60 801999 55 702000 80 502001 40 602002 68 502003 70 75
Nº de alumnos
TIPOS DE GRÁFICOSTIPOS DE GRÁFICOS