representaciones gráficas análisis de datos i semestre otoño 2010
TRANSCRIPT
![Page 1: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/1.jpg)
Representaciones Gráficas
Análisis de Datos I
Semestre Otoño 2010
![Page 2: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/2.jpg)
Gráficos para variables cualitativas (categóricas)
1. Gráfico de Sectores o de Torta
Se divide un círculo en tantas porciones como clases tenga la variable
A cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa
La información que se debe mostrar en cada sector hace referencia al número de casos dentro de cada categoría y al porcentaje del total que estos representan
Si el número de categorías es excesivamente grande (ej. Más de 3) la imagen proporcionada por el gráfico de sectores se empieza a tornar confusa.
![Page 3: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/3.jpg)
Ejemplo Nº 1: Gráfico de sectores variable “Tipo de Fumador”
¿Cómo interpretamos este
gráfico?
![Page 4: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/4.jpg)
Ejemplo Nº 2: Gráfico de sectores variable “Género”
¿Cómo interpretamos este
gráfico?
91 / 71%
38 / 29%
Mujeres
Hombres
![Page 5: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/5.jpg)
Ej. Nº 3: Hay veces en que el sector que nos interesa describir se desagrupa
7 / 5%
57 / 44%
54 / 42%
11 / 9%
divorciado separado
casado
soltero
Omitido
¿Cómo interpretamos este
gráfico?
![Page 6: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/6.jpg)
2.1 Gráfico de Barras SimplesLos diagramas de barras son similares a los gráficos de sectores. Se representan tantas barras como categorías tiene la variable, de modo que la altura de cada una de ellas sea proporcional a la frecuencia o porcentaje de casos en cada clase Estos mismos gráficos pueden utilizarse también para describir variables numéricas discretas que toman pocos valores (número de hijos, número de evaluaciones, etc.)
2. Gráficos de Barras
![Page 7: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/7.jpg)
ESTCIVIL
divorciado separadocasadosolteroOmitido
Fre
cuen
cia
60
50
40
30
20
10
0
7
5754
11 ¿Cómo interpretamos este
gráfico?
Ejemplo Nº 4: Gráfico de Barras variable “Estado Civil” (cualitativa)
![Page 8: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/8.jpg)
Número de Hijos
4 Hijos3 Hijos2 Hijos1 HijoSin Hijos
Fre
cue
nci
a
60
50
40
30
20
10
0
11
23
31
57
7
¿Cómo interpretamos este
gráfico?
Ejemplo Nº 5: Gráfico de Barras variable “Número de Hijos” (cuantitativa discreta)
![Page 9: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/9.jpg)
2.2 Gráfico de Barras Agrupadas
• En Ocasiones se requiere agrupar dos variables en un mismo gráfico
• Para lo cual se sugiere ocupar un Gráfico de Barras Agrupadas
• Ayuda a comparar categorías de una variable en función de las Categorías o Intervalos de la otra variable
![Page 10: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/10.jpg)
ESTCIVIL
divorciado separadocasadosolteroOmitido
Fre
cue
nci
a
50
40
30
20
10
0
GENERO
hombre
mujer
Ej. 6 “Gráfico de Barras agrupadas para las variables Estado civil y Género
¿Cómo interpretamos este
gráfico?
![Page 11: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/11.jpg)
2.3 Gráfico de Barras Apiladas
• Cumple con las mismas características que el gráfico de barras agrupadas
• Busca Comparar dos variables superponiendo sus categorías o Intervalos
![Page 12: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/12.jpg)
Ej. 7 “Gráfico de Barras Apiladas para las variables Categoría edad y Género
categoria edad
54 y más44 a 5334 a 4324 a 33Omitido
Fre
cue
nci
a
60
50
40
30
20
10
0
GENERO
mujer
hombre
6
19
19
42
554
1215 ¿Cómo
interpretamos este gráfico?
![Page 13: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/13.jpg)
• Se utiliza cuando una variable Cualitativa tiene muchas categorías
• Es útil para entregar un ordenamiento de las categorías para realizar comparaciones
• Se ordenan las categorías de mayor a menor cantidad de apariciones o frecuencia y se les asigna cada categoría una barra
• El gráfico se complementa con una línea que representa la acumulación porcentual de las categorías
2.4 Gráfico de Pareto
![Page 14: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/14.jpg)
ORIENTAC
Fre
cue
nci
a
140
120
100
80
60
40
20
0
Po
rcen
taje
100
50
0911131317
2126
Ej. 8 “Gráfico de Pareto Orientación Psicoterapeutica”
¿Cómo interpretamos este
gráfico?
![Page 15: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/15.jpg)
1. HistogramasPara variables numéricas continuas, tales como la edad, la tensión arterial o el índice de masa corporal, el tipo de gráfico más utilizado es el histograma.Para construir un gráfico de este tipo, se divide el rango de valores de la variable en intervalos de igual amplitud, representando sobre cada intervalo un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de los datos en cada intervalo y el área de los rectángulos.
Gráficos para variables Cuantitativas
![Page 16: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/16.jpg)
Tabla I. Distribución de frecuenciasde la edad en 100 pacientes.
Edad Nº de pacientes
18 1
19 3
20 4
21 7
22 5
23 8
24 10
25 8
26 9
27 6
28 6
29 4
30 3
31 4
32 5
33 3
34 2
35 3
36 1
37 2
38 3
39 1
41 1
42 1
![Page 17: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/17.jpg)
• Como ejemplo, la anterior muestra la distribución de frecuencias de la edad de 100 pacientes, comprendida entre los 18 y 42 años.
• Como se vio en clases, se divide este rango en intervalos de dos años, el primer tramo está comprendido entre los 18 y 19 años, entre los que se encuentra el 4/100=4% del total.
• Por lo tanto, la primera barra tendrá altura proporcional a 4.
• Procediendo así sucesivamente, se construye el histograma que se muestra en la siguiente Diapositiva
![Page 18: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/18.jpg)
Ej. 9 “Histograma Variable Edad
¿Cómo interpretamos este
gráfico?
![Page 19: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/19.jpg)
2. Polígono de Frecuencias
• Uniendo los puntos medios del extremo superior de las barras del histograma, se obtiene una imagen que se llama polígono de frecuencias.
• Dicha figura pretende mostrar, de la forma más simple, en qué rangos se encuentra la mayor parte de los datos.
• Un ejemplo, utilizando los datos anteriores, se presenta en la siguiente Diapositiva
![Page 20: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/20.jpg)
Ej. 10 “Polígono de Frecuencias Variable Edad
¿Cómo interpretamos este
gráfico?
![Page 21: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/21.jpg)
3. Diagramas de Caja
• Otro modo habitual, y muy útil, de resumir una variable de tipo numérico es utilizando el concepto de percentiles, mediante diagramas de cajas
• Como se apreciará en el Ejemplo 11, la caja central indica el rango en el que se concentra el 50% central de los datos.
• Sus extremos son, por lo tanto, el 1er y 3er cuartil de la distribución.
• La línea central en la caja es la mediana.
• De este modo, si la variable es simétrica, dicha línea se encontrará en el centro de la caja.
![Page 22: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/22.jpg)
• Los extremos de los "bigotes" que salen de la caja son los valores que delimitan el 95% central de los datos, aunque en ocasiones coinciden con los valores extremos de la distribución.
• Se suelen también representar aquellas observaciones que caen fuera de este rango (outliers o valores extremos).
• Esto resulta especialmente útil para comprobar, gráficamente, posibles errores en nuestros datos.
• En general, los diagramas de cajas resultan más apropiados para representar variables que presenten una gran desviación de la distribución normal.
![Page 23: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/23.jpg)
8636N =
GENERO
mujerhombre
ED
AD
80
70
60
50
40
30
20
6366
Ej. 11 “Polígono de Frecuencias Variable Edad
¿Cómo interpretamos este
gráfico?
![Page 24: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/24.jpg)
4. Gráficos de Líneas
• Los gráficos de líneas pueden resultar especialmente interesantes, sobre todo cuando interesa estudiar tendencias a lo largo del tiempo
• No son más que una serie de puntos conectados entre sí mediante rectas
• Cada punto puede representar distintas cosas según lo que nos interese en cada momento (el valor medio de una variable, porcentaje de casos en una categoría, el valor máximo en cada grupo, etc).
![Page 25: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/25.jpg)
Ej. 12 “Gráfico de Líneas Variable Número de pacientes trasplantados renales en el Complejo Hospitalario “Félix Bulnes" durante el periodo 1981-1997”
¿Cómo interpretamos este
gráfico?
![Page 26: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/26.jpg)
Ej. 13 Gráfico de Líneas Superpuestas Variable Variación en el peso medio de una muestra de recién nacidos según el control
ginecológico del embarazo y el hábito de fumar de la madre
¿Cómo interpretamos este
gráfico?
![Page 27: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/27.jpg)
5. Gráfico de Dispersión
• Cuando lo que interesa es estudiar la relación entre dos variables continuas, el método de análisis adecuado es el estudio de la correlación.
• Los coeficientes de correlación (Pearson, Spearman, etc.) valoran hasta qué punto el valor de una de las variables aumenta o disminuye cuando crece el valor de la otra.
• Cuando se dispone de todos los datos, un modo sencillo de comprobar, gráficamente, si existe una correlación alta, es mediante diagramas de dispersión,
• Se confronta, en el eje horizontal, el valor de una variable y en el eje vertical el valor de la otra.
![Page 28: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/28.jpg)
• Un ejemplo sencillo de variables altamente correlacionados es la relación entre el peso y la talla de un sujeto.
• Partiendo de una muestra arbitraria, podemos construir el diagrama de dispersión en el Ejemplo 14
• En él puede observarse claramente como existe una relación directa entre ambas variables
![Page 29: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/29.jpg)
Ej. 14 Histograma de Variables Talla y Peso
¿Cómo interpretamos este gráfico?
![Page 30: Representaciones Gráficas Análisis de Datos I Semestre Otoño 2010](https://reader035.vdocuments.site/reader035/viewer/2022062309/5665b4251a28abb57c8f839d/html5/thumbnails/30.jpg)
Ejemplo Final: Relación entre Nivel de Estrés y Edad
EDAD
706050403020
Niv
el d
e E
str
és
5,0
4,5
4,0
3,5
3,0
2,5
2,0
¿Cómo interpretamos este gráfico?