ESTADÍSTICA
COORDINACIÓN 2012
LICEO N° 2 HÉCTOR MIRANDA
PROF. TERESITA FUSTER BARDIER
BREVE INTRODUCCIÓN PARA DOCENTES
OBJETIVOS
El objetivo principal del curso es mostrar a
los colegas docentes una breve
introducción a la Estadística, algunas de sus
aplicaciones relacionadas con el trabajo
diario del docente, formas de presentar los
datos ya procesados y la lectura de los
mismos.
2
CONTENIDO DEL CURSO
Estadística: qué es, para qué sirve, cómo
pueden usarla los docentes.
Investigación estadística
Datos estadísticos: formas de recolección.
Variables estadísticas
Variables de resumen
Gráficos y tablas: construcción y lectura
3
DEFINICIÓN
Es la ciencia que tiene por objeto la
recolección, la organización, el
análisis y la presentación de datos,
con el fin de brindar información
que facilite la toma de decisiones.
4
APLICACIONES (ejemplos)
Recopilación de datos de los alumnos, análisis de los mismos y toma de decisiones a nivel grupal e individual.
Prueba diagnóstica
Análisis comparativo de escritos o pruebas, ya sea dentro del grupo o entre diferentes grupos.
Análisis de los datos de promoción, relacionarlos (si es posible) con otros datos de los alumnos y análisis comparativos.
Recordar que todos estos ejemplos deben utilizarse como base para otros análisis y tomas de decisiones y no como un fin en sí mismos.
5
INVESTIGACION ESTADÍSTICA
Objetivos de la investigación.
Pregunta problema.
Hipótesis (si la hubiera).
¿Investigación cualitativa o cuantitativa?
Determinación de la forma de recoger los
datos.
Determinación del tipo de formulario a
emplear.
6
INVESTIGACIÓN CUANTITATIVA
Plan de tabulados (de acuerdo al objetivo
planteado).
Determinación de las preguntas a incluir
(para cumplir con el plan de tabulados).
Recogida de datos (trabajo de campo).
Introducción, depuración y análisis de los
datos.
Publicación de resultados.
7
CONCEPTOS BÁSICOS Población: Una población finita (o simplemente
población) es un conjunto finito de elementos. O sea, puede determinarse sin ambigüedad si un elemento pertenece o no al conjunto. Denominaremos población objetivo, a la población finita sobre la cual deseamos obtener alguna información estadística.
Muestra: Es un subconjunto de la población: no tenemos los datos totales de la población, sino solamente de una parte de ella. En estos casos, las conclusiones extraídas de estos datos pueden extenderse o no a la población dependiendo de cómo se haya extraído la muestra.
8
RECOLECCIÓN DE DATOS
Registros administrativos
Censos
Encuestas por muestreo
9
RECOLECCIÓN DE DATOS
REGISTROS ADMINISTRATIVOS: son datos que
fueron recolectados con fines no estadísticos,
pero que pueden ser una base para el análisis
estadístico.
CENSOS: los datos se recogen directamente con
finalidad estadística. Se aplica el cuestionario a
toda la población objetivo.
10
RECOLECCIÓN DE DATOS ENCUESTAS: las encuestas también se aplican
con fines estadísticos. La diferencia con el censo es que se recolectan datos de una porción de la población.
ENCUESTAS POR MUESTREO ALEATORIO: tienen detrás un diseño de muestreo que permite expandir eficazmente sus resultados al total de la población.
ENCUESTAS POR MUESTREO NO ALEATORIO: no tienen un diseño muestral detrás. Sus resultados no pueden generalizarse al total poblacional.
11
VARIABLES ALEATORIAS Una variable es cualquier dato sujeto a medida o cuenta. Es aleatoria si no se puede predecir su valor. Ejemplos:
La hora de salida del sol cada día no es una variable aleatoria, ya que los astrónomos saben de antemano la hora exacta de la misma para cada día del año.
La cantidad de lluvia caída durante un período específico sí es una variable aleatoria, ya que no puede predecirse.
También son variables aleatorias:
La cantidad de alumnos inscriptos en cada liceo determinado año.
El número de alumnos que promueven el curso.
12
VARIABLES ALEATORIAS Cualitativas: También se llaman categóricas. Los
datos están divididos en clases o categorías. Por ejemplo: sexo del alumno, orientación, etc.
Pueden clasificarse en:
Nominales: las categorías no siguen ningún ordenamiento. Ejemplo: sexo, barrio en el que vive el alumno.
Ordinales: las categorías presentan cierto orden lógico. Ejemplo, preguntas de opinión cuya valoración es Bueno, Regular, Malo.
13
VARIABLES ALEATORIAS Cuantitativas: Son datos numéricos. Se clasifican
en:
Discretas: son aquellos datos que se pueden contar o numerar. Ejemplos: edad del alumno, cantidad de alumnos matriculados en cada clase; cantidad de profesores de Matemática; cantidad de horas libres que tiene el Liceo por día.
Continuas: datos numéricos que pueden tomar cualquier valor (en general, entre ciertos límites). Por ejemplo: salario por hora docente en el tiempo o en diferentes grados; altura y peso de una persona.
14
ESTADÍSTICA DESCRIPTIVA DISTRIBUCIONES UNIVARIADAS
Distribución de frecuencia y frecuencia acumulada
La frecuencia de una variable (ya sea discreta o
cualitativa) es la cantidad de veces que el dato se
repite. Normalmente los datos se presentan
agrupados según una tabla de frecuencias, que
puede contener frecuencias absolutas (número de
casos) o frecuencias relativas (porcentajes).
Si la variable es ordinal o cuantitativa puede
presentarse una distribución de frecuencia que
acumula cantidades desde la menor a la mayor.
15
ESTADÍSTICA DESCRIPTIVA El siguiente ejemplo corresponde a respuestas a la
pregunta sobre la opinión del estudiante sobre
Matemática, recogida en la prueba diagnóstica 2011
de 3 grupos de 5° año.
Opinión sobre Matemática
Frecuencia
absoluta Frecuencia
relativa Frecuencia
acumulada
No me gusta 2 3,17 3,17
Me disgusta algo 2 3,17 6,35
Ni me gusta ni me
disgusta 12 19,05 25,40
Me gusta algo 29 46,03 71,43
Me gusta mucho 18 28,57 100,00
Total 63 100
16
GRAFICAS UNIVARIADAS
El tipo de gráfica depende de la variable con la cual se está trabajando: Variables cualitativas: gráficas de
barras, gráficas de torta o circulares.
Variables cuantitativas discretas: histogramas, gráficas de puntos.
Variables cuantitativas continuas: gráficas de puntos.
17
Gráficas de barras
18
0
5
10
15
20
25
30
35
No me gusta Me disgusta
algo
Ni me gusta ni
me disgusta
Me gusta algo Me gusta
mucho
Número de alumnos
Siguiendo el ejemplo anterior: número de alumnos
por opinión sobre Matemática
Gráficas circulares
19
Total de alumnos
Femenino
Masculino
Para los alumnos que realizaron la misma prueba
diagnóstica. La variable utilizada es el sexo de los
alumnos.
Histogramas
20
0
5
10
15
20
25
30
35
40
45
15 16 17 18 19
Numero de alumnos
Siguiendo el ejemplo visto anteriormente, la variable
es la edad de los alumnos en años cumplidos al
momento de la prueba.
Gráficas de puntos
21
0
5
10
15
20
25
30
35
40
45
14 15 16 17 18 19 20
N° de alumnos
En el mismo ejemplo anterior, la gráfica
representa el número de alumnos según la edad.
MEDIDAS DE RESUMEN
22
Se tratan de medidas que ofrecen un resumen
de la distribución de los datos, con la menor
pérdida de información posible.
Se utilizan también para comparar distribuciones
distintas de la misma variable (diferencia
temporal o geográfica, por ejemplo)
Se consideran dos tipos de variables de
resumen: las medidas de tendencia central (o
de posición y las medidas de dispersión.
Variables cualitativas
El único resumen que puede darse es la
variable de tendencia central llamada
MODO (o Moda)
Representa el o los valores de la variable
con mayor frecuencia.
Por ejemplo, en los casos vistos anteriormente :
Opinión sobre Matemática: el modo es “Me
gusta algo”
Sexo de los alumnos: el modo es: “Femenino”
23
Variables cualitativas
Medidas de tendencia central:
Modo
Media
Medidas de posición:
Percentiles o cuantiles
Cuartiles, quintiles, deciles
Medidas de dispersión:
Rango
Varianza (o variancia)
Desvío (o desviación) estándar (o típica)
24
Variables cuantitativas Tendencia central: modo
Modo: valor o valores de la variable que tiene la
mayor frecuencia.
En el ejemplo de las edades de los alumnos, el modo es
16.
25
Variables cuantitativas Tendencia central: media
26
Variables cuantitativas Tendencia central: media
Variable agrupada por frecuencia
27
Edad N° de alumnos
Edad*N° alumnos
15 5 75
16 40 640
17 12 204
18 4 72
19 2 38
Total 63 1029
Variables cuantitativas Medidas de posición
Indican el valor de la distribución de la variable
ordenada que ocupa el lugar indicado. Por ejemplo:
Cuartiles: el primer cuartil es el valor de la variable que
deja al 25% de la distribución con valores menores. El
segundo cuartil (o mediana) es el valor de la variable que
ocupa el medio de la distribución ordenada. El tercer
cuartil deja el 75% de la distribución de la variable con
valores menores.
Quintiles: la distribución de la variable ordenada se separa
en 5 grupos de igual tamaño.
Deciles: idem con 10 grupos de igual tamaño.
Cuantiles o percentiles: lo mismo, con 100 grupos de igual
tamaño.
28
Variables cuantitativas Medidas de posición
Ejemplo: se tienen las edades de 13
alumnos. Se ordenan de menor a mayor.
14, 14, 15, 15, 15, 15, 16, 16, 16, 16, 17, 17, 18
29
En este caso la mediana es 16 ya que hay 6
alumnos con edades menores y 6 alumnos
con edades mayores
Variables cuantitativas Medidas de dispersión
El siguiente ejemplo muestra las notas obtenidas
por 10 alumnos de 3 grupos distintos en un escrito:
30
Grupo 1 Grupo 2 Grupo 3
6 5 1
6 5 2
6 5 3
6 6 4
6 6 5
6 6 7
6 6 8
6 7 9
6 7 10
6 7 11
En los tres
casos, la
media es 6
Variables cuantitativas Medidas de dispersión
Las gráficas correspondientes son:
31
0
2
4
6
8
1 2 3 4 5 6 7 8 9 10
Grupo 1
0
2
4
6
8
1 2 3 4 5 6 7 8 9 10
Grupo 2
0
2
4
6
8
10
12
1 2 3 4 5 6 7 8 9 10
Grupo 3
Variables cuantitativas Medidas de dispersión: Rango
Se define el rango como la diferencia entre el mayor valor que toma la variable en esa distribución y el menor valor de esa variable.
En los ejemplos de escritos vistos:
En el primer caso el rango es: 6 – 6 = 0
En el segundo grupo es: 7 – 5 = 2
En el grupo 3, el rango es: 11 – 1 = 10
Puede observarse que el tercer grupo es el “más desparejo” de los tres (los valores de la variable tienen mayor dispersión)
32
Variables cuantitativas Medidas de dispersión: varianza
La varianza puede definirse como un
promedio de la diferencia al cuadrado
entre los valores que toma la variable y
la media de la distribución. Esta
diferencia debe considerarse al
cuadrado porque, por la propia
definición de la media, sería siempre 0.
33
Variables cuantitativas Medidas de dispersión: varianza
34
Nota Nota - media (Nota - media)^2
1 -5 25
2 -4 16
3 -3 9
4 -2 4
5 -1 1
7 1 1
8 2 4
9 3 9
10 4 16
11 5 25
Suma 0 110
Variables cuantitativas Medidas de dispersión: desvío estándar
Para el cálculo de la varianza, se eleva la diferencia con la media al cuadrado, por lo que la unidad de medida que se está usando también queda elevada al cuadrado.
Si se quiere considerar la unidad de medida original, se calcula la raíz cuadrada de la varianza. A este valor se le llama desvío estándar, desviación estándar o desvío típico.
En el caso visto anteriormente, el desvío estándar es 3,49.
Esto significa que, en promedio, las notas obtenidas en los escritos de desvían 3,49 unidades de la media.
35
Diagrama de caja y bigotes
36
• El cuerpo de la caja muestra el recorrido
intercuartílico (RIC) (entre el primer y el tercer
cuartil)
• La línea en la caja muestra la mediana.
• Los “bigotes” se encuentran a 1,5 RIC de los
bordes de la caja.
• Los valores que quedan fuera de este rango se
denominan atípicos (outliers)
• Es un diagrama muy útil para comparar
distribuciones, ya que muestra también la
dispersión de las mismas.
Diagrama de caja
37
Diagrama de caja
que representa la
nota obtenida por
los alumnos de 5°B1
y 5°B2 (2012) en la
Prueba Diagnóstica
de puntaje máximo
30.
El número 18
corresponde al orden
del alumno que tuvo
el máximo puntaje (la
nota se observa en los
valores del eje)
Otras medidas de resumen: tasas
Las tasas o ratios son cocientes entre
cantidades específicas de una variable o de
dos variables. Se calcula en general como el
total de veces que se presenta el fenómeno
estudiado sobre el total poblacional.
Como ejemplo se verán las tasas de
escolarización bruta y la tasa de
escolarización neta.
Las definiciones y cuadros siguientes fueron extraídos del
Observatorio de la Educación de ANEP.
38
Tasas de escolarización. La tasa bruta de escolarización (TBE) se calcula como el
número total de alumnos de cualquier edad matriculados
en un determinado nivel de enseñanza, expresado en
porcentaje de la población del grupo en edad oficial de
cursar ese nivel (3 a 5 o 4 a 5 años para educación inicial,
6 a 11 años para educación primaria, 12 a 17 años para
educación media general, 12 a 14 años para ciclo básico
de educación media, 15 a 17 años para segundo ciclo de
educación media y 18 a 24 años para educación
terciaria).
Los alumnos matriculados surgen de los registros
estadísticos de cada uno de los subsistemas. La población
en edad oficial (o teórica) surge de las proyecciones al 30
de junio de cada año realizadas por el Instituto Nacional de Estadística.
39
Tasa bruta de escolarización
AÑO
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
TOTAL EDUCACIÓN
MEDIA 94,5 97,8 103,2 107,0 105,7 102,6 102,4 100,1 101,7 103,4 102,4
Pública 83,4 86,7 92,2 96,3 94,7 91,3 91,0 88,6 89,3 90,6 89,6
Secundaria 64,9 68,4 73,2 76,0 74,3 71,9 70,6 68,1 69,1 70,1 70,0
CETP 18,4 18,3 19,0 20,3 20,4 19,4 20,5 20,5 20,2 20,5 19,6
Privada 11,1 11,0 11,0 10,7 11,0 11,3 11,4 11,5 12,4 12,8 12,8
Total ciclo básico 93,9 97,0 100,5 101,8 100,4 98,0 98,7 98,3 104,4 107,4 108,0
Pública 80,3 83,5 87,4 89,4 87,7 85,5 85,7 85,1 89,7 92,0 92,5
Secundaria 71,3 74,7 78,4 79,9 78,1 75,8 75,9 75,2 79,0 80,1 80,2
CETP 9,0 8,8 9,0 9,5 9,6 9,7 9,8 9,9 10,8 11,9 12,3
Privada 13,6 13,5 13,1 12,4 12,7 12,6 13,1 13,2 14,7 15,4 15,4
Total segundo ciclo 82,3 86,0 93,3 98,7 98,0 95,9 94,1 90,5 88,6 90,8 90,7
Pública 73,6 77,4 84,5 89,7 88,8 85,8 84,4 80,6 78,6 80,6 80,6
Secundaria 58,5 62,0 68,0 72,0 70,5 67,9 65,1 60,8 59,0 59,8 59,7
CETP 15,2 15,4 16,5 17,7 18,3 17,9 19,3 19,8 19,6 20,8 20,9
Privada 8,6 8,5 8,8 8,9 9,2 10,1 9,7 9,9 10,0 10,1 10,1
40
Fuente: Observatorio de la Educación - ANEP
Tasa neta de escolarización
41
La tasa neta de escolarización (TNE) se calcula
como el número total de alumnos de edad
oficial para el nivel, matriculados en un
determinado nivel de enseñanza, expresado en
porcentaje de la población del grupo en edad
oficial de cursar ese nivel (3 a 5 o 4 a 5 años para
educación inicial, 6 a 11 años para educación
primaria, 12 a 17 años para educación media
general, 12 a 14 años para ciclo básico de
educación media, 15 a 17 años para segundo
ciclo de educación media y 18 a 24 años para educación terciaria).
DISTRIBUCIONES MULTIVARIADAS
En la mayoría de los estudios estadísticos no alcanza con estudiar la distribución de una variables, sino que es necesario su vinculación con otras, por ejemplo, involucrando variables demográficas (edad y sexo principalmente), variables económicas o variables temporales.
Estas vinculaciones dan mayor riqueza al análisis y a la comprensión del fenómeno que se está estudiando.
Como ejemplo, se verán cuadros y gráficas que involucren más de una variable.
No es conveniente usar más de tres variables en un cuadro y siempre que, al menos una de ellas, tenga pocas categorías. De lo contrario, se tendrán cuadros inmanejables por su tamaño.
42
Cuadros con dos variables:
valores absolutos
Distribución de alumnos de 1° Bachillerato por
sexo según grupo (año 2011 Liceo Miranda)
43
Grupo Sexo
Total Femenino Masculino
Total 312 180 132
1 32 20 12
2 35 20 15
3 35 23 12
4 36 17 19
5 34 19 15
6 35 23 12
7 35 19 16
8 36 19 17
9 34 20 14
Cuadros con dos variables:
valores relativos
En estos casos se pueden presentar tres tipos de tablas, dependiendo de cuál es la referencia considerada: Porcentajes de columnas (en el caso anterior, el total es
la cantidad de casos femeninos y se consideran porcentajes de cada grupo, lo mismo para el total masculino y el general).
Porcentajes de filas (el total es el número de alumnos de cada grupo y se calculan los porcentajes de casos femeninos y masculinos)
Porcentajes de tabla (el total es el número total de alumnos y se calculan los porcentajes de cada una de las casillas, o sea, qué porcentaje del total de alumnos son chicas de 4°1, etc.)
44
Cuadro con tres variables:
valores absolutos
45
Total Aprobado Por examen Pendiente Repite o recursa
Total 54 37 7 7 3
Femenino 37 26 5 4 2
Masculino 17 11 2 3 1
Total 6 6 0 0 0
Femenino 6 6 0 0 0
Masculino 0 0 0 0 0
Total 37 27 7 3 0
Femenino 22 16 5 1 0
Masculino 15 11 2 2 0
Total 6 2 0 2 2
Femenino 5 2 0 2 1
Masculino 1 0 0 0 1
Total 5 2 0 2 1
Femenino 4 2 0 1 1
Masculino 1 0 0 1 0
Total
15
16
17
18 y más
Resultado de Matemática (2011)Edad Sexo
Gráficas con dos variables
46
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Total 1 2 3 4 5 6 7 8 9
Sexo Femenino Sexo Masculino
Distribución de alumnos por sexo según grupo (Primer año
bachillerato, Liceo Miranda, año 2011)
Gráficas con dos variables
47
0
20
40
60
80
100
120
140
160
180
200
Total Promovido Fallo en suspenso Repite
Fallo reunión final de profesores
Femenino
Masculino
Distribución de alumnos por sexo, según fallo reunión final
de profesores (Primer año bachillerato, Liceo Miranda, año
2011)
Gráficas con dos variables:
usos de escala En el siguiente ejemplo se observará como el
cambio de escala en los ejes de la gráfica
influye en la interpretación de la observación.
Valor nominal mensual de la hora docente (efectivos e interinos
titulados, tiempo extendido, segundo ciclo) según grado.
48
Grado Salario Nominal
Diferencia porcentual
1 704 -
2 739 4,97
3 773 4,60
4 815 5,43
5 868 6,50
6 925 6,57
7 987 6,70
Gráficas con dos variables:
usos de escala
49
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7
Salario nominal por hora, según grado
Gráficas con dos variables:
usos de escala
50
650
700
750
800
850
900
950
1000
1 2 3 4 5 6 7
Salario nominal por hora, según grado
Propuestas finales
Se propone que el conjunto de los
docentes decidan un tema a investigar
durante el año lectivo, de manera que sus
conclusiones sean de utilidad a la
comunidad educativa.
Este tema puede involucrar solo uno de los
niveles, ser general para el liceo o incluso,
involucrar los liceos de donde provienen la
mayoría de nuestros alumnos.
51
52
MUCHAS GRACIAS POR SU
ATENCIÓN.
ESPERO QUE ESTAS JORNADAS
HAYAS SIDO DE INTERÉS PARA
TODOS Y PUEDAN SER DE
UTILIDAD PARA MEJORAR LOS
PROCESOS EDUCATIVOS.