tesis de magÍstereconomia.uc.cl/docs/tesis_mkluttig.pdf · análisis descriptivo de datos 17...
TRANSCRIPT
D O C U M E N T O D E T R A B A J O
Instituto de EconomíaTESIS d
e MA
GÍSTER
I N S T I T U T O D E E C O N O M Í A
w w w . e c o n o m i a . p u c . c l
Existencia de Efecto Compañero en lasSalas de Clases de las Escuelas Críticas
Martha Kluttig.
2004
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
FACULTAD DE CIENCIAS ECONOMICAS Y ADMINISTRATIVAS
TESIS DE MAGÍSTER
“Existencia de Efecto Compañero en las salas de
clases de las Escuelas Críticas”
Profesores: Rodrigo Harrison
Claudio Sapelli
Raimundo Soto
Alumno: Martha Kluttig V.
Fecha: 14 diciembre 2004
INDICE
INTRODUCCION 3
Las Escuelas Críticas 5
REVISION BIBLIOGRAFICA 6
MODELO ANALITICO 9
Modelo de Logro con Influencia de los Pares 9
Estructura de Pares 10
ESTRATEGIA EMPIRICA 11
Problemas Potenciales 13
DATOS 14
Análisis y Cuestionamiento de la Base de Datos 15
Análisis Descriptivo de Datos 17
ESTIMACIÓN DEL MODELO 19
Construcción de Variables 22
ANALISIS DE RESULTADOS ECONOMETRICOS 24
Comparación de Estimaciones Enriquecidas Progresivamente 24
Estimación Base 26
Estimación con Quintiles de Rendimiento 28
CONCLUSIONES 31
REFERENCIAS 32
ANEXOS 34
2
INTRODUCCIÓN
¿El rendimiento escolar de un alumno es afectado por las características, comportamientos
y desempeños de sus compañeros de clase?, ¿qué alcance y forma posee dicho efecto?,
¿cómo determina el logro académico del alumno? Éstas han sido preguntas frecuentemente
planteadas y diversamente respondidas, lo cual ha provocado que en el caso chileno no
haya conclusiones unidireccionales al respecto. Es por esta razón que el objetivo es precisar
y centrar el tema del efecto compañero sobre su existencia y forma, en cuanto a si éste es
bidireccional y si depende de la posición relativa de rendimiento del alumno.
Se utilizan bases de datos cruzadas de los estudiantes para identificar el impacto de la
composición de la clase sobre el rendimiento y para diferenciarlo de otros aspectos de la
calidad del establecimiento educacional que quizás dirija la relación observada entre el
logro y la composición del curso. En primer lugar, se estimarán funciones de producción
educacionales usando variables instrumentales y efectos fijos de colegio y de cohorte. En
segundo lugar, se correrán regresiones que distingan a los distintos quintiles de la
distribución de puntajes de la prueba para permitir que el efecto compañero difiera para
cada tipo de alumno. Se controlará por las características observadas familiares y del
colegio, pero será la habilidad para controlar por efectos fijos la que permitirá una
identificación más clara. La estimación por variables instrumentales con efectos fijos
determinará la existencia del efecto compañero, mientras que la estimación para distintos
quintiles de la distribución de puntajes informará sobre la forma del efecto compañero.
El cuestionamiento sobre el efecto compañero proviene de distintos frentes. Un grupo de
argumentos se centra en las ganancias de aprendizaje para los alumnos de sectores de nivel
socioeconómico bajo. Los alumnos de este grupo tendrían una mejor oportunidad
educacional en escuelas que atienden también a alumnos de niveles más altos. Por otra
parte el efecto compañero hace tiempo que ha sido interés de los cientistas sociales, ya que
su existencia, podría potencialmente afectar la organización de los colegios. Los
economistas en particular, estamos interesados en el efecto compañero porque de existir, es
por definición una externalidad que no ha sido internalizada, al no haberse definido los
derechos de propiedad. Específicamente, los alumnos buenos deberían poder vender su
impacto positivo sobre el rendimiento de sus compañeros de clase si es que el hecho de
3
estar en dicha sala le provoca un costo, por lo tanto, con un plan de subsidios bien
diseñados, un sistema de precios sería capaz de internalizar las externalidades provocadas
por el efecto compañero. En consecuencia, la existencia de este efecto puede crear
oportunidades para una intervención que aumente el bienestar social, de manera que los
precios internalicen el valor del efecto compañero.
Antes de seguir, se debe mencionar que el efecto compañero, más adelante definido, existe
cuando el comportamiento de una persona es afectado por su interacción con sus pares. La
influencia de los pares sobre el alumno se despliega en todo aspecto de su desarrollo, sin
embargo, por motivos metodológicos, se determina que el efecto que tienen los pares sobre
el alumno se centra en su rendimiento escolar. Si nos referimos a la dinámica del efecto
compañero, tal como lo explican los profesores de las Escuelas Críticas, cabe señalar que
éste incluye a los estudiantes que le enseñan a otros o que un determinado comportamiento
medioambiental de un estudiante puede afectar a sus pares positiva o negativamente, por
ejemplo, un estudiante que no ha aprendido autodisciplina en su hogar puede desordenar la
clase generando desconcentración. El efecto compañero quizás también actúe a través de la
forma en que los profesores se enfrentan a los alumnos, ya que los profesores pueden
reaccionar diferentes ante los alumnos vulnerables creando una atmósfera en la sala de
clases en la cual se espera que dichos estudiantes se desempeñen mal. Además, la
composición de la clase determina la metodología de enseñanza y el nivel de profundidad
alcanzado por la clase. En palabras simples, a medida que los alumnos que componen el
curso posean un menor nivel de habilidades o rendimiento, el profesor fijará metodologías
y metas de aprendizaje más básicas para asegurarse que ningún alumno de la clase quede
atrás.
En la siguiente sección se procederá a profundizar el tema de las Escuelas Criticas que a
pesar de haber sido nombradas anteriormente no han sido definidas ni caracterizadas. Se
revisará la literatura relevante para luego definir el modelo analítico y la estrategia
empírica. Se realizará un análisis de la base de datos para entender mejor el alcance de las
conclusiones de esta investigación y posteriormente se estimará el modelo con datos en
nivel, con y sin efectos fijos y con quintiles de rendimiento para luego analizar los
resultados y determinar las conclusiones.
4
Las Escuelas Críticas
Las Escuelas Críticas son aquellas definidas por el Proyecto Ministerial LEM como las de
peores resultados en el SIMCE de Cuarto Básico del año 1999 de la Región Metropolitana,
lo cual implica que son los 64 establecimientos que lograron los resultados más alejados
por debajo de la media nacional (Ver Anexo 1). La Campaña Lectura, Escritura y Lenguaje
denominada LEM nace en el marco de la reforma educacional en curso y constituye una
iniciativa nacional cuyo propósito es mejorar el aprendizaje en Lenguaje y Matemática.
Desde el punto de vista de su gestión, la Campaña es coordinada por diversas unidades del
Ministerio de Educación que a su vez encargan el desarrollo e implementación de
programas a siete Instituciones Privadas1, cada una, responsable de un conjunto de Escuelas
Criticas, agrupadas en función de su ubicación. Puntualmente, la Facultad de Pedagogía de
la Universidad Católica de Chile (PUC de aquí en adelante) tuvo la posibilidad de elegir el
conjunto de Escuelas Criticas que estarían bajo su tutela, debido a que fue la Institución
mejor evaluada de entre todas las que postularon para participar en la Campaña LEM. La
PUC posee a su cargo actualmente 13 establecimientos ubicados en las comunas de La
Pintana, La Florida, Macul, Peñalolén y Puente Alto. (Ver Anexo 2).
Para ofrecer una idea de la situación, es útil considerar que el 100% de las Escuelas Criticas
son beneficiarias activas del Programa de Ayuda Escolar (PAE) de la Junta Nacional de
Auxilio Escolar y Becas (JUNAEB), el 85% de ellas está en sector urbano de la Región
Metropolitana y el 75% depende de un Municipio o de una Corporación Municipal.
Resumiendo, las Escuelas Críticas son un grupo que se diferencia de otros en la Región
Metropolitana debido a que enfrentan condiciones de desempeño adversas que se reflejan
en los rendimientos académicos de sus alumnos y que justifican la intervención
proporcionada. Por lo tanto, cualquier grupo extraíble de las 64 escuelas críticas no es una
muestra aleatoria, en consecuencia, los resultados de la investigación sólo son aplicables a
las escuelas de peor rendimiento en el SIMCE de la Región Metropolitana. Las
conclusiones a partir de este trabajo permitirán generar información útil para el diseño de
programas dirigidos a la superación de las peores escuelas de Santiago.
1 Centro de Investigación y Desarrollo de la Educación, Fundación Chile, Fundación Leiva, Corporación Educacional ORT, PUC, Universidad Diego Portales y Universidad de Humanismo Cristiano.
5
REVISIÓN BIBLIOGRÁFICA
En los últimos años, en Chile se han realizado diversos estudios empíricos basados en los
datos de la prueba SIMCE2, muchos de ellos estiman funciones de producción educacional
buscando determinar los factores que inciden en el rendimiento escolar de los estudiantes.
Entre ellos, McEwan (2001) estimó el efecto compañero sobre el logro estudiantil usando el
SIMCE de 1997 aplicado a los Octavos Básicos en Chile. Los datos le entregaron
detalladas medidas de las características de los pares en cada sala de clases dentro de un
colegio. El autor soluciona el problema de la endogeneidad de las variables de los pares
mediante la introducción de efectos fijos del colegio que controlan por las características no
observadas de los estudiantes y de sus familias. Sin embargo, este estudio fue hecho en
base a un corte transversal del logro, lo cual le quita grados de libertad a la estimación y
fomenta sesgos en la misma.
Sin embargo, la mayor parte de los estudios realizados se centran en comparaciones del
rendimiento según dependencia de los colegios. La gran mayoría de estos estudios3 estiman
las funciones de producción educacional utilizando el método de mínimos cuadrados
ordinarios (MCO); en algunos trabajos se corrige por el sesgo de selección que se produce
al no tener una asignación aleatoria de estudiantes a los distintos tipos de colegios. Además,
muchos de estos estudios trabajan con datos promedio por establecimientos, debido a la no
disponibilidad de datos socioeconómicos individuales de los estudiantes.
En general, los resultados de las investigaciones permiten concluir que las características
familiares son variables estadísticamente significativas para explicar el desempeño de los
estudiantes en los diferentes tipos de establecimientos educacionales. Sin embargo, sus
conclusiones difieren al comparar el desempeño de los establecimientos de acuerdo a su
dependencia. Se observa que hay una diversidad de resultados, algunos se explican porque
los autores trabajan con diferentes pruebas SIMCE, pero aún si se trabaja con los mismos
datos se obtienen distintos resultados. En parte, esta diversidad de resultados se explica por
2 Ver Aedo (1997), Aedo y Larrañaga (1994), Bravo et al (1999), McEwan y Carnoy (2000), Mizala y Romaguera (1998, 2000, 2001, 2002), Rodríguez (1988), McEwan (2001), Gallego (2002), Sapelli y Vial (2001), Tokman (2001). 3 Ver Aedo (1997), Aedo y Larrañaga (1994), Bravo et al (1999), McEwan y Carnoy (2000), Mizala y Romaguera (1998, 2000, 2002), Rodríguez (1988), McEwan (2001), Gallego (2002), Tokman (2001).
6
las metodologías utilizadas (MCO, MCO con corrección por sesgo de selección, MCO con
efectos heterogéneos, etc.). De allí que sea necesario continuar con estas investigaciones
utilizando metodologías que nos permitan arribar a resultados robustos.
La línea de investigación extranjera más importante se centró en el efecto de la
composición racial sobre el logro de los alumnos negros y de otros grupos demográficos.
Crain (1970), Boozer et al. (1992), Grogger (1996), y Hoxby (2000) encontraron que la
composición racial afecta el rendimiento académico, social o económico. Hanushek (1972)
encuentra que mayores concentraciones de estudiantes negros daña el rendimiento de
negros y blancos, pero reconoce que la composición racial del colegio puede ser
simplemente una proxy de la heterogeneidad de la calidad del colegio o de otros factores
omitidos, lo cual puede estar contaminando las estimaciones. En el mismo sentido
concluyen Kain y O´Brien (2000), ellos encuentran que los estudiantes negros se benefician
al entrar a colegios racialmente mixtos. Sin embargo, a diferencia de los trabajos anteriores,
Rivkin(2000) no encontró evidencia que la compañía de blancos aumente la asistencia
escolar o los ingresos de mujeres u hombres negros en la secundaria de 1982. En general,
los hallazgos han sido diversos y a veces contradictorios, lo cual puede deberse a la
dificultad de aislar el impacto causal de las características de los pares, además de existir
problemas conceptuales y de datos.
Aparte de aquella línea de la literatura que se centra en la composición racial de las salas de
clase, existe una amplia variedad de análisis y de perspectivas para abordar el tema del
efecto compañero. La literatura pertinente se puede agrupar según la línea metodológica
utilizada para evaluar el efecto compañero. De esta manera, tenemos los estudios que
utilizan la metodología de tratamiento: Epple y Romano (1998) y el Documento de Trabajo
de Sapelli y Vial (2003). Estos trabajos sólo buscan determinar la importancia del efecto
compañero, sin embargo, esta metodología no permite realizar el análisis de medias y
varianzas necesario para responder las preguntas objetivo del presente trabajo. Así, el grupo
de literatura relevante, es la que tiene relación con el uso de econometría “simple” que basa
su robustez en estrategias empíricas particulares. Este segundo grupo esta formado por:
Hanushek et al.,(2002a), Hanushek et al., (2002b), Sapelli (2003), Mizala y Romaguera
(2002), Hoxby (2000) y Hoxby (1998).
7
Además de revisar la literatura teórica para determinar de qué manera las interacciones
entre los estudiantes se manifiestan, es importante poner atención en los efectos no
observados o en las variables omitidas. Por ejemplo, ni Crain (1970), Boozer et el. (1992) o
Wolkon (1992) controlan por diferencias socioeconómicas o por el rendimiento académico
anterior y Rivkin(2000) usa medidas agregadas a nivel de colegio de la exposición de
estudiantes blancos para atacar el problema de la no aleatoriedad de la ubicación en y
dentro del vecindario y de la asistencia a colegios fuera del vecindario; En general, dado
que las familias con mayores recursos tienden a elegir colegios con menor asistencia de
negros, la investigaciones sobre los efectos de la composición racial fácilmente los
confunden con elementos no observados de las familias, colegios o vecindarios.
La metodología a utilizar más adelante se basa principalmente en la propuesta por
Hanushek et al.,(2002) que es complementada con lo revisado anteriormente. Los autores,
usando un matched panel data set construido por el Proyecto de Colegios de Texas UTD
que consta de 3 cohortes sucesivas, 600.000 estudiantes en más de 3.000 colegios públicos
pero con pobres datos socioeconómicos, buscan descubrir los efectos de la composición
racial de los colegios sobre el logro. Sus resultados muestran que un mayor porcentaje de
compañeros de raza negra tiene un fuerte efecto adverso sobre el logro de ellos mismos y,
además, los efectos se encuentran altamente concentrados en la mitad superior de la
distribución de habilidad. El autor, al igual que Tokman (2001), incluye términos de
interacción entre las variables para permitir diferentes retornos de los insumos escolares
para estudiantes de diferentes niveles socioeconómicos. Algunos estudios para países
desarrollados han utilizado esta metodología. Eide y Showalter (1998), en un estudio para
EE.UU., encuentran que algunos recursos que parecen no tener efectos para los puntajes
promedios, pueden en realidad tener efectos significativos en otros puntos de la distribución
de puntajes. Por su parte, Levin (2001) también utiliza regresiones de quintiles para
investigar el efecto de los pares en el sistema educacional holandés, concluye que estudiar
con pares similares tiene un efecto significativo y positivo para aquellos estudiantes de
menores puntajes en las pruebas estandarizadas que se ubican en los menores quintiles de
puntaje.
8
MODELO ANALITICO
Modelo de logro con influencia de los pares.
El logro de hoy es influenciado no sólo por la familia, el colegio o las características de los
pares actuales sino que también por el pasado que establece la base del aprendizaje actual.
Esta relación fundamental es capturada como una función de producción representada por
la ecuación (1) que describe el logro (A) para un estudiante i en el grado G, en el colegio s,
(1) ∑ ∑∑ ∑= =
−
− −
=
−
=− ++++++=
1
1
1
1)(
1
1
1)(
G
g
G
gigsggsi
g
G
gggsgigsGGsiGGsGiGsiGs ePSXPSXA λδβλδβ
−1G
insumos actuales insumos pasados acumulados
Donde P mide el desempeño del par. X son los vectores del background familiar relevante.
S representa los insumos del colegio. Además, el índice (-i) indica que la medida del par
omite los atributos del estudiante i.
La mayor parte del trabajo empírico existente se basa sólo en datos contemporáneos de la
familia, pares y colegios, centrándose sobre la directa investigación de cómo las
características agregadas del colegio, como lo es la composición racial o el promedio de
habilidad del par, influencian el logro actual. Pero con seguridad se puede sugerir que la
composición actual está correlacionada con la composición pasada o con otros
determinantes del logro que no son corrientes al periodo.
El acercamiento al problema general de estimar las relaciones del logro comienza con
tomar las primeras diferencias de la ecuación (1). Específicamente, si está determinado
por , incluye todos los insumos a lo largo de G-1, con lo cual la especificación del
logro en términos del crecimiento reduce los requerimientos de datos a sólo los insumos
relevantes para el grado G ya que todas las influencias históricas sobre el nivel de
desempeño actual se anulan. La ecuación (2) describe la especificación en término de
crecimiento:
GA
1−GA AG
ccccc− )( iGsGsiGsiGsiGs PSXA υλδβ +++=∆ (2)
9
Donde es la ganancia de logro (diferencia entre el puntaje del test de grado actual y
del grado anterior) para un estudiante i en el grado G en el colegio s en la cohorte c. El
crecimiento del logro del estudiante está relacionado con los insumos contemporáneos, con
lo cual el problema de las variables históricas omitidas es evitado. De esta forma, la
representación del logro que separa las influencias presentes y pasadas determina la
estrategia empírica de la investigación, más aún, tal estimación ha sido considerada como
estado del arte en la estimación de los modelos de logros (Hanushek(1986)).
ciGsA∆
Estructura de pares.
Hasta este punto la discusión se enfocó en complicaciones econométricas de la estimación
pero no sobre la especificación e interpretación de las influencias de los pares en sí.
La ecuación (3) describe el link entre el desempeño del par y la composición de pares
medida en cada año como una simple función lineal de los compañeros agregados:
(3) GsiYGsiAGsiGsi uYP )()()()( −−−− ++Γ= γγ
Donde Γ es la habilidad promedio de los pares o la habilidad cognitiva que será medida con
la proxy de educación de la madre del alumno, Y es una medida de ingreso familiar de los
pares, y u es un termino de error que captura todas las otras influencias sobre el desempeño
de los pares. De esta forma el modelo estructural es el siguiente:
(4) cccciGsGsiYGsiAGsiGsiGsiGs uYSXA υλγγδβ +++Γ++=∆ −−− )(_)()(
Esta última especificación posee dos aspectos positivos que saltan a la vista. Primero, la
primera diferencia tomada del logro permite librarse de cualquier tipo de efecto fijo
presente. Segundo, el requerimiento de datos es de sólo dos observaciones de cada
estudiante, no obstante, desde el punto de vista econométrico, no evita problemas
provenientes de la omisión o error de medición de factores contemporáneos. Por tres
razones este asunto es particularmente importante en el contexto de la estimación de las
influencias de los pares sobre el crecimiento del logro: primero, las investigaciones
acumuladas sobre la determinación del logro han demostrado vivencialmente lo difícil de
10
generar una adecuada caracterización tanto de los insumos escolares como de los familiares
y de la habilidad individual. Segundo, las decisiones sistemáticas sobre colegio y
vecindario de los padres inducen una correlación entre las características familiares tales
como ingreso y educación. Tercero, dado que hay muchos padres que poseen mejor
información sobre los colegios y vecindarios que los econometristas, los elementos mal
medidos de la calidad de la escuela estarán correlacionados con las medidas agregadas de
las familias tales como el ingreso, resultado promedio de la prueba o composición. Estos
factores se combinan para elevar la importancia de la especificación del modelo en el caso
de la estimación en cuestión, porque estos factores omitidos por si solos pueden hacer
parecer importantes a los pares, incluso cuando no hay influencia de los pares en los logros
(Moffitt (2001)).
ESTRATEGIA EMPÍRICA
La primera estrategia para lidiar con los asuntos generales sobre la especificación se basa
en descomponer al término del error de las diferencias sistemáticas en las familias y las
escuelas que son las fuentes primarias de sesgo. A partir de la ecuación (2), la ecuación (5)
descompone el error υ en una serie de componentes que destacan como los factores que
probablemente contaminan las estimaciones.
(5) ccciGssiiGs εθωωυ +++=
Los primeros tres términos capturan los efectos sobre el logro que son invariantes en el
tiempo, relacionados con el individuo ( iω ), con el colegio ( sω ) y con la cohorte ( ) y el
factor final ( ) es el error aleatorio que captura los shocks del logro individual que
varían a lo largo del tiempo.
cθ
cε iGs
La estimación usa 4 cohortes sucesivas para remover explícitamente los primeros 3
componentes del término de error. La estimación del efecto del grupo de pares se basa, por
lo tanto, en las diferencias de las cohortes en el cambio de la composición, es decir, la
estimación está identificada por pequeñas diferencias en los patrones de la habilidad dentro
de un colegio y de un grado entre cohortes.
11
Se destaca como los efectos fijos dan cuenta de las primeras diferencias sistemáticas pero
no observadas en los estudiantes y colegios. Los efectos fijos de estudiante dan cuenta de
todos los factores familiares y estudiantiles que no varían a lo largo del periodo de
observación del logro y que afectan la tasa de aprendizaje, es decir, incluyen diferencias de
habilidad, influencias motivacionales, materiales de estudio, actitudes de los padres hacia el
colegio o pares, etc. Además, cualquier diferencia fija en colegios que no esté
perfectamente correlacionada con las variables incluidas (S y X) es considerada por efectos
fijos a la escuela. Estos efectos incluyen elementos estables de la calidad del colegio, de los
profesores y del currículo.
La importancia de múltiples cohortes, que permite la estimación de los efectos fijos a ellas,
no debe ser subestimada. Consideremos la posibilidad que el logro de los estudiantes en
algunos colegios tiende a declinar cuando la proporción de hombres que entran al colegio
aumenta. Quizás los padres de mujeres se vuelvan más propensos a sacar a sus hijas de los
colegios ante dicha situación. Sí sólo los efectos fijos de colegio y de alumno son
removidos (lo cual es lo único posible cuando se posee sólo una cohorte), la estimación
negativa sobre la proporción de hombres sugeriría que el aumento de ésta perjudicó el
rendimiento de los alumnos que permanecieron en la escuela, cuando en realidad otros
factores han introducido una relación espuria entre la ganancia de logro y la composición
de género. Por otra parte, si los efectos fijos de estudiantes y de cohorte son removidos tal
como es posible con múltiples cohortes, tales cambios sistemáticos en colegios específicos
no pueden manejar los resultados.
La sustitución de la proposición (5) en (4) produce la especificación en forma reducida que
determina la base del análisis empírico de la estrategia de efectos fijos.
(6) )( )()()( GsiiGsGssiAGsiyGsiGsiGsiGs uYSXA −−− +++++Γ+++=∆ γεθωωγγδβ cccccc
En esta representación los coeficientes asociados a las características observadas del grupo
de pares revelarán el link entre el logro y dichas variables. Esta forma reducida pierde parte
de la complejidad de la realidad de la sala de clases, sin embargo, provee información
relevante para las políticas relacionadas con la composición de la clase.
12
Problemas potenciales.
La ecuación (6) representa el modelo que revelará la relación entre la ganancia de
rendimiento académico y sus determinantes, pero tal como se ha mencionado, existe la
posibilidad que las variables correspondientes a los pares estén correlacionadas con el error,
lo cual tendería a sesgar las estimaciones de los coeficientes relevantes. La correlación
podría provenir de la omisión de determinantes familiares del logro que se correlacionan
con las variables de los pares dado que, tal como ilustraron Evans et al. (1992), las familias
eligen sus residencias y los colegios en función de las características observadas por los
grupos de pares potenciales. Dicho de otra forma, las mismas familias pueden poseer
características no observadas, tales como despreocupación por el rendimiento escolar, lo
cual probablemente influencie negativamente los logros de los estudiantes. En este caso, las
variables observadas de los pares están negativamente correlacionadas con los
determinantes individuales no observados de los logros académicos, lo cual puede sesgar
las estimaciones de los efectos de la composición de la clase hacia abajo. Así podemos
asumir que los estudiantes y familias que eligen un determinado colegio comparten
similares preferencias, motivaciones y otras características no observables que influencian
el desempeño de sus hijos. Tomando en cuenta estos hechos, la estrategia basada en el uso
de variables instrumentales indica que se deben buscar instrumentos para las variables de
los pares de la ecuación (6) que determinan el impacto de la habilidad de los pares y del
ingreso de ellos sobre la ganancia de rendimiento. Sin embargo, dado el potencial problema
de multicolinealidad que presentan el ingreso promedio de los pares con la educación
promedio de ellos, se optó por incluir sólo la primera medida para, de esta forma, lograr test
de significancia confiables. Por lo tanto, se hizo necesario encontrar sólo el instrumento
para el ingreso promedio de los pares.
Por otra parte, la validez de la estimación de efectos fijos se basa en el supuesto que los dos
componentes del error, θ y ε de la ecuación (3), son ortogonales a las variables de los
pares. Una preocupación relevante es la posibilidad que los cambios en la composición
estén correlacionados con otros cambios en los insumos del colegio o de la familia. La
severidad de este problema potencial depende en parte de la habilidad de controlar los
cambios en las familias y colegios.
13
DATOS
Se utilizarán dos bases de datos que serán posteriormente cruzadas. La primera es una
generada por la Facultad de Pedagogía de la Universidad Católica en el marco de la
Campaña LEM que determinó evaluaciones sucesivas durante 2 años a estudiantes de
primero a cuarto año básico, pertenecientes a 13 escuelas seleccionadas por sus magros
resultados en las pruebas SIMCE4. Dichas pruebas fueron diseñadas para entregar puntajes
del rendimiento en lenguaje y matemáticas de manera comparable año tras año; de todas
maneras, se estandarizó cada prueba5 para que así el puntaje entregue una medida de la
posición relativa en la distribución del rendimiento.
Por otro lado, la segunda base de datos a utilizar será la construida por la JUNAEB para
determinar la distribución de los recursos del PAE entre los estudiantes del sistema
educacional municipal y particular subvencionado. La encuesta tiene por objetivo evaluar la
condición de vulnerabilidad de los alumnos que postulan al PAE y así determinar el Índice
de Vulnerabilidad Escolar (IVE) de cada establecimiento. Las encuestas se hacen todos los
años a alumnos de primero básico y primero de enseñanza media de colegios de la región
metropolitana y contienen información sobre género, peso, talla, caries, estudios y
ocupación del jefe de hogar, años de educación de la madre, entre otras. También se incluye
información sobre los colegios tal como el sector en que se encuentra, sostenedor, etc.
Las dos bases de datos son cruzadas con el Rol Único Tributario (Rut) de cada alumno, lo
cual indica que la información entregada por ellas es específica a cada uno. En resumen, los
cruces de información permiten tener puntajes de dos evaluaciones sucesivas y
comparables de cada alumno para 4 cursos básicos de 11 escuelas críticas identificando a su
profesor y sala de clases, más información sobre cada niño que rinde la prueba en cuanto a
su situación familiar e individual.
4 Ver listado de escuelas y algunas de sus características en el anexo 1 5 Se utilizó para estandarizar los puntajes de la prueba 2003 su media y su desviación estándar. Por otra parte se hizo lo mismo con los puntajes de la prueba 2002. La resta del puntaje estandarizado obtenido por el alumno i en el año 2003 menos el puntaje estandarizado obtenido por el alumno i en la prueba 2002 es la ganancia o pérdida de rendimiento, que es la variable dependiente de las estimación más adelante mostrada.
14
Análisis y Cuestionamiento de la Base de datos
En esta sección se realiza un análisis de los datos debido a que la construcción de la base
amerita un cuestionamiento en cuanto a su representatividad de las Escuelas Críticas de la
Región Metropolitana para definir el alcance de las conclusiones del presente trabajo y en
cuanto a su composición interna que determina la validez de ellos.
La tabla 1 muestra la composición de la muestra a utilizar en las estimaciones y donde se
puede apreciar que contiene: 11 colegios que representan al 17% del total Escuelas Críticas
de la Región Metropolitana, 4 cohortes6, un total de 60 cursos, 1623 alumnos evaluados por
la Junaeb y una vez por la Facultad de Pedagogía de la Universidad Católica, de los cuales
1232 presentan 2 evaluaciones sucesivas.
Tabla 1. Composición de la muestra: número de colegios, cohortes, cursos y alumnos. COHORTE 0 1 2 3
LETRA 1 2 3 4 1 2 3 1 2 1 2 3 TOTAL Escuela Papa Juan Pablo II 0 0 0 0 16 0 0 0 0 34 0 0 50 Escuela Apóstol Pablo 9 0 0 0 10 0 0 0 11 15 0 0 45 Escuela D 536 20 26 0 0 30 0 0 37 31 27 31 0 202 Colegio Forjadores del Futuro
30 0 0 0 12 21 0 34 29 31 35 25 217
Colegio San Francisco de Mapuhue
9 8 0 0 0 0 0 19 31 20 32 0 119
Colegio Miguel Ángel 17 26 0 0 34 23 0 28 0 31 34 0 193 Colegio Capitán Pastene 20 21 21 19 0 0 29 0 38 28 0 0 176 Escuela Óscar Bonilla 24 24 0 0 36 0 0 0 39 106 0 0 229 Escuela Los Cerezos 0 0 0 0 0 0 0 0 35 0 36 0 71 Colegio Santa Sofía 0 0 0 0 30 0 0 33 33 29 25 0 150 Escuela Luis Gregorio Ossa 24 23 0 0 19 28 0 0 22 31 24 171 CANTIDAD 153 128 21 19 187 72 29 151 269 352 217 25 1623 CANTIDAD DE CURSOS 8 6 1 1 8 3 1 5 9 10 7 1 60 PROM DE ALUMNOS POR CURSO
27.1
Entonces, tenemos que un 25% de la muestra no posee dos evaluaciones comparables, lo
cual hace que no sea posible incluirlos en la estimación por el lado de la variable
dependiente. Sin embargo, dado que los 1232 alumnos que entregan datos para la variable
dependiente necesitan datos sobre su curso, se utilizan los datos de los 1623 alumnos para
6 La cohorte 0 es aquella que cursó primero básico en 2002. La cohorte 1 es aquella que cursó segundo básico en 2002. La cohorte 2 es aquella que cursó tercero básico en 2002. La cohorte 3 es aquella que cursó cuarto básico en 2002.
15
ello, dicho de otra manera, las variables independientes: la desviación estándar de la
educación de las madres del curso del alumno i, la cantidad de alumnos por profesor en la
sala de clases del alumno i, el promedio del ingreso de los pares del alumno i y el
porcentaje de alumnos de rendimiento similar al alumno i, fueron calculadas incluyendo la
información de los 1623 alumnos para de esta manera no perder importante información
relacionada con las características del curso, que de no existir, podrían sesgar las
estimación ya que probablemente los alumnos que no dieron la prueba el 2003 tengan algo
en común. Se debe aclarar que existen principalmente dos razones para que un alumno no
rinda la segunda prueba: inasistencia escolar o cambio de establecimiento después de la
primera evaluación pero antes de la segunda. Se descarta la posibilidad que un alumno
desaventajado no asista a rendir la prueba motivado por sus profesores para que el curso
obtenga un mejor puntaje promedio ya que los profesores no enfrentan incentivos para
buscar influir en los resultados. Por otra parte, que el alumno se cambie de colegio es
atribuible a que él fue retirado de éste por sus padres para buscar uno que se adapte mejor a
sus necesidades en cuanto a la ubicación del colegio, nivel de exigencia, etc. o pudo ser
expulsado por mal rendimiento o comportamiento. Cualquiera que sea el motivo de cambio
de colegio que posean los alumnos, podrían tener características comunes que sesguen la
estimación con un signo incierto, por lo tanto, se optó por incluir a los 1623 alumnos en los
cálculo de las variables relacionadas con el curso de los 1232 alumnos que rindieron las dos
pruebas.
Además, llama la atención que no todos los cursos de primero a cuarto básico de los 11
colegios evaluados por la Facultad de Pedagogía de la Universidad Católica rindieron la
prueba 2002. La justificación de esto se funda en hechos aleatorios que dependieron
simplemente de la voluntad de los encargados del proyecto en función de la carga de
trabajo que estaban dispuestos a aceptar, así, muchas veces los criterios usados para decidir
que cursos se evaluaban fueron diferentes al interés de tener grupos de control, siendo estos
simplemente la incompatibilidad horaria, restricciones de presupuesto o de tiempo, etc. Por
lo tanto, hay que aclarar, que el hecho que no todos los curso de los 11 colegios hayan sido
evaluados al menos una vez, no sesga la estimación de la existencia del efecto compañero.
16
Análisis Descriptivo de los Datos
Para ofrecer una idea de la situación de las escuelas en cuestión, se puede decir que el
100% de las Escuelas Críticas es beneficiario activo del PAE de la JUNAEB, el 85% de
ellas se encuentra en un sector urbano de la Región Metropolitana y el 75% de las 64
Escuelas Críticas depende del Municipio respectivo o de una Corporación Municipal
mientras que el 25% restante recibe Subvención. A modo de comparación se puede
verificar con respecto a la muestra a utilizar para la estimación que el 100% de las Escuelas
Críticas es beneficiario activo del PAE de la JUNAEB y se encuentra en un sector urbano
de la Región Metropolitana. Además el 46% de las 11 Escuelas Críticas depende del
Municipio respectivo o depende de una Corporación Municipal mientras que el 54%
restante recibe Subvención (54%). El IVE promedio de todas las Escuela Críticas es 47.7%
y el IVE promedio las Escuelas Críticas a cargo de la PUC es de 45.6%.
La representatividad de la muestra a utilizar en las estimaciones en cuanto a las 64 escuelas
críticas, se demuestra al realizar test de medias y varianzas de las variables continuas
consultadas en las encuestas de la JUNAEB para las 11 escuelas críticas a cargo de la PUC
versus las 50 escuelas restantes.
Tabla 2: Resultados de Test de Medias y Varianzas para la Cohorte O.. 50 escuelas 14 escuelas Cohorte 0 Media Desv.
Estándar Media Desv.
Estándar Sexo: Hombre 0.52 0.48 Sexo: Mujer 0.48 0.52
22.56 4.8972 22.59 4.59 Peso de los alumnos en kilos -0.0001* 1.1386**
117.14 6.52 117.19 6.31 Talla de los alumnos en cm. -0.0001* 1.0658**
6.68 3.13 6.82 3.00 Años de Educación de la Madre de los alumnos -0.0006* 1.0903**
7.01 3.08 7.03 3.16 Años de Educación del Jefe de Hogar de los alumnos -0.0001* 1.0572**
5.69 2.45 5.54 1.89 Número de Personas que habitan el hogar de los alumnos 0.0011* 0.5979**
2.19 1.20 2.23 1.39 Número de piezas del hogar de los alumnos -0.0012* 1.3473**
*valor t calculado para la hipótesis de igualdad de medias muestrales. ** Valor calculado para la hipótesis de igualdad de varianzas muestrales.
17
Se puede observar que los test asociados a la hipótesis nula de que las medias muestrales
entre las 50 y 14 escuelas son iguales resultan no significativos, al igual que aquellos
realizados en función de las varianzas, es decir, no existen diferencias sistemáticas entre las
14 escuelas encargadas a la PUC y las 50 escuelas críticas restantes. Estos resultados, más
lo anteriormente señalado, permiten proponer razonablemente que los resultados
encontrados en la presente investigación serán generalizables para todas las Escuelas
Críticas de la Región Metropolitana, ya que la muestra usada en las estimaciones es
representativa de ellas.
Es una preocupación para la estimación posterior si la muestra cuenta con la varianza
suficiente para generar parámetros estimados estables. Esta preocupación nace de pensar
que los alumnos que asisten a las Escuelas Criticas poseen demasiadas características en
común, lo cual determinaría la imposibilidad de estimar los parámetros de interés. Sin
embargo, a continuación se muestra la varianza de años de educación de las madres de los
alumnos de cada uno de los 60 cursos que componen la muestra, para así mostrar la gran
heterogeneidad existente en las salas de clases de las Escuelas Críticas y despejar las
potenciales dudas relacionadas a ésta.
Tabla 3: Varianza Muestral de la Educación de las Madres de los Alumnos por curso. COHORTE 0 1 2 3
LETRA 1 2 3 4 1 2 3 1 2 1 2 3 total Escuela Papa Juan Pablo II 9.9 8.1 8.7
Escuela Apóstol Pablo 17.3 3.4 4.6 7.7 7.8
Escuela D 536 4.8 8.5 5.2 11.0 9.2 5.9 5.1 7.8 Colegio Forjadores del Futuro 7.0 9.3 7.5 9.2 10.9 6.4 5.2 7.6 8.5
Colegio San Francisco de Mapuhue
7.6 6.0 8.8 8.3 7.4 4.6 7.9
Colegio Miguel Ángel 3.7 14.2 11.9 13.4 9.2 9.4 19.2 13.5 Colegio Capitán Pastene 4.5 3.9 6.9 7 9.9 9.8 6.6 7.3
Escuela Óscar Bonilla 8.7 5.3 10.5 7.3 6.5 8.0
Escuela Los Cerezos 6.5 9.7 8.4 Colegio Santa Sofía 14.8 14.1 13.7 10.5 6.8 12.0 Escuela Luis Gregorio Ossa 6.2 3.9 11.1 9.7 8.7 9.6 11.1 8.4
18
ESTIMACIÓN DEL MODELO.
El modelo finalmente a estimar es:
(7) )( )()( GsiiGsGssGsiGsiGsiGs uYSXA −− +++++++=∆ γεθωδβ cccccc
Donde ∆ es la ganancia de logro (diferencia entre el puntaje del test obtenido en 2003 y
2002) para un estudiante i en el grado G en el colegio s en la cohorte c.
c
c
c
iGsA
iGsX incluye la educación de la madre del alumno i como proxy de su habilidad y la
ocupación del jefe de hogar para controlar por la estabilidad monetaria que enfrenta el
alumno i. También se incluye la desviación estándar del nivel de educación de las madres
del los alumnos del curso tal como lo hace Sapelli (2003). La inclusión de esta variable
responde a la idea que no solo el nivel importa sino que también su dispersión. En Epple y
Romano (1998) se asume que el rendimiento escolar es función positiva de la media de la
habilidad de la clase, lo cual implica que poner a dos alumnos más en un curso que posean
habilidad una o dos desviaciones estándar de la media en direcciones opuestas es lo mismo.
Pero es un hecho que no es lo mismo un curso formado por alumnos brillantes y
desaventajados que por alumnos parecidos. Por lo tanto, si la media de la habilidad de los
pares resulta ser productiva, también lo será una baja desviación estándar de la habilidad
promedio de los pares. Este tema es importante ya que el sorting no puede alterar la media
pero si puede disminuir el promedio de la desviación estándar de todos los colegios, es
decir, hacer que la desviación estándar promedio de la clase sea mucho menor que la
poblacional.
iGsX incluye el porcentaje de estudiantes con rendimiento similar al del estudiante
analizado. Tal como lo explica Mizala y Romaguera (2002), este efecto busca medir la
influencia de los pares en cuanto a la homogeneidad de la clase. Se operacionalizó
calculando el porcentaje de estudiantes en el curso del alumno i que tuvieron resultados en
la prueba 2002 igual a la del estudiante considerado más/menos 0.5 desviaciones estándar.
La desviación estándar utilizada es la que se obtiene para el conjunto de los estudiantes que
dieron la prueba.
19
)(Pr )(3)(2
131
21
cGsi
ciGs
csGsiGs
siGsKK
iGsKGsiGsciGs
uIngparofealu
DdepPorsemiDocuDsedumaEdumaA
−−
=
+++++
+++++=∆ ∑γεθωδδ
δβαββ13
cGsS incluye la dependencia del colegio que puede ser municipal o subvencionada, de esta
manera, se controla por una importante característica del establecimiento que determina los
incentivos y restricciones presupuestarias que enfrenta. También incluye la cantidad de
alumnos que forman cada curso del establecimiento para así determinar si el tamaño de la
clase afecta el rendimiento de cada alumno. La influencia del tamaño del curso se aprecia
desde el punto de vista del profesor que enfrenta al curso, ya que para él sería más fácil
enseñarle a un curso más pequeño y así concentrar y asegurar el aprendizaje de cada
alumno y no diluir sus esfuerzos, lo cual terminaría por potenciar el rendimiento del
alumno.
Sin duda que en (7) debió ser incluido un efecto fijo de estudiante que de cuenta de todos
los factores familiares y estudiantiles que no varían a lo largo del período de observación
del logro y que afectan la tasa de aprendizaje, es decir, que incluyen diferencias de
habilidad, influencias motivacionales, materiales de estudio, actitudes de los padres hacia el
colegio o pares, etc., sin embargo, las características de los datos disponibles, es decir, sólo
dos evaluaciones sucesivas por alumno que generan una estimación final de corte
transversal, no permiten la inclusión de una efecto fijo por alumno, en consecuencia, la
estimación sólo incluye efecto fijo al colegio y a la cohorte.
Finalmente el modelo completo es:
(8)
Tal como se mencionó, (8) será estimada con variables instrumentales para corregir el
sesgo de selección, lo cual hace necesario buscar un instrumento para el ingreso promedio
de los pares. Este instrumento es el promedio de caries de los compañeros de curso.
Teóricamente, la relación entre el ingreso de la familia y la cantidad de caries de sus
integrantes es evidente, ya que una familia en la medida que tenga mayor ingreso podrá
prevenir y solucionar los problemas dentales de los componentes del hogar. A continuación
se realiza una estimación para comprobar que esta variable es un buen instrumento.
20
(9) ikGskGSiGsikGskGsi rzSXY ++++= −− )(0)( αδββ
Aquí se regresa el ingreso promedio de los pares del alumno i con respecto a las restantes
variables incluidas en la ecuación (7) y el promedio de caries que poseen los pares. En (9)
por la definición de la proyección lineal del error, 0)( =ikGsrE
z
=
y r no esta
correlacionado con todas las variables incluidas. El supuesto clave en esta proyección lineal
es que el coeficiente asociado a sea diferente de cero, es decir, se debe rechazar la
hipótesis nula
ikGs
kGsi)(−
0α . En la estimación el coeficiente asociado a es -11.532
significativo a cualquier nivel de confianza. El signo del coeficiente es consistente ya que
dada la forma en que se expresan los datos, es esperable que a medida que aumenta ,
es decir, aumente el nivel de ingreso de los pares, la cantidad promedio de las caries de los
alumnos caiga. Estos resultados nos dicen que el promedio de caries de los pares del
alumno i está parcial y significativamente correlacionado con el ingreso promedio de sus
compañeros de curso, lo cual lo hace ser una correcta variable instrumental.
kGsiz )(−
kGsi)(−z
21
Construcción de Variables
El objetivo de aquí en adelante es explicar las variables incluidas en las regresiones en
cuanto a su construcción, definición y contenido para así poder interpretar adecuadamente
los resultados del análisis econométrico de la próxima sección.
La variable dependiente del modelo es diferencia entre el puntaje estandarizado obtenido en
la prueba de lenguaje el año 2003 y la obtenida en la prueba 2002.
Las variables independientes incluidas en las estimaciones econometritas son:
• La Educación de la madre del alumno i (Eduma) incluida en la regresión viene dada
por los años de educación formal declarados por la madre del alumno i que van desde cero
en el caso de analfabetismo y hasta 14 años en el caso de educación técnica. Esta variable
es diferente para cada alumno i.
• La Desviación Estándar de la Educación de la Madre del alumno i corresponde a la
desviación estándar de la educación de las madres de los alumnos de todo el curso al cual
pertenece dicho alumno. Esta variable no cambia para cada alumno i, sino que varía para
cada curso G de cada establecimiento s.
• Ocupación del Jefe de Hogar determina la existencia en el modelo a estimar de 13
dummies (DocuK) que representan las 13 opciones entregadas a los alumnos. La definición
de cada dummy se puede apreciar en detalle en el Anexo 3.
• Porcentaje de alumnos similares al alumno i (Porsemi) se calculó como el porcentaje
de estudiantes en el curso del alumno i que tuvieron resultados en la prueba 2002 igual a la
del estudiante considerado más/menos 0.5 desviaciones estándar. La desviación estándar
utilizada es la que se obtiene para el conjunto de los estudiantes que dieron la prueba. Esta
variable es diferente para cada alumno i y fue definida como porcentaje ya que una medida
relativa como ésta permite estimar su efecto sin confundirlo con el efecto que tendría la
variable en nivel. Se reconoce que el impacto de los efectos de las variables independientes
no es lineal con respecto a su nivel, debido a que es muy probable que el impacto de las
características de un alumno desaventajado adicional en la sala de clases será diferente si
22
hay 10 compañeros desaventajados en un curso de 40 o si hay 5 en un curso de 20 alumnos,
a pesar de que en ambos casos el porcentaje de desaventajados representa el 25% del total
del curso. Sin embargo, si se incluye directamente el nivel de alumnos similares en la
regresión se podrían estar confundiendo efectos, ya que el hecho, por ejemplo, que aumente
el nivel de compañeros parecidos a un determinado alumno tendría un impacto relacionado
con el tamaño de la clase y otro relacionado con el rendimiento del alumno propiamente tal.
Para evitar este potencial sesgo del coeficiente asociado y a pesar de sus inconvenientes se
optó por utilizar el porcentaje de alumnos de similar rendimiento.
• Dependencia del establecimiento al cual asiste el alumno i (Dep..) se determinó en
función de la información recopilada por la Junaeb se sabe que los 11 colegios de la
muestra son municipales o subvencionados. Por lo tanto, se construye una dummy para
incorporar la característica de dependencia en la estimación que toma el valor de 1 si la
dependencia es subvencionada y cero en el caso que la dependencia sea municipal. Esta
variable no es diferente para cada alumno ni para cada curso ya que varía para cada
establecimiento s.
• La cantidad de alumnos por profesor (Profealu) se determina como el total de alumnos
en la sala de clases del alumno i contándolo a él. Esta variable no es diferente para todos los
alumnos ya que sólo varía con el curso G y el establecimiento s.
• Promedio del ingreso familiar de los pares del alumno i (Ingpar) fue construido como
el promedio de ingreso familiar de los compañeros de curso del alumno i en base al sistema
de salud de cada uno. Todos los alumnos de la muestra pertenecen al sistema público B, C
o D, con lo cual se estimó el ingreso familiar en función de los rangos de ingreso
determinados por Fonasa para pertenecer a dichos grupos. Así, si el sistema de salud del
alumno es: Fonasa grupo B, el Ingreso Imponible Mensual de su familia es Menor o igual a
$ 120.000; Fonasa grupo C el Ingreso Imponible Mensual de su familia es Mayor a $
120.000 y Menor o igual a $ 175.200; Fonasa grupo D el Ingreso Imponible Mensual de la
familia es Mayor a $ 175.200. Dado que los grupos del sistema de salud público son
determinados por un rango de ingreso, para efecto de la estimación, se usó como proxy del
ingreso familiar la cota inferior de dicho rango. Esta variable es diferente para cada alumno.
23
ANALISIS DE LOS RESULTADOS ECONOMETRICOS
Primero, se estiman modelos del nivel y de la ganancia de rendimiento; para luego
enriquecer las estimaciones con la inclusión de efectos fijos al colegio y a la cohorte.
Después de justificar la correcta especificación del modelo se incluyen términos al
cuadrado, cuyo propósito es testear la convexidad de la relación entre el logro y las
variables de los pares, ya que Zimmer y Toma (2000) dijeron encontrar evidencia de
retorno marginal decreciente del efecto compañero. Finalmente, se estiman modelos que
permitan no-linealidades en el efecto compañero.
Comparación de Estimaciones Enriquecidas Progresivamente.
El cuadro 1 presenta los coeficientes de las especificaciones cada vez más ricas. El modelo
que describe el nivel de rendimiento (Columna 1) subestima el impacto del promedio del
ingreso de los pares y de la desviación estándar de la educación de las madres de los
alumnos del curso, mientras que sobrestima el impacto del porcentaje de alumnos similares,
de la educación de la madre del alumno, de la razón alumnos por profesor y de la
dependencia, lo cual sugiere que la estimación del nivel de rendimiento al omitir variables
históricas relevantes, no permite una interpretación directa y correcta de los coeficientes
asociados a las variables explicativas ya que se generan sesgos de signo inciertos en la
medida que las variables omitidas no son ortogonales con las incluidas.
En general, la inclusión de efectos fijos no provoca cambios en el sentido de los efectos de
las variables explicativas pero si genera cambio de magnitud y significancia, lo cual
sumado al aumento de ajuste nos dice que los factores invariantes del colegio para sus
estudiantes también determinan sus ganancias de rendimiento. Se destaca que la inclusión
del efecto fijo al colegio genera un aumento importante en la magnitud del impacto de la
dependencia sobre la ganancia de rendimiento, lo cual se debe a que al incluirlos se elimina
el sesgo negativo del coeficiente asociado proveniente de la correlación negativa existente
entre el efecto fijo del colegio y la dependencia, sin embargo, mantiene un sesgo positivo
asociado a la correlación entre la dependencia y los factores invariantes relacionados con la
cohorte que contiene a cada alumno.
24
Cuadro 1: Resultados de Estimaciones Enriquecidas.
Nivel ( ) iGsA Ganancia )( iGsA∆ Sin Efecto Fijo Con Efecto
Fijo Colegio Con Efecto Fijo colegio y de cohorte
.000095 .0000741 .0001153 .0000116 Promedio del Ingreso Familiar de los Pares 0.389 0.546 0.355 0.084
-4.75e-10 -3.65e-10 -6.05e-10 -1.17e-09 Promedio del Ingreso Familiar de los Pares al Cuadrado 0.415 0.58 0.354 0.168
1.750669 .4166846 .0282698 1.773634 % de alumnos similares 0.000 0.437 0.961 0.001 -.7543626 -1.108865 -1.453139 -1.375283 % de alumnos similares al
cuadrado 0.069 0.085 0.026 0.014 .0179303 .016603 .0156077 0.0100122 Educación de la Madre 0.005 0.088 0.111 0.26 .0140027 .2097117 .2154493 0.1384552 Desv. Estándar de Educación de
Madres de Alumnos del Curso 0.850 0.001 0.001 0.032 -.0002403 -.0024268 -.0042927 -.0018698 Razón Alumnos/Profesor 0.934 0.321 0.193 0.050 1.471462 .1558933 .7268104 0.5158478 Dependencia Establecimiento 0.000 0.047 0.000 0.032
Número de Observaciones 1623 1232 1232 1232 R2 0.3999 0.1073 0.1578 0.2891 Significancia Conjunta 0.0000 0.0000 0.0000 0.0000
En la última columna del cuadro 1 vemos los resultados de la estimación que incluye tanto
los efectos fijos al colegio, como a la cohorte donde se destaca el aumento del ajuste del
modelo y la significancia de los coeficientes, excepto a los asociados con el promedio del
ingreso de los pares. Además, la inclusión de ambos efectos fijos entrega una estimación
menos sesgada a la cual se puede acceder ya que se han eliminado los sesgos provenientes
de la omisión de variables no ortogonales con las incluidas. Finalmente podemos decir que
la estimación de la ganancia de rendimiento que permite saltar el obstáculo de la omisión
de variables históricas, más la inclusión de efectos fijos y el uso de variables instrumentales
que permiten eliminar de cierta forma el sesgo de selección, determinan resultados más
confiables que los hechos para el nivel de rendimiento. Cabe destacar que el modelo
representado por la columna 3 del cuadro 1 fue enfrentado a un ejercicio de robustez de sus
resultados, el cual aclaró que la magnitud de los coeficientes es sensible a la muestra
utilizada para la estimación a diferencia del sentido y significancia que se mantienen. Dado
que las conclusiones del presente trabajo se basan en el sentido y significancia de los
coeficientes del modelo, se considerarán robustos los resultados en cuanto a sus
implicancias.
25
Estimación Base
La especificación es similar a la de una función de producción educacional estándar, la cual
relaciona el logro estudiantil con características de los estudiantes y de los colegios a los
que asisten. Las variables consideradas a nivel de alumnos incluyen la educación de la
madre, dummies de ocupación del jefe de hogar y el porcentaje de alumnos del curso con
rendimiento similar al del estudiante. A nivel de sala de clases se incluye la cantidad de
alumnos por profesor y la varianza del nivel educacional de las madres de los alumnos del
curso. A nivel de establecimiento se considera su dependencia. La influencia de los pares
sobre el rendimiento del alumno se representa con el promedio del ingreso familiar de sus
compañeros de curso. Además, para permitir que el efecto de las variables independientes
sobre la dependiente no sea lineal, se incluye en la regresión el cuadrado del porcentaje de
alumnos similares en la sala de clases y el promedio de ingreso de los compañeros de curso.
Así, el modelo a estimar es el siguiente:
)(Pr )(42
)(3)(2
142
31
21
cGsi
ciGs
csGsiGsiGs
siGsiGsKK
iGsKGsiGsciGs
uIngparIngparofealu
DdepPorsemiPorsemiDocuDsedumaEdumaA
−−−
=
++++++
++++++=∆ ∑γεθωδδδ
δββαββ13
(10)
En el cuadro 2 podemos ver los resultados de la estimación de (10) donde se pueden
apreciar varios hechos interesantes además de que el coeficiente asociado al cuadrado del
promedio del ingreso familiar de los pares no resulta ser significativo. Primero, los
coeficientes asociados al promedio de ingreso de los pares y a la educación de la madre
resultan no ser significativos individualmente, sin embargo, sí lo son conjuntamente, es
decir, existe gran colinealidad entre ambas variables7, lo cual tiene mucho sentido porque
tal como se comentó, existen características comunes entre los alumnos de un determinado
establecimiento ya que no es aleatoria la asignación. Segundo, el tamaño del curso tiene un
efecto negativo y significativo sobre el rendimiento de los integrantes de dicho curso.
Tercero, podemos observar que se confirman los hallazgos de otros trabajos en cuanto a
que asistir a un colegio subvencionado en vez de un municipal tiene un impacto positivo y
significativo sobre el rendimiento de sus alumnos. Cuarto, tanto el porcentaje de alumnos
similares como su cuadrado resultaron ser significativos pero con signo opuesto, lo cual
7 Esta afirmación fue confirmada mediante el uso de regresiones auxiliares.
26
permite decir que el impacto de un alumno adicional similar a i en su sala de clases es
positivo, sin embargo, más allá de un cierto punto no contribuye a aumentar el rendimiento.
Este hallazgo concuerda con la idea expuesta anteriormente en relación a la diferencia del
impacto del nivel de alumnos o del valor relativo, ya que se confirma que no es igual el
impacto que tiene el ingreso de un alumno similar a i a su curso sobre su rendimiento si el
25% de sus compañeros son similares a él o sólo el 1% .
Cuadro 2: Resultados de Estimación Base
Coeficiente Error Estándar Robusto P>|t| Promedio del Ingreso Familiar de los Pares 0.0000116 6.70e-06 0.084 Promedio del Ingreso Familiar de los Pares al Cuadrado -1.17e-09 8.51e-10 0.168 % de alumnos similares 1.773634 0.5221381 0.001 % de alumnos similares al cuadrado -1.375283 0.5608449 0.014 Educación de la Madre 0.0100122 0.0089081 0.26 Desv. Est. de Educación de Madres de Alumnos del Curso 0.1384552 0.0644454 0.032 Razón Alumnos/Profesor -0.0044131 0.0022656 0.050 Dependencia del Establecimiento 0.5158478 0.24053 0.032 Dummy ocupación 1 .0892249 .1766548 0.614 Dummy ocupación 2 .2983028 .1711918 0.082 Dummy ocupación 3 .381169 .1713526 0.026 Dummy ocupación 4 .1078429 .3319113 0.745 Dummy ocupación 5 .2532587 .1687475 0.134 Dummy ocupación 6 .1735362 .2033661 0.394 Dummy ocupación 7 .2393856 .2353903 0.309 Dummy ocupación 8 .5258365 .1930188 0.007 Dummy ocupación 9 .3164229 .2733491 0.247 Dummy ocupación 10 .2283206 .3884029 0.557 Dummy ocupación 11 .4780964 .5788944 0.409 Dummy ocupación 12 .0141984 .2373651 0.952 Dummy ocupación 13 .1538037 .2506858 0.540 Número de Observaciones 1232 R2 0.2891 Significancia Conjunta 0.000
Llama la atención que el coeficiente asociado a la desviación estándar de la educación de
las madres de los compañeros del alumno i sobre su rendimiento un impacto positivo y
significativo, es decir, un aumento de 1% en la diversidad de nivel educacional materno en
la sala de clases aumenta la ganancia del estudiante i en 0.14 desviaciones estándar. Sin
embargo, este resultado parece ser contradictorio con lo encontrado por Sapelli (2003) y
con la idea que en la medida que el alumno i comparte en la sala de clases con una mayor
proporción de compañeros similares a él crece su rendimiento. La explicación a este
fenómeno la entregará la estimación realizada con las dummies de quintiles.
27
Estimación con quintiles de rendimiento
Las estimaciones MCO nos permiten conocer el efecto promedio de distintos insumos o
características de los colegios sobre el logro educacional. Sin embargo, es interesante
preguntarse cómo las características y recursos con que cuenta un establecimiento
educativo afectan el logro en puntos diferentes de la distribución condicional de puntajes en
los tests estandarizados de rendimiento. Con este fin, se separan los porcentajes de alumnos
según la posición del estudiante dentro de la distribución general de logros.
Específicamente, se dividen a los estudiantes en quintiles de logro sobre la base del puntaje
obtenido en su primera evaluación dejando que el quintil número 1 sea aquel de peor
puntaje. Así la estimación a realizar será:
)(Pr )(3)(21
3111
1
cGsi
ciGs
csGsiGss
iGsjj
jKK
iGsKGsjj
jiGsciGs
uIngparofealuDdep
PorsemiDDocuDsedumaDEdumaA
−−
===
++++++
++++=∆ ∑∑∑γεθωδδδ
βραγβ5135
D
(12)
Donde es una dummy que toma el valor de 1 si es que el alumno i se encuentra en el
quintil j de la distribución del logro inicial.
j
La estimación base reveló que tanto el porcentaje de alumnos similares como la varianza de
la educación de las madres de los compañeros de clase impactan positiva y
significativamente la ganancia de rendimiento del alumno, lo cual resultaba a primera vista
contradictorio. Sin embargo, los resultados de la estimación que incluye la interacción de
las dummies por quintiles de rendimiento entregan una explicación. Se debe partir de la
idea que un aumento en la varianza de la educación de las madres de los alumnos de un
curso se produce cuando sacamos de él un alumno de la media e ingresa un estudiante cuya
madre posee una cantidad mayor o menor de años de estudios que la media del curso.
Luego, dado que el impacto del porcentaje de alumnos similares es positivo sobre los
alumnos pertenecientes a los dos quintiles de mejor rendimiento podemos decir que cuando
aumenta la desviación estándar de la educación de las madres para un alumno i que
pertenece a la cohorte c, al curso G y al quintil j es porque ingresó un alumno k a la cohorte
28
c, al curso G, al quintil j que posee un puntaje diferente de la media y similar8 al de i, ya
que de esta forma aumenta la varianza de la habilidad de la sala de clases y
simultáneamente aumenta el porcentaje de alumnos similares al alumno i. Por lo tanto, los
signos de los coeficiente de la estimación mostrada en el Cuadro 3 nos dicen que los
alumnos que pertenecen a los dos quintiles de peor rendimiento disminuyen su ganancia de
rendimiento a medida que aumenta el porcentaje de compañeros parecidos a ellos, lo cual,
de acuerdo a lo anterior, es consistente con el efecto de un aumento la desviación estándar
de la educación de las madres de sus compañeros de clase. Contraria es la realidad de los
que pertenecen a los dos quintiles de mayor rendimiento; éste aumenta en la medida que en
su sala de clases hay más alumnos parecidos a ellos en cuanto a su desempeño escolar y
hay mayor varianza de nivel educación materno en su sala de clases. Además, se testeó la
hipótesis nula que los efectos tanto del porcentaje de alumnos similares como de la
desviación estándar de la educación de las madre del curso fueran iguales a través de la
distribución de rendimiento, siendo rechazada tal como lo muestran los valores de p en el
cuadro 3, lo cual reafirma las ideas expuestas anteriormente.
Cabe destacar el gran nivel de ajuste que muestra la especificación del modelo, donde la
educación de la madre sigue siendo una variable con significativo impacto positivo sobre la
ganancia de rendimiento, mientras, que el promedio del ingreso familiar de los pares, la
razón profesor alumno y la dependencia del establecimiento pierden significancia
individual a pesar de tener una significancia conjunta aceptada a cualquier nivel de
confianza.
8 El concepto alumno similar se entiende como un estudiante en el curso del alumno i que tuvo un puntaje en la prueba 2002 igual a la del estudiante i considerado más/menos 0.5 desviaciones estándar. La desviación estándar utilizada es la que se obtiene para el conjunto de los estudiantes que dieron la prueba.
29
Cuadro 3: Resultados de Estimación con Quintiles de Rendimiento.
Coeficiente Error Estándar Robusto P>|t| Promedio del Ingreso Familiar de los Pares 8.53e-06 5.45e-06 0.118 Dummy quintil 1 % de alumnos similares -.5131323 .3852438 0.034 Dummy quintil 2 % de alumnos similares -.4225798 .236832 0.075 Dummy quintil 3 % de alumnos similares -.4419658 .2080789 0.118 Dummy quintil 4 % de alumnos similares .5997398 .2576474 0.020 Dummy quintil 5 % de alumnos similares .4289029 .250465 0.047 Educación de la Madre .0272603 .0080134 0.001 Dummy Quintil 1 Desviación Estándar de la Educación de las Madres de los Alumnos del Curso
-.4296396 .0829808 0.000
Dummy Quintil 2 Desviación Estándar de la Educación de las Madres de los Alumnos del Curso
-.1167388 .0734021 0.112
Dummy Quintil 3 Desviación Estándar de la Educación de las Madres de los Alumnos del Curso
.0782935 .0690958 0.257
Dummy Quintil 4 Desviación Estándar de la Educación de las Madres de los Alumnos del Curso
.138354 .0722475 0.056
Dummy Quintil 5 Desviación Estándar de la Educación de las Madres de los Alumnos del Curso
.0742084 .0742084 0.000
Razón Alumnos/Profesor -.0018698 .0019141 0.329 Dependencia del Establecimiento -.5126226 .3144443 0.103 Dummy ocupación 1 .2236682 .1167001 0.046 Dummy ocupación 2 .4003447 .1143516 0.000 Dummy ocupación 3 .3392933 .1141352 0.003 Dummy ocupación 4 .1792664 .3096743 0.563 Dummy ocupación 5 .4010184 .1106588 0.000 Dummy ocupación 6 .2106082 .1411768 0.136 Dummy ocupación 7 .4670387 .1920902 0.015 Dummy ocupación 8 .3298316 .1502139 0.028 Dummy ocupación 9 .18863 .18863 0.188 Dummy ocupación 10 -.0509968 .1834522 0.781 Dummy ocupación 11 .4202676 .3058332 0.170 Dummy ocupación 12 .6216481 .2448549 0.011 Dummy ocupación 13 .5724169 .1771168 0.001 Número de Observaciones 1232 R2 0.7087 Significancia Conjunta 0.000 Hipótesis Nula: el efecto del porcentaje de alumnos similares es igual a través de los quintiles de rendimiento.
0.0007
Hipótesis Nula: el efecto de la desviación estándar d la educación de las madres del curso es igual a través de los quintiles de rendimiento
0.0000
30
CONCLUSIONES
El uso de una base de datos que permite rezagar el logro de los estudiantes, más la
estimación por variables instrumentales con efectos fijos de colegio y de cohorte ayudaron
a determinar la existencia del efecto compañero en las salas de clases de las Escuelas
Críticas, eliminando los problemas de omisión de variables no observables correlacionadas
con las incluidas; mientras que la estimación para distintos quintiles de la distribución de
puntajes permitió conocer características de la forma que toma el efecto compañero.
En un comienzo se planteó la pregunta: ¿existe el efecto compañero? La respuesta es sí, ya
que las variables relacionadas con los pares resultaron significativas. La siguiente pregunta
fue: ¿el efecto compañero es igual a través de los quintiles de logro dentro del curso?. La
respuesta fue categórica, el impacto de los compañeros de curso no es igual para todos los
integrantes de éste ya que varía en función de la ubicación del rendimiento del alumno
relativa a la de sus compañeros. Respecto a la tercera y última pregunta: ¿el efecto
compañero es unidireccional o bidireccional? Ésta es crucial ya que viene a aclarar la forma
en la cual opera el efecto compañero en las salas de clases. A veces se respaldó la mezcla
de alumnos con diferentes características pensando que el único efecto era que el alumno
desaventajado se favorecía de la interacción con alumnos de mejor rendimiento y no se
consideraba que para el alumno bueno tuviera un costo generar dicho beneficio, es decir, se
planteaba que el alumno bueno sería igualmente bueno independiente de los compañeros
de curso que tuviera, pero que el malo sí mejoraría al estar en una sala de clases con
alumnos mejores que él. Dicho de otra manera, se pensó y plasmó en los estudios de efecto
compañero que éste funcionaba de manera unidireccional, por lo tanto, las políticas
públicas que incentivan el aumento de heterogeneidad de rendimiento en la sala de clase se
consideraban positivas. Sin embargo, los resultados mostrados desmienten que el efecto
compañero sea unidireccional, más aun, se confirma la bidireccionalidad ya que los buenos
y los malos se benefician de estar con otros compañeros de buen rendimiento escolar. Sería
interesante investigar posteriormente si el beneficio que obtiene un alumno desaventajado
de tener compañeros de buen rendimiento es superior al costo que tiene para él tener como
compañero a uno de mal rendimiento en vez de uno aventajado, con el fin de de determinar
si las políticas públicas que buscan mezclar a los alumnos logran un efecto neto positivo.
31
REFERENCIAS
- Aedo, Cristián. 1997. “Organización industrial de la prestación de servicios sociales.” Working Paper R-302. Washington: Inter-American Development Bank. - Aedo, Cristián, y Osvaldo Larrañaga. 1994. “Educación privada vs. pública en Chile: calidad y sesgo de selección.” Santiago, Chile: ILADES/Georgetown University, Economics Department. Mimeo. - Boozer, Michael A., Alan B. Krueger, and Shari Wolkon. "Race and school quality since Brown v. Board of Education." Brooking Papers: Microeconomics:269-338. 1992 - Bravo, David, Dante Contreras, y Claudia Sanhueza. 1999. “Rendimiento educacional, desigualdad y brecha de desempeño público/privado: Chile 1982–1997.” Working Paper 163. Santiago: Universidad de Chile, Departamento de Economía. - Crain, Robert. "School integration and occupational achievement of Negroes." American Journal of Sociology 75,no.4, Part II (Enero 1972):593-606. - Eide, Eric, y Mark Showalter. 1998. “The Effect of School Quality on Student Performance: A Quantile Regression Approach.” Economic Letters 58(3): 345–50. - Epple, Dennis, y Richard E. Romano, “Competition between Private and public Schools, Vouchers, and Peer-Group Effects,” American Economic Review, Vol. 88, Nº1 (Marzo 1998), 33-62. - Gallego, Francisco. 2002. “Competencia y resultados educativos: teoría y evidencia empírica para Chile.” Santiago: Banco Central de Chile. Mimeo. - Grogger, Jeffrey T. "Does school quality explain the recent black/white wage trend?" Journal of Labor Economics 14,no.2 (Abril 1996):231-253. - Hoxby, Caroline., ““Peer effect” in the classroom: learning from gender and race variation”. Nber Working Paper Nº 7867. Agosto 2000. - Hoxby, Caroline., “The effect of class size and composition on student achievement: new evidence from natural population variation”. Nber Working Paper Nº 6869. Diciembre 1998. - Hanushek, Eric A. “Education and race: an analysis of the educational production process”. Cambridge, MA: Health-Lexington. (1972) - Hanushek, Eric A. "The economics of schooling: Production and efficiency in public schools." Journal of Economic Literature 24,no.3 (Septiembre 1986):1141-1177. - Hanushek, Eric A., John F. Kain, y Steve G. Rivkin. 2001. "Disruption versus Tiebout improvement: The costs and benefits of switching schools." WP 8479, National Bureau of Economic Research (Septiembre 2001). - Hanushek, Eric A., Kain, John F., Markman, Jacob M., Rivkin, Steven G., “Does Peer Ability affect student achievement?” Nber Working Paper Nº 8502. Octubre 2002. - Hanushek, Eric A., Kain, John F., Rivkin, Steven G., “New Evidence about Brown V. Board of Education: The Complex Effects of school racial composition on achievement”. Nber Working Paper Nº 8741. Enero 2002. - Kain, John F., y Daniel M. O'Brien. "Black suburbanization in Texas metropolitan areas and its impact on student achievement." Working paper, Green Center for the Study of Science and Society, University of Texas at Dallas (Marzo 2000). - Levin, Jesse. 2001. “For Whom the Reductions Count: A Quantile Regression Analysis of Class Size and Peer Effects of Scholastic Achievement.” Empirical Economics 26(1): 221–46.
32
- Manski, Charles F. "Identification of endogenous social effects: The reflection problem." Review of Economic Studies 60(Julio 1993):531-542. - McEwan, Patrick J. “Peer effects on student achievement: evidence from Chile”. Economics of Education Review. Noviembre 2001. - McEwan, Patrick, and Martin Carnoy. 2000. “The Effectiveness and Efficiency of Private Schools in Chile’s Voucher System.” Educational Evaluation and Policy Analysis 22(3): 213–239. - Mizala, Alejandra y Pilar Romaguera. 1998. “¿Cómo se comparan los resultados de la prueba SIMCE entre colegios público y privados?” Revista Perspectivas en Política, Economía y Gestión vol 2 N°1. - Mizala, Alejandra, y Pilar Romaguera. 2000. “School Performance and Choice: The Chilean Experience.” Journal of Human Resources 35(2): 392–417. - Mizala, Alejandra, y Pilar Romaguera . 2001. “Factores explicativos de los resultados escolares en la educación secundaria en Chile.” Trimestre Económico 272 (October- December): 515–49. - Mizala, Alejandra, Pilar Romaguera, y Dario Farren. 2002. “The Technical Efficiency of Schools in Chile.” Applied Economics 34:1533-1552.. - Moffitt, Robert A "Policy interventions, low-level equilibria, and social interactions." In Social dynamics, edited by S. Durlauf and H. P. Young. Cambridge, MA: MIT Press. 2001 - Rivkin, Steven G. "School desegregation, academic attainment, and earnings." Journal of Human Resources 35,no.2 (Primavera 2000):333-346. - Rivkin, Steven G., Eric A. Hanushek, y John F. Kain. "Teachers, schools, and academic achievement." Working Paper No. 6691, National Bureau of Economic Research. (2001) - Rodríguez, Jorge. 1988. “School Achievement and Decentralization Policy: The Chilean Case.” Revista de Análisis Económico.3(1): 75–88. - Sapelli, Claudio, y Bernardita Vial. 2001. “Evaluating the Chilean Education Voucher System.” Santiago: Pontificia Universidad Católica de Chile. Mimeo. - Sapelli, Claudio, “The Chilean Voucher System: Some new results and research challenges,” Cuadernos de Economía, Año 40, Nº 121, pp. 530-538 (Diciembre 2003). - Sapelli, Claudio, y Vial, Bernardita, “Peer effect and relative Performance of voucher schools in Chile.” Documento de Trabajo Nº 256. Pontificia Universidad Católica de Chile. Instituto de Economía. Diciembre 2003. - Tokman, Andrea. 2001. “Is Private Education Better? Evidence from Chile.” University of California at Berkeley. Mimeo. - Welch, Finis, and Audrey Light. “New evidence on school desegregation. Washington, D.C.: U. S. Commission on Civil Rights”.(1987). - Zimmer, R. Y Toma, E. “Peer Effect in private and public schools across countries” Journal of Policy Análisis and Management, 19(1), 75-92. (2000)
33
Anexo 1: Listado de escuelas de la Campaña LEM a cargo de la PUC. Datos generales,
SIMCE 4º 1999 e IVE 2003.
Escuela Papa Juan Pablo II 979 RBD: 93688 Comuna: La Florida Región: XIII Región Metropolitana Dependencia: Particular Subvención Compartida Sector: Urbana Índice de Vulnerabilidad: 49.2%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 32 219 214 219 10 17
Escuela Apóstol Pablo 965
RBD: 93823 Comuna: La Florida Región: XIII Región Metropolitana Dependencia: Particular Subvencionado Sector: Urbana Índice de Vulnerabilidad: 25.4%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 43 210 225 218 1 16
Colegio Capitán Pastene 1364
RBD: 244015 Comuna: La Florida Región: XIII Región Metropolitana Dependencia: Corporación Municipal Sector: Urbana Índice de Vulnerabilidad: 39.7%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 123 225 220 223 17 19
Escuela Los Cerezos F 449
RBD: 93041 Comuna: La Florida Región: XIII Región Metropolitana Dependencia: Corporación Municipal Sector: Urbana Índice de Vulnerabilidad: 40 %
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 40 218 235 223 7 33
Escuela D 536
RBD: 96024 Comuna: La Pintana Región: XIII Región Metropolitana Dependencia: DAEM Sector: Urbana Índice de Vulnerabilidad: 9%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 117 212 207 209 14 16
Colegio Forjadores Del Futuro 200
RBD: 96687 Comuna: La Pintana Región: XIII Región Metropolitana Dependencia: Particular Subvencionado Sector: Urbana Índice de Vulnerabilidad: 45.6%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 86 220 202 202 19 3
Colegio San Francisco De Mapuhue 332
RBD: 119024 Comuna: La Pintana Región: XIII Región Metropolitana Dependencia: Particular Subvención Compartida Sector: Urbana Índice de Vulnerabilidad: 58.9%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 102 202 200 194 -5 10
34
Escuela Básica Particular San Marcelo Nº2 307
RBD: 119032 Comuna: La Pintana Región: XIII Región Metropolitana Dependencia: Particular Subvención Compartida Sector: Urbana Índice de Vulnerabilidad: 57.9%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 112 213 201 210 29 5
Colegio Miguel Ángel
RBD: 119792 Comuna: La Pintana Región: XIII Región Metropolitana Dependencia: Particular Subvencionado Sector: Urbana Índice de Vulnerabilidad: 61.5%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 108 210 206 209 19 19
Escuela Oscar Bonilla E 624
RBD: 104736 Comuna: Puente Alto Región: XIII Región Metropolitana Dependencia: Corporación Municipal Sector: Urbana Índice de Vulnerabilidad: 28. 7%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 112 212 210 213 14 12
Escuela Luis G. Ossa E 203
RBD: 91243 Comuna: Peñalolen Región: XIII Región Metropolitana Dependencia: Corporación Municipal Sector: Urbana Índice de Vulnerabilidad: 44.6%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 62 223 210 207 8 -8
Colegio Padre Hurtado De Macul 1160
RBD: 91731 Comuna: Macul Región: XIII Región Metropolitana Dependencia: Particular Subvencionado Sector: Urbana Índice de Vulnerabilidad: 50.5%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 35 186 184 188 -6 -33
Colegio Julio Verne 850
RBD: 91650 Comuna: Peñalolen Región: XIII Región Metropolitana Dependencia: Particular Subvencionado Sector: Urbana Índice de Vulnerabilidad: 46.5%
N º Alumnos Matemáticas Lenguaje Comprensión Matemática 1996 Lenguaje 1996 74 199 190 197 7 2
.
35
Anexo 2: Test de medias y varianzas para las 4 cohortes entre los 14 colegios de la muestra y los 50 restantes. 50 escuelas 14 escuelas cohorte 0 media desv. media desv. Descripción de la Variable Sexo: Hombre 0,52 0,48 % de hombres Sexo: Mujer 0,48 0,52 % de mujeres Peso 22,56 4,8972 22,59 4,59 Media y Desviación Estándar -0,0001* 1,1386** del peso de los niños Talla 117,14 6,52 117,19 6,31 Media y Desviación Estándar -0,0001* 1,0658** de la talla de los niños Es. Madre 6,68 3,13 6,82 3,00 Media y Desviación Estándar de -0,0006* 1,0903** los años de educación de la madre Es. Jefe Hogar 7,01 3,08 7,03 3,16 Media y Desviación Estándar de los -0,0001* 1,0572** años de educación del jefe de hogar Pers. Hogar 5,69 2,45 5,54 1,89 Media y Desviación Estándar del número 0,0011* 0,5979** de personas que componen el hogar Piezas hogar 2,19 1,20 2,23 1,39 Media y Desviación Estándar del número -0,0012* 1,3473** de piezas que posee el hogar cohorte 1 Media desv. media desv. Descripción de la Variable Sexo: Hombre 0,5452 0,48 % de hombres Sexo: Mujer 0,4548 0,45 % de mujeres Peso 22,5104 4,4508 22,97 4,45 Media y Desviación Estándar -0,0010* 0,9978** del peso de los niños Talla 115,9512 14,9978 118,28 6,53 Media y Desviación Estándar -0,0005* 0,1899** de la talla de los niños Es. Madre 6,7603 3,2388 7,26 3,21 Media y Desviación Estándar de -0,0020* 0,9850** los años de educación de la madre Es. Jefe Hogar 6,9184 3,2325 7,35 3,20 Media y Desviación Estándar de los -0,0018* 0,9809** años de educación del jefe de hogar Pers. Hogar 5,8121 2,8576 5,63 2,07 Media y Desviación Estándar del número 0,0011* 0,5258** de personas que componen el hogar Piezas hogar 2,1795 0,8720 2,23 0,82 Media y Desviación Estándar del número -0,0027* 0,8879** de piezas que posee el hogar
36
cohorte 2 Media desv. media desv. Descripción de la Variable Sexo: Hombre 0,5224 0,54 % de hombres Sexo: Mujer 0,4776 0,46 % de mujeres Peso 22,7097 4,3176 22,60 4,28 Media y Desviación Estándar 0,0003* 0,9830** del peso de los niños Talla 117,2167 6,1209 117,55 6,62 Media y Desviación Estándar -0,0004* 1,1688** de la talla de los niños Es. Madre 7,0049 3,1610 6,84 3,19 Media y Desviación Estándar de 0,0007* 1,0172** los años de educación de la madre Es. Jefe Hogar 7,2913 3,1302 7,23 3,06 Media y Desviación Estándar de los 0,0003* 0,9534** años de educación del jefe de hogar Pers. Hogar 5,5481 2,0330 5,71 1,99 Media y Desviación Estándar del número -0,0017* 0,9614** de personas que componen el hogar Piezas hogar 2,1947 0,8881 2,13 0,80 Media y Desviación Estándar del número 0,0037* 0,8048** de piezas que posee el hogar cohorte 3 Media desv. media desv. Descripción de la Variable Sexo: Hombre 0,5565 0,55 % de hombres Sexo: Mujer 0,4435 0,45 % de mujeres Peso 22,8174 5,2616 22,99 4,76 Media y Desviación Estándar 0,0000* 0,8188** del peso de los niños Talla 117,0414 6,5505 116,91 41,32 Media y Desviación Estándar -0,0003* 39,7807** de la talla de los niños Es. Madre 7,0337 2,9920 7,32 3,06 Media y Desviación Estándar de 0,0000* 1,0481** los años de educación de la madre Es. Jefe Hogar 7,3056 3,0767 7,58 3,06 Media y Desviación Estándar de los -0,0014* 0,9863** años de educación del jefe de hogar Pers. Hogar 5,6417 2,8184 5,32 1,98 Media y Desviación estándar del número -0,0013* 0,4942** de personas que componen el hogar Piezas hogar 2,1839 0,9362 2,15 0,90 Media y Desviación estándar del número 0,0017* 0,9167** de piezas que posee el hogar
*valor t calculado para la hipótesis de igualdad de medias muestrales comparado con el un t critico de 2 ya que el tamaño de la muestra es superior a 30. * Valor calculado para la hipótesis de igualdad de varianzas muestrales
37
Anexo 3: Construcción de las Dummies de Ocupación del Jefe de Hogar.
• Ocupación del Jefe de Hogar determina la existencia en el modelo a estimar de 13
dummies (DocuK) que representan las 13 opciones entregadas a los alumnos. Se define de
la siguiente forma:
Docu1=1 si es cesante, Docu1=0 otro caso Docu2=1 si trabaja esporádicamente, Docu2=0 en otro caso Docu3=1 si es trabajador manual por cuenta propia: jardinero, vendedor ambulante, feriante, cargador, cuidador de autos, tejido, costura, lavado, peluquería, etc., Docu3=0 en otro caso Docu4=1 si es pequeño agricultor, actividades mineras menores, etc., Docu4=0 en otro caso Docu5=1 si obrero no calificado, aseador, jornalero, mozo, pintor, carnicero, maestro chasquilla, etc., Docu5=0 otro caso Docu6=1 obrero calificado, electricista, gásfiter, mecánico, pastelero, suboficiales de F.F.A.A, etc., Docu6=0 otro caso Docu7=1 comerciante o industrial menor, artesano, carpintero, etc., Docu7=0 otro caso Docu8=1 empleado menor, oficinista, vendedor, chofer, etc., Docu8=0 en otro caso Docu9=1 Profesional intermedio, empleado de alguna jerarquía, contratista, oficiales intermedios de las F.F.A.A, etc., Docu9=0 otro caso Docu10=1 Profesional nivel universitario, gerente, administrador, Docu10= 0 otro caso Docu11=1 comerciante, industrial, empresario mayor, etc., Docu11=0 otro caso Docu12=1 jubilado o pensionado., Docu12=0 otro caso Docu13=1 dueña de casa., Docu13=0 otro caso
38