enlace.sep.gob.mxenlace.sep.gob.mx/content/ms/docs/2012/manual_tecnico... · 2012-02-14 · anexo...
TRANSCRIPT
Manual Técnico enlace Media Superior 2008-2010
Manual Técnico de la prueba Evaluación Nacional de Logro Académico
en Centros Escolares de Educación Media Superior (enlace ms)
D.R. © 2012, Centro Nacional de Evaluación
para la Educación Superior, A.C. (Ceneval)
Av. Camino al Desierto de los Leones 19,
Col. San Ángel, Deleg. Álvaro Obregón,
C.P. 01000, México, D.F.
www.ceneval.edu.mx
Diseño y formación: Álvaro Edel Reynoso Castañeda
Febrero de 2012
Directorio del Ceneval
Director General
Mtro. Rafael Vidal Uribe
Directora General Adjunta de Programas Especiales
Dra. Rocío Llarena de Thierry
Directora de Programas para la Administración Pública
Dra. Alejandra Zúñiga Bohigas
Coordinación de la prueba
Lic. Sandra Reyes Lüscher
Elaboración
Lic. Sandra Reyes Lüscher
Dra. Alejandra Zúñiga Bohigas
Equipo de colaboración
Lic. Araceli Castillo Núñez
Lic. Erika Asunción González Mendieta
Lic. Rubén Lugo Campos
Psic. José Rodrigo Alanis Quezada
Psic. Laura Audiffred Maldonado
Lic. Sandra Villagómez Pérez
Lic. Martha Verónica Contreras Valdés
Lic. Claudia Guadalupe Durán Velandia
Mtra. María del Carmen Zafrilla Sánchez
Lic. Rafael Kornhauser García
Presentación 11
1. Antecedentes 15
2. Características generales de la prueba 192.1 Objetivo 202.2 Propósito 202.3 Población objetivo 202.4 Características psicométricas 202.5 Alcances y limitaciones 222.6 Administración 232.7 Resultados 23
3. Desarrollo de la prueba 253.1 Definición del contenido 27
3.1.1 Habilidad Lectora 283.1.2 Habilidad Matemática 33
3.2 Estructura de la prueba 363.2.1 Especificaciones de reactivos 37
3.3 Elaboración y validación de reactivos 373.3.1 Capacitación a elaboradores y validadores 383.3.2 Revisión cualitativa 39
3.3.2.1 Revisión técnica 393.3.2.2 Validación con especialistas 403.3.2.3 Revisión de estilo 40
3.3.3 Revisión Cuantitativa 413.3.3.1 Calibración de reactivos 423.3.3.2 Corrección y validación externa 44
3.3.4 Mantenimiento del banco de reactivos 443.4 Ensamble de la prueba 45
3.4.1 Revisión editorial e impresión del instrumento 47
Índice
4. Aplicación 494.1 Diseño muestral 50
5. Calificación 535.1 Confiabilidad de la prueba 545.2 Establecimiento de puntos de corte y definición de niveles de desempeño 54
5.2.1 Análisis empírico 545.2.2 Análisis de juicio 55
5.2.2.1 Niveles de dominio de la Habilidad Lectora 565.2.2.2 Niveles de dominio de la Habilidad Matemática 57
5.2.3 Validación de los puntos de corte 585.3 Equiparación de las pruebas 58
6. Resultados 636.1 Reporte de resultados 656.2 Usos y difusión de resultados 676.3 Cuestionarios de contexto 68
7. Reflexiones acerca de la prueba 717.1 Comparación con evaluaciones similares 747.2 enlace Media Superior y la riems 77
Referencias 79
Anexo IGrupos de trabajo 81
Anexo IIDatos psicométricos de los reactivos piloteados 93
Anexo IIIParámetros versión operativa 2008 97
Anexo IVMarco muestral. Levantamiento de datos de la prueba 103
Anexo VEstablecimiento de los puntos de corte y generación 111de algoritmo de calificación
Anexo VIValidación de los puntos de corte 115
Anexo VIIEquiparación 131
Índice
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R11
Presentación
El Centro Nacional para la Evaluación de la Educación Superior (Ceneval) es una institución no lucrativa cuya misión es contribuir a elevar la calidad de la educación en México,
por medio del diseño y la aplicación de instrumentos de evaluación válidos, confiables y pertinentes. Estos instrumentos proporcionan información acerca de los conocimientos y habilidades que las personas adquieren al participar en procesos formales o informales de aprendizaje.
Es importante que un instrumento de evaluación cuente con un reporte detallado de los procedimientos que se siguieron en el diseño y elaboración de una prueba para alcanzar altos niveles de calidad técnica. Este Manual Técnico resume la evidencia que fundamenta la es-tructura, la construcción y el mantenimiento de la Evaluación Nacional de Logro Académico en Centros Escolares (enlace) de nivel Medio Superior, que es uno de los instrumentos más importantes en cuya elaboración y seguimiento participa el Ceneval a petición de la Secretaría de Educación Pública (sep).
enlace Media Superior es una prueba de diagnóstico individual que se aplica anual-mente a la población del último año de ese nivel educativo. Debido a que ha resultado un instrumento útil en la toma de decisiones tanto para los sustentantes, como para los centros escolares y los titulares del poder público, es prioritario que la información relacionada con él se ponga a disposición de otros evaluadores, docentes, autoridades educativas, alumnos y padres de familia, de modo que se contribuya a la difusión de la prueba y la adecuada interpre-tación de sus resultados.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
12
Con la publicación del Manual Técnico se da cumplimiento a los estándares exigidos por el Ceneval y por diversas entidades que establecen lineamientos para las pruebas de aprovechamiento, entre ellas la American Educational Research Association (aera), la Ame-rican Psychological Association (apa) y el National Council on Measurement in Education (ncme). A lo largo del documento, se describe puntualmente la forma en que el proceso de elaboración e instrumentación de la prueba enlace Media Superior cumple con diversos estándares de calidad. Incluso se indica entre paréntesis la clave numérica que corresponde al lineamiento establecido por las asociaciones mencionadas anteriormente en el documento normativo titulado The Standards for Educational and Psychological Testing (apa, aera y ncme, 1999).
Antes de detallar las etapas de construcción que caracterizan a la prueba enlace Media Superior, se describen algunos antecedentes del examen, las instancias que promovieron el proyecto de evaluación, las necesidades que le dieron origen y el plan a largo plazo que se está implementando.
El segundo capítulo incluye las características generales de la prueba, específicamente aquellas que fueron determinadas desde su planificación y que, en congruencia con los obje-tivos de evaluación, dictan permanentemente las líneas de acción en las etapas posteriores de desarrollo y mantenimiento del instrumento.
El tercer apartado explica con detalle la estrategia con que se definió el contenido y la estructura del instrumento de evaluación, así como los procedimientos para contar con un banco de reactivos que cumpla con lineamientos internacionales de calidad, y permita el ensamble de los cuadernillos que son aplicados a la población objetivo.
El cuarto capítulo presenta información acerca de las circunstancias particulares, las condiciones y los requisitos para aplicar el examen, se precisan los tiempos y número de se-siones requeridas, así como el ensamble y diseño de aplicación consecuentes con el propósito que ha caracterizado a la prueba enlace Media Superior desde 2008.
La sección denominada Calificación describe los procedimientos para establecer los puntos de corte y definir los niveles de dominio con el apoyo de especialistas que se encargan de validarlos de manera empírica y teórica. Además de explicar el significado de ubicar a los sustentantes en uno u otro nivel, se detalla el proceso para cuidar que año con año la califi-cación y las comparaciones basadas en dichos niveles sean válidas.
En el capítulo Resultados se muestra la distribución de sustentantes por nivel de domi-nio que se obtuvo en los tres años de aplicación. Además, se exponen las vías que tienen los sustentantes, los docentes y la comunidad en general para conocer los resultados, entre ellas, las estrategias de difusión que han puesto en práctica la sep, la Subsecretaría de Educación Media Superior (sems) y el Ceneval para promover el máximo aprovechamiento de la evaluación.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R13
En el último apartado se presenta una discusión de los alcances de esta evaluación y de la experiencia que se ha tenido durante los tres años de su aplicación, con el propósito de motivar la reflexión y retroalimentación en cuanto a la construcción y desarrollo de la prueba. De igual modo, se mencionan de manera breve algunos aspectos de la reestructuración que sufrió la prueba para su aplicación en 2011, en congruencia con los objetivos y lineamientos de la Reforma Integral de la Educación Media Superior (riems).
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R15
En 2007 la Subsecretaría de Educación Media Superior (sems) comenzó el desarrollo del Sistema Nacional de Evaluación de la Educación Media Superior
(sneems), en cumplimiento del Programa Sectorial de Educación 2007-2012. Dicho sistema persigue dos objetivos generales: 1) proporcionar elementos para mejorar la calidad de la educación media superior (ems) en todas sus dimensiones, subsistemas, modalidades y plan-teles, y 2) proporcionar elementos para rendir cuentas a la sociedad sobre el funcionamiento del nivel educativo, mediante mecanismos transparentes en beneficio de todos los sectores interesados.
Para evaluar de manera integral la calidad de la ems es necesario utilizar varias estra-tegias, cuyos alcances y limitaciones se complementen de tal forma que ofrezcan una visión más amplia de la realidad educativa y la posibilidad de emitir juicios de valor que susten-ten adecuadamente las decisiones que se tomen. Para ser consecuente con dicho principio, el sneems establece cinco grandes niveles o ámbitos de trabajo, cuya evaluación supone diversas estrategias con propósitos específicos e instrumentos que respondan de manera congruente y adecuada a las características de cada uno. Los ámbitos son: a) sistemas y sub-sistemas, b) programas e intervenciones, c) escuelas, d) maestros y e) alumnos.
1. Antecedentes
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
16
enlace Media Superior es uno de los instrumentos construidos para la evaluación de los alumnos. Entre otras líneas de acción, el Programa Sectorial que rige al sneems, expresa la necesidad de “diseñar, aplicar y consolidar los instrumentos de evaluación del desempeño académico de los estudiantes como insumo para reorientar la acción pedagógica y para integrar los programas de nivelación académica”.1
Esta evaluación se desarrolló con el fin de generar información para cada estudiante acerca de su capacidad de respuesta ante exigencias de la vida cotidiana al egresar de la ems, de tal forma que se proporcionen elementos para contribuir a la mejora del sistema educativo (incluyendo maestros, planteles, padres de familia, etcétera).
En febrero de 2007 la sems y la Dirección General de Evaluación (dgep) de la sep solicitaron el apoyo de Ceneval para la elaboración de la prueba enlace Media Superior, a lo que el Centro respondió con tres propuestas: la primera incluía la evaluación de cinco áreas: Lenguaje y Comunicación, Matemáticas, Metodología, Ciencias Naturales e Introducción a las Ciencias Sociales; la segunda se centraba en la evaluación de tres ámbitos: Matemáticas, Lectura y Ciencias; y la tercera en la evaluación de dos habilidades básicas: Habilidad Lectora y Habilidad Matemática.
Debido a la diversidad de subsistemas que hay en la educación media superior y a la existencia de más de 200 currículos en el ámbito nacional, se prefirió la elaboración de un instrumento abocado a dos habilidades generales que son parte fundamental en la educación: Habilidad Lectora y Habilidad Matemática. Ambas son transversales, es decir, se desarrollan a lo largo de la historia escolar y fuera de ella, además de que se manifiestan de modo dife-rencial en los individuos, lo cual permite identificar diferentes niveles de dominio.
La construcción de la prueba implicó diversos procesos integrados y sistematizados en las etapas de la Metodología Ceneval: diseño, construcción, verificación, ensamble, aplicación, calificación y emisión de reportes. Las cuatro primeras fueron responsabilidad única del Ceneval y las tres últimas estuvieron a cargo de la dgep-sep; en todos los casos se supervisó el cum-plimiento de lineamientos y estándares de carácter internacional (apa, aera & ncme, 1999).
En cada una de las etapas, los procesos fueron avalados y legitimados por cuerpos colegiados que emitieron propuestas y juicios especializados. El Consejo Directivo, el Consejo Técnico, los Comités Académicos o el grupo de Asesores Externos están conformados por expertos en educación y evaluación de las habilidades que integran la prueba, nacionales e
1 Disponible en http://www.sep.gob.mx/wb/sep1/programa_sectorial
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R17
internacionales. Dada la notoriedad que la prueba enlace Media Superior ha adquirido desde su primera aplicación, en 2008, resulta prioritario asegurar la calidad del proceso evaluativo.
En la tabla 1 se muestra el incremento en la cobertura de la prueba en estos tres años, por número de centros escolares y de sustentantes individuales. Los datos para cada entidad federativa se encuentran disponibles en la página electrónica http://enlace.sep.gob.mx/ms/.
Tabla 1. Cobertura de enlace Media Superior
Como se mencionó, en 2011 la evaluación sufrió algunas modificaciones en respuesta a la solicitud de la sems de dar seguimiento a la Reforma Integral de la Educación Media Supe-rior (riems) que centra sus esfuerzos en promover un perfil de egreso definido en términos de competencias. Debido a que el enfoque de la prueba enlace Media Superior siempre ha sido evaluar habilidades básicas, el cambio no será radical y actualmente ya se ha avanzado en el diseño y adaptación de la prueba de modo que para dar continuidad a la evaluación de Habilidad Lectora y Habilidad Matemática, en 2011 la prueba se abocó a los campos discipli-nares que la riems identifica de la siguiente manera: Comunicación (Comprensión Lectora) y Matemáticas.
En los siguientes apartados se documentan los acuerdos y actividades correspondien-tes a las diferentes etapas de construcción de la prueba que se aplicó entre 2008 y 2010, así como los resultados obtenidos.
Sustentantes
2008
808,346
11,007
2009
835,741
11,716
2010
884,663
12,164Escuelas
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R19
Durante el periodo 2008-2010, la prueba enlace Media Superior se concibió como una evaluación diagnóstica de dos habilidades
básicas para la vida. En el cuadro 1 se sintetizan las características de esta evaluación de acuerdo con las categorías establecidas (Vidal, 2009) para los instrumentos de evaluación generados en Ceneval. En las siguientes páginas se ofrece una explicación para cada una.
Cuadro 1. Características de la prueba enlace Media Superior
2. Características generales de la prueba
Propósito
Población sustentante
Periodicidad
Tipo de examen
Dominio explorado
Cobertura de dominio
Referente de calificación
Sensibilidad a la instrucción
Cobertura de la población
Evidencias
Control de la aplicación
Impacto
Evaluar personas
Alumnos del último ciclo de la ems
Anual
Diagnóstico
Habilidades básicas: lectora y matemáticas
Restringido
Criterial
Baja
Censal
Opción múltiple
Bajo
Bajo
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
20
2.1 Objetivo
El objetivo de la prueba Enlace Media Superior es determinar en qué medida los jóvenes son capaces de aplicar a situaciones del mundo real los conocimientos y habilidades adquiridos a lo largo de la educación media superior, que les permiten hacer un uso apropiado de la lengua (Habilidad Lectora) y las Matemáticas.
2.2 Propósito
La prueba enlace Media Superior se aplica cada año y su propósito general es evaluar per-sonas. Mediante los datos obtenidos en la aplicación, es posible:• • • Generar información, para cada alumno, acerca de su nivel de desempeño en dos ha-
bilidades básicas.• • • Proveer elementos que contribuyan a la mejora del sistema educativo.• • • Proveer información útil para el plantel, los profesores y los padres de familia.
2.3 Población objetivo
La prueba enlace Media Superior está dirigida a los alumnos del último ciclo de bachillerato (cuatrimestre, semestre, año) en modalidad escolarizada de los diferentes subsistemas de las instituciones de educación media superior (bachilleratos generales, tecnológicos y bivalentes), tanto de sostenimiento público como privado, de la República Mexicana.
Por ser una prueba estandarizada no es apta para aplicarse a alumnos con necesidades especiales o que usen una lengua diferente al español.
2.4 Características psicométricas
Es una prueba objetiva y estandarizada, porque su aplicación y calificación mantiene las mismas condiciones para todos los sustentantes evaluados. Además, se caracteriza por:• • • ser un examen diagnóstico, ya que emite información general del desempeño de cada
alumno, sin establecer alguna categoría de certificación o jerarquización;
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R21
• • • explorar el dominio de los sustentantes en tareas relacionadas con habilidades básicas para la vida, a saber, Habilidad Lectora y Habilidad Matemática;
• • • ser una evaluación de cobertura homogénea restringida, porque utiliza las mismas preguntas para medir, en todos los estudiantes, la presencia o ausencia únicamente de una muestra representativa de conocimientos, actividades y conductas relacionadas con sus habilidades;
• • • su baja sensibilidad a la instrucción, puesto que examina un dominio restringido de ha-bilidades que el sustentante desarrolla tanto dentro como fuera del aula, es decir que no dependen solamente del currículo escolar y la manera en que son enseñadas en los niveles de escolarización formal;
• • • reportar los resultados con referencia a criterio, ya que el desempeño del individuo es inde-pendiente de lo que responden otros individuos, a diferencia de la evaluación referente a la norma, la cual compara el resultado del individuo con los resultados de una población o grupo al que pertenece. La evaluación criterial permite identificar con precisión, en re-lación con un criterio previamente fijado, el rendimiento de un sustentante en función de su desempeño o dominio de las habilidades evaluadas al resolver la prueba;
• • • ubicar a los sustentantes en cuatro niveles de desempeño, que se definen con base en el con-tenido establecido en el perfil referencial;
• • • ser censal, puesto que está programada para aplicarse a todos los sustentantes que cum-plan con la descripción de la población objetivo;
• • • estar conformada por reactivos de opción múltiple, ya que incluye preguntas o problemas que se acompañan de tres distractores verosímiles y una respuesta correcta. La elección de este tipo de reactivo para conformar la prueba se debe, por un lado, a su flexibilidad, ya que los reactivos de opción múltiple se adaptan a la complejidad de los contenidos que se pretende evaluar; por otro, a su versatilidad, ya que los reactivos de este tipo permiten me-dir la comprensión de nociones fundamentales y la habilidad del sustentante para razonar y aplicar lo aprendido; así también, una característica que los hace ideales es la facilidad de calificación, ya que puede hacerse de manera rápida y exacta, lo que resulta indispensable cuando se requiere evaluar poblaciones numerosas y ofrecer resultados rápidamente.
• • • contar con un bajo control en su aplicación, lo cual responde al hecho de que únicamente sea una evaluación diagnóstica y se aplique a una población de alrededor de 800,000 sustentantes cada año. Aun así, en la cuarta sección del presente Manual se explican los detalles de la aplicación de la prueba a una muestra controlada, cuyos datos se utilizan para procesos de calificación e investigaciones alternativas;
• • • ser un examen de bajo impacto, ya que sus resultados no deben tener consecuencias para los evaluados.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
22
2.5 Alcances y limitaciones
Las características y propósitos de la prueba enlace Media Superior determinan sus alcances y limitaciones en comparación con otros instrumentos de evaluación. Es importante hacer hincapié en dichos aspectos, ya que utilizar los resultados de la evaluación para fines distintos ocasionaría interpretaciones carentes de validez (estándares 1.1, 1.2 y 1.6).2
La prueba brinda a los sustentantes información útil sobre las fortalezas y debilidades que poseen en cuanto al desarrollo de su Habilidad Lectora y su Habilidad Matemática. El reporte de resultados presenta, de manera específica, las tareas que el sustentante es capaz de realizar y aquellas que no, de modo que pueda conocer áreas de oportunidad para así hacerse responsable de su educación y emplear herramientas que le ayuden a mejorar sus habilidades. Es importante considerar que, debido a que la prueba se planteó desde el inicio como diagnóstica, enlace Media Superior evalúa únicamente una muestra representativa de contenidos y procesos. En otras palabras, no incluye todas las temáticas y tareas que los estudiantes del nivel medio superior pueden y deben dominar. Además, el examen posee una baja sensibilidad a la instrucción, ya que la necesidad de evaluar a la población censal, aunada a la existencia de múltiples currículos de bachillerato, obligó a que el diseño de la prueba se centrara en la evaluación de dos habilidades que cualquier estudiante debe poseer, indepen-dientemente del subsistema que haya cursado.
enlace Media Superior se clasifica como una prueba de bajo impacto pues los resul-tados obtenidos no tienen consecuencias académicas para los alumnos evaluados ni para las escuelas. El instrumento no permite derivar conclusiones acerca de la educación media superior, los subsistemas, las escuelas o el desempeño de las entidades federativas. El di-seño y propósitos de esta prueba se limitan a la emisión de un diagnóstico general para el sustentante de fortalezas y debilidades en el desarrollo de su Habilidad Lectora y Habilidad Matemática. Las decisiones que se tomen a partir de los resultados deben considerar cuida-dosamente el contexto de la evaluación y las condiciones de cada escuela, por lo que no es válido sacar conclusiones sobre el mejor o peor subsistema, plantel o plantilla docente. La prueba no sirve para hacer comparaciones entre alumnos, entre escuelas o entre subsistemas; sólo responde a los propósitos para los que fue creada: proporcionar un diagnóstico indivi-dual, elementos que contribuyan a la mejora del sistema educativo y retroalimentación para maestros, planteles y padres de familia.
2 Con este formato, de aquí en adelante se indican los estándares de calidad de la apa, aera y ncme (1999) que se siguieron durante el proceso de construcción y aplicación de enlace Media Superior, así como en la elaboración del presente Manual Técnico.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R23
En el caso de los docentes, la prueba es útil para conocer las fortalezas y debilidades que exhiben los sustentantes en lo que se definió como Habilidad Lectora y Habilidad Mate-mática en enlace Media Superior. Para las autoridades educativas, los resultados de la prueba representan un diagnóstico general útil para guiar las acciones de fomento de la Habilidad Lectora y la Habilidad Matemática.
2.6 Administración
La aplicación de la prueba enlace Media Superior es responsabilidad de la dgep-sep y se hace año con año. La prueba se aplica de manera censal, lo que determina que el control del proceso sea bajo; sin embargo, para contar con datos confiables para la realización de los análisis estadísticos y los procesos de calificación, se planifica una aplicación controlada a una muestra representativa de la población objetivo.
El instrumento se califica bajo las mismas condiciones para todos los evaluados por lo que se caracteriza como prueba estandarizada (estándar 3.20). Es importante mencionar que, una vez que se aplica, la prueba se hace pública; es decir se dan a conocer todos los reactivos que la conforman. En el capítulo cuarto se describen a detalle algunos aspectos relacionados con la administración de la prueba.
2.7 Resultados
Tanto los estudiantes como los directivos, docentes y la comunidad en general, tienen acceso a los resultados de cada aplicación ingresando a la página electrónica oficial http://enlace.sep.gob.mx/ms/. Cada estudiante puede conocer el nivel de dominio en el que se encuentra: insuficiente, elemental, bueno o excelente para cada una de las habilidades evaluadas, así como las respuestas correctas de todos los reactivos. Los docentes y directivos también tienen la posibilidad de conocer los errores más comunes del alumnado y los resultados de cada plantel año con año.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R25
De acuerdo con la Metodología Ceneval (2008) y como parte del primer paso para desarrollar pruebas eficaces, la construcción de la prueba enlace Media Superior
comenzó con el establecimiento de un plan general de evaluación. Las primeras acciones se orientaron a definir el propósito y las características generales del instrumento en congruen-cia con los requerimientos de la sems. Contar con objetivos claros y conocer los alcances y limitaciones de la aplicación deseada permite establecer un cronograma con actividades que aporten validez y solidez a la prueba en su conjunto (estándares 1.1, 3.2 y 3.9).
De 2007 a la fecha, cada uno de los procesos involucrados en la elaboración de la prueba ha contado con la participación de distintos grupos de expertos. La validez de la estrategia de medición y las interpretaciones se ven fortalecidas por la constante retroalimentación que hay entre los cuerpos colegiados, ya que la implementación de la evaluación implica la coor-dinación y el consenso entre todos.
A continuación se detallan las funciones de los grupos de trabajo que intervinieron en la elaboración de la prueba, tanto en su diseño como en su construcción y mantenimiento. En el anexo I se enlistan los nombres de los integrantes.
3. Desarrollo de la prueba
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
26
• • • Consejo Directivo: sus integrantes dan seguimiento al sneems coordinando las estrategias propias de los cinco ámbitos ya mencionados.
• • • Consejo Técnico: asesora a las autoridades educativas y a los Comités Académicos en el di-seño, análisis y seguimiento de la prueba impulsando acciones que permitan respaldar su transparencia y confiabilidad; valida su estructura y sus contenidos; revisa los resultados del estudio piloto y propone modificaciones a partir de ellos; evalúa técnica y académi-camente los informes que se producen y define los usos que son apropiados. Además, colabora en la propuesta de elaboración de los cuestionarios de contexto y aprueba la forma de aplicación de la prueba enlace Media Superior.
• • • Comité Académico de Diseño: es el responsable de la definición de los contenidos que se van a evaluar, los grupos de procesos cognitivos y los niveles de complejidad que explora la prueba y determinan su estructura. A partir de ello, elabora las especificaciones de reac-tivos que son revisadas por el Comité Académico de Validación de Contenido y Especificaciones.
• • • Comité Académico de Elaboración de Reactivos: está conformado por docentes del nivel medio superior y especialistas en los contenidos de la prueba, que elaboran los reactivos con base en las especificaciones.
• • • Comité Académico de Validación de Reactivos: garantiza que los reactivos elaborados co-rrespondan con lo que se desea evaluar y representen de manera clara y precisa los elementos necesarios para asegurar la validez de la evaluación.
• • • Comité Académico de Establecimiento de Puntos de Corte y Definición de Niveles de Dominio: sus miembros son expertos en las áreas de evaluación y estadística, que revisan los pará-metros obtenidos después del piloteo y aplicación de la prueba, identifican las puntua-ciones de corte y definen los niveles de dominio.
• • • Asesores externos: son especialistas reconocidos en Latinoamérica, Estados Unidos y Europa que establecen los estándares técnicos, evalúan los distintos indicadores de los instrumentos y hacen recomendaciones para el mejoramiento de los procesos de diseño, elaboración y administración de las pruebas.
La decisión de integrar tan diversos cuerpos colegiados obedece a que en el Ceneval se considera importante contar con diferentes puntos de vista que enriquezcan el instrumento de evaluación.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R27
3.1 Definición del contenido
Una vez que el Consejo Directivo y el Consejo Técnico acordaron el plan general de la prueba –el cual incluye las características y propósitos descritos en el apartado anterior–, el personal del Ceneval estuvo en condiciones de convocar a los Comités Académicos e iniciar con la primera etapa de la metodología institucional para la construcción de pruebas: el diseño.
Durante la etapa de diseño del instrumento de evaluación se definen los elementos que constituyen el marco conceptual y operacional en que se fundamentará todo el proceso. El primer paso es elaborar un perfil referencial (pr), que constituye el referente medular para el desarrollo de la prueba, porque describe las bases teóricas y la forma en que se estructura el instrumento de manera que se cumpla con sus propósitos y se atiendan las características de los sustentantes. De este modo, es posible establecer de manera clara y precisa aquello que se pretende medir (estándares 1.2 y 1.6).
Para la prueba enlace Media Superior se elaboró un perfil de cada una de las habi-lidades evaluadas. Su delimitación estuvo a cargo de los Comités Académicos de Diseño, conformados por grupos de expertos en la enseñanza y desarrollo de la Habilidad Lec-tora y Matemática. Estos comités estudiaron los marcos teóricos de la evaluación de pisa (Programme for International Student Assessment) que lleva a cabo la Organización para la Cooperación y el Desarrollo Económicos, los materiales disponibles de la encuesta all (International Adult Literacy Survey), los procedimientos de Cito3 (Cito Instituut voor Toet-sontwikkeling, conocido en inglés como Central Institute for Test Development) y algunas aproximaciones a la evaluación de habilidades que han resultado exitosas en el contexto latinoamericano (simce y timss). La revisión de literatura y de los planes y programas de las diferentes modalidades y subsistemas de la ems sirvió como referente para definir las dos habi-lidades e identificar los contenidos y los procesos por evaluar. Una de las concepciones teóricas generales que guio la elaboración del perfil corresponde con el enfoque de las pruebas pisa y simce, y fue la siguiente:• • • El alumno aprende poniendo en práctica habilidades que implican el despliegue de diferentes procesos
cognitivos, y el profesor, como mediador del aprendizaje, debe identificarlas y tratar de desarrollarlas por medio de diversos contenidos (simce, 2005).4
3 Página oficial del Instituto http://www.cito.nl/4 Sistema de Medición de la Calidad de la Educación (simce). Reporte de Resultados 2005. Santiago: Ministerio de Educación, Unidad
de Curriculum y Evaluación (uce) de Chile.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
28
Tanto la Habilidad Lectora como la Matemática están definidas en términos del contenido o estructura del conocimiento que los estudiantes necesitan adquirir a lo largo de la trayectoria escolar y los procesos que se requieren llevar a cabo (pisa, 2000, 2003, 2006). Tanto la Meto-dología Ceneval (2008) como Downing et al. (2006), recomiendan poner especial atención en la definición operacional de los contenidos y los procesos cognitivos implicados en las tareas que tendrá que resolver el alumnado, específicamente para facilitar la elaboración de los reactivos y apoyar a los investigadores e interesados en las interpretaciones que pudieran derivarse de los resultados de la evaluación (estándares 1.18 y 13.3).
Los Comités Académicos diseñaron además las especificaciones de la prueba y defi-nieron su estructura. Las especificaciones son enunciados que describen de manera clara y precisa la conducta que se espera que realice el sujeto al contestar un reactivo (estándares 3.2 y 3.11). Estas se construyen en correspondencia directa con los contenidos que cada comité determina como esenciales para que un estudiante que egresa del nivel bachillerato en nuestro país sea competente en las áreas de conocimiento. Un aspecto importante en la elaboración de especificaciones fue distribuirlas de modo que se contara con tareas en tres niveles de complejidad. Esta gradación se delimitó para cada uno de los grupos de procesos cognitivos, de modo que después de la aplicación se facilite la ubicación de los sustentantes en diferentes niveles de dominio.
La pertinencia y relevancia de los contenidos y taxonomía diseñados para cumplir con los propósitos de enlace Media Superior fueron revisadas por Comités Académicos de Validación que perfeccionaron el diseño de la prueba. La propuesta final fue aprobada por el Consejo Técnico.
A continuación se presentan los perfiles referenciales de la prueba enlace Media Superior, y se describen puntualmente sus contenidos, procesos y estructura.
3.1.1 Habilidad LectoraLeer es una de las actividades básicas en el desarrollo académico y personal. Evaluar la Habilidad Lectora del alumnado es importante porque cada estudiante requiere contar con un nivel de dominio suficiente para responder a las exigencias de su entorno.
La evaluación de la Habilidad Lectora en la prueba enlace Media Superior concep-tualiza a la lectura como una herramienta fundamental en todas las formas de crecimiento intelectual, no sólo en el ámbito académico como base del aprendizaje, sino también para actividades de tipo recreativo y para el desarrollo social.
La diversidad de usos de la lectura constituye un proceso de naturaleza múltiple que involucra distintas habilidades que se adquieren en los primeros años de escuela y se forta-
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R29
lecen en la vida cotidiana. Leer se considera un proceso porque implica la coordinación de diferentes habilidades y conocimientos en distintos tiempos y grados de participación, antes, durante y después del acto de leer. Es muy importante que el lector vaya construyendo una comprensión de la lengua que integre su aspecto morfológico y funcional, lo primero se refiere a las consideraciones formales del lenguaje que, como sistema, debe respetar signos, reglas y convenciones para ser entendido, y el segundo aspecto atiende a la función comuni-cativa del lenguaje.
Partiendo de este universo conceptual, se elaboró una definición de la Habilidad Lectora, que es meramente operacional, es decir, responde a las necesidades de la prueba.
Definición operacional
Para la prueba enlace Media Superior se definió la Habilidad Lectora como la capacidad de un individuo para comprender, utilizar y analizar textos escritos, con el fin de alcanzar sus propias metas, desarrollar el conocimiento y el potencial personal, y participar en la sociedad.
Contenidos
El contenido por evaluar está asociado con el tipo de texto que se utiliza para medir la Habilidad Lectora. Los cuatro tipos de texto que contiene la prueba enlace Media Superior se eligieron por considerarse representativos del nivel educativo, y porque reflejan funciones importantes de la lengua.
Su descripción es la siguiente:• • • Apelativo. Refleja la función apelativa, la cual trata de suscitar interés en el receptor
o de convencerlo de actuar. Se busca seguir una instrucción; convence, sugiere, ruega, aconseja. Desarrolla el uso del verbo condicional o imperativo.
• • • Argumentativo. Pretende expresar un argumento o contraargumento, probar o demos-trar una idea, refutar la contraria para persuadir o disuadir al receptor. Intenta demostrar, convencer o cambiar ideas; por ello –además de la función apelativa presente en el desa-rrollo de los argumentos– aparece la función referencial, donde se expone la tesis.
• • • Expositivo. Representa la función referencial o pragmática utilizada cuando se quiere expresar clara y objetivamente un mensaje. Se relaciona con el mundo real, con el con-texto externo, y expresa lo que sucede, las acciones emprendidas por alguien, así como los resultados de investigaciones. Ayuda a aprender a describir o clarificar algún con-cepto, palabra o aspecto de un tema determinado.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
30
• • • Narrativo. Evoca la función poética, literaria o creativa, útil para describir la realidad en forma subjetiva, personal, original y creativa a través de la mirada del artista, quien selecciona y combina las palabras y frases; además de lo que se dice, es importante cómo se dice.
Asimismo, se crearon listas de cotejo que señalan los requerimientos de forma y con-tenido para cada texto, con el fin de asegurar que los reactivos asociados permitan cumplir con la evaluación de los procesos necesarios, eviten ser ofensivos para algún grupo social y garanticen un lenguaje claro, sin regionalismos ni tecnicismos.
Procesos y niveles de complejidad
La prueba enlace Media Superior concibe la lectura como una actividad multidimensional, por lo que al evaluar la Habilidad Lectora se espera que los estudiantes demuestren su capa-cidad para obtener información, comprender los textos de manera general, interpretarlos y reflexionar sobre su contenido y su forma. Los procesos cognitivos que se definieron para la evaluación implican los procedimientos cognitivos mínimos que un sustentante con buena comprensión lectora debe poner en práctica para utilizar de manera adecuada los textos.
La definición de cada uno de los procesos se muestra a continuación:•• 1. Extracción de información. Implica buscar, localizar y seleccionar la información
específica de una o más oraciones, o de distintos párrafos de un texto. Se basa en el propio texto y en la información explícita que contiene.
•• 2. Desarrollo de la comprensión. Está relacionado con la capacidad del lector para identificar de qué fenómeno o tema trata el texto y qué se dice de él.
•• 3. Desarrollo de la interpretación. Implica atribuir significado y sentido a palabras, oraciones, conceptos, proposiciones al texto completo, de acuerdo con sus contenidos y propósitos.
•• 4. Reflexión y evaluación del contenido. Tiene que ver con la valoración de las pro-posiciones que contiene un texto, para contrastarlas con los conocimientos previos y relacionar su información con otras fuentes de conocimiento, las cuales pueden proceder de textos facilitados en la prueba o de ideas explicitadas en la pregunta.
•• 5. Reflexión y evaluación de la forma. Consiste en identificar el grado de corresponden-cia entre el contenido y la estructura del texto y evaluar su pertinencia, así como valorar qué tan adecuada es la forma en que se escribió el texto al contenido que se presenta.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R31
Con el fin de precisar aún más la medición de la Habilidad Lectora, se desagregaron los procesos en tres niveles de complejidad, de acuerdo con las características y tareas invo-lucradas en cada uno:•• a) La información a la que recurre el sustentante. Puede utilizar información contenida
en el texto o fuera de él, apoyándose en conocimientos externos del tema abordado.•• b) Los aspectos en los que se centra el lector. Pueden ser partes independientes del texto
o relaciones entre sus apartados.•• c) El enfoque del lector en el texto. Puede considerarlo como un conjunto o hacer rela-
ciones entre sus partes.
La definición de los niveles de complejidad sirvió como referente para elaborar las especificaciones de la Habilidad Lectora. Fue exhaustiva para asegurar que se cuente con reactivos relacionados con todas las acciones cognitivas que se requieren para comprender un texto. Por esta razón, los grupos de procesos de Desarrollo de la comprensión y de la interpretación, así como Reflexión y evaluación del contenido y de la forma, se subdividieron para optimizar las actividades posteriores de construcción de la prueba. Los niveles se pre-sentan a continuación:
Niveles del proceso de extracción de información
• • • Nivel 1. Localizar un elemento (tópico, concepto, episodio, participante) que se encuentre en el texto de manera explícita. Será muy evidente o notorio para el lector, y se puede encontrar en cualquier parte del texto.
• • • Nivel 2. Localizar dos elementos relacionados (tópico, concepto, episodio, participante) que se encuentren a lo largo del texto de manera explícita. Estos elementos se encuentran en cualquier parte del texto o párrafo y carecen de marcadores.
• • • Nivel 3. Localizar tres o más elementos relacionados. El elemento objetivo y sus dis-tractores se ubican a lo largo del texto.
Niveles del proceso de desarrollo de la comprensión
• • • Nivel 1. Identificar el tema central de un párrafo; el tema no es explícito, implica una inferencia local.
• • • Nivel 2. Integrar diferentes partes de un texto para identificar la idea central; comprender una relación (problema-solución, causa-efecto, comparación-contraste, premisa- con-clusión, ejemplificación, descripción, negación, etcétera).
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
32
• • • Nivel 3. Localizar tres o más elementos relacionados. El elemento objetivo y sus dis-tractores se encuentran a lo largo del texto.
Niveles del proceso de desarrollo de una interpretación
• • • Nivel 1. Interpretar el significado de una palabra o frase corta con base en la situación descrita.
• • • Nivel 2. Inferir relaciones entre los párrafos (problema-solución, causa-efecto, compa-ración-contraste, premisa-conclusión, emociones, etcétera). Se evalúan analogías.
• • • Nivel 3. Vincular las múltiples interpretaciones e inferencias.
Niveles del proceso de reflexión y evaluación del contenido
• • • Nivel 1. Identificar la postura del autor de manera global.• • • Nivel 2. Identificar información que apoye el punto de vista del autor (un hecho, un
dato, un contexto) y contrastar sus argumentos.• • • Nivel 3. Identificar los contraargumentos que se incluyen en el texto o establecer una
comparación con un fragmento del mismo y un refrán o analogía.
Niveles del proceso de reflexión y evaluación de la forma
• • • Nivel 1. Determinar si los recursos gráficos (cursivas, viñetas, subtítulos, etcétera) uti-lizados por el autor son adecuados y contribuyen a hacer una mejor interpretación del texto en el entorno local.
• • • Nivel 2. Identificar si la estructura del texto es adecuada al contenido que se presenta. Establecer por qué se utilizan recursos gráficos en dos o más párrafos.
• • • Nivel 3. Identificar si la organización, expresiones y recursos que el autor utiliza son adecuados al tipo de texto que se presenta y a su destinatario.
Las especificaciones describen, de manera muy similar a las definiciones presentadas, cada una de las conductas que se busca en los sustentantes al responder un reactivo. La relación tan estrecha de las especificaciones con los propósitos y bases conceptuales de la prueba, permite tener claridad y precisión en lo que se va a medir, logrando así que la elabo-ración de reactivos tenga la menor discrecionalidad al interpretar lo que se quiere evaluar y puntualidad en lo que se debe preguntar.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R33
3.1.2 Habilidad MatemáticaLos conceptos y tareas matemáticas están presentes en casi todas las situaciones de la vida diaria, de ahí que manejarlas satisfactoriamente se considere una habilidad básica. Su eva-luación se ha abordado de diferentes modos; en algunas ocasiones se realizan las pruebas por medio de tareas que pertenecen a las ramas de la matemática, como álgebra, geometría, estadística, probabilidad o cálculo; pero otras aproximaciones se basan en la presentación de situaciones que dan pie a organizar y estructurar la información presente en el problema, identificar los aspectos matemáticos relacionados con dicha tarea y descubrir, entre otras cosas, relaciones, regularidades y estructuras. Todo este proceso se conoce como matematización (Freudenthal, 1999).
Se decidió evaluar la Habilidad Matemática mediante operaciones matemáticas simples y complejas con ejercicios parecidos a los que se plantean en el aula. Se incluyeron también problemas menos estructurados, similares a los que enfrentará el alumnado en contextos sociales o de su vida cotidiana, en los que tendrá que analizar el procedimiento y la técnica matemática necesarios para poder solucionarlos.
El Perfil Referencial de Habilidad Matemática de la prueba enlace Media Superior se organizó de manera sistemática, por un lado, a través de los contenidos matemáticos que eng-loban los temas o elementos conceptuales en los que un estudiante debe basarse para resolver un problema y, por el otro, con los procesos matemáticos en los que se agrupan las tareas cog-nitivas que el estudiante utiliza para responder un cuestionamiento o solucionar un problema.
Definición operacional
La Habilidad Matemática se definió como la aptitud de un individuo para identificar y comprender el papel que desempeñan las matemáticas en el mundo, alcanzando razonamientos bien fundados, utilizando y participando en las matemáticas en función de las necesidades de su vida como ciudadano constructivo, comprometido y reflexivo (ocde, 2006).
La definición implica que aquel estudiante que cuente con Habilidad Matemática es capaz de valorar el papel que juegan las matemáticas en su vida y, de esa forma, aplicarlas en la solución de problemas que se le presenten en diferentes contextos.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
34
Contenidos
Para afirmar que un sustentante posee cierto nivel de Habilidad Matemática, independiente-mente del área en que haya cursado, cada bachiller debe conocer y manejar cuatro contenidos matemáticos generales: cantidad, espacio y forma, cambios y relaciones, y matemáticas básicas. Su descripción es la siguiente:• • • Cambios y relaciones. Implica reconocer, describir y modelar de forma numérica,
algebraica y gráfica las relaciones o funciones temporales y permanentes entre fenó-menos. Prevé la necesidad de tomar decisiones a partir del análisis de los datos, repre-sentaciones de experimentos aleatorios y juegos de azar.
• • • Cantidad. Subraya la necesidad de cuantificar para proceder a describir el entorno. In-cluye aquellos conceptos involucrados en la comprensión y orden de tamaños relativos, reconocimiento de patrones numéricos, uso de números para representar cantidades y atributos cuantificables de los objetos del mundo real.
• • • Espacio y forma. Señala la necesidad de reconocer patrones, imágenes, ubicaciones, movimientos o cualidades de los objetos que ocupan un lugar en el espacio, así como codificar y decodificar información de estos en contextos concretos (imágenes) y abstractos (descripciones).
• • • Matemáticas básicas. Implica reconocer, describir y modelar objetos geométricos a partir de representaciones algebraicas; además, considera el estudio de las relaciones entre los ángulos y los lados de un triángulo valiéndose de funciones o razones.
Procesos cognitivos
El dominio de los contenidos matemáticos se evalúa a partir de tareas que implican el des-pliegue de tres grupos de procesos cognitivos: reproducción, conexión y reflexión.
Las definiciones de los procesos describen conocimientos, actividades y tareas cog-noscitivas progresivamente más sofisticadas. Por ello, en teoría debiera ser más fácil para los sustentantes contestar un reactivo del proceso de reproducción que uno de conexión, ya que el nivel de complejidad va aumentando de un proceso a otro; sin embargo, en la realidad se ha visto que otros aspectos influyen en la dificultad del reactivo, a saber: el contenido que se evalúa, la familiaridad que se tiene con la tarea realizada, la cercanía o lejanía entre el mo-mento en que fue aprendida y evaluada, entre otros. Aun así, tener un punto de partida que sea congruente con las investigaciones vigentes brinda un marco conceptual adecuado para interpretar los resultados de la prueba año con año.
La progresión en la complejidad de las tareas se ve con mayor claridad en los niveles de dominio que se presentan en el apartado de calificación.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R35
• • • Reproducción. Las habilidades de este grupo incluyen tareas que permiten determinar si el sustentante conoce y aplica la técnica matemática. Implica esencialmente: utilizar conocimientos y procedimientos matemáticos a problemas directos, reconocer equiva-lencias, utilizar objetos y propiedades matemáticas, así como manejar representaciones numéricas, simbólicas y gráficas.
• • • Conexión. Las habilidades del grupo de conexión incluyen problemas que no son directos; es decir, se presentan a partir del planteamiento de problemas sencillos retomados de la vida real. Los problemas de este tipo plantean exigencias en su inter-pretación y requieren que el sustentante reconozca la técnica matemática que se ha de utilizar, con el fin de solucionar problemas que impliquen equivalencias, uso de propie-dades matemáticas y empleo de representaciones numéricas, simbólicas y gráficas.
• • • Reflexión. Las habilidades del grupo de reflexión incluyen problemas cuyo plantea-miento no es directo; es decir, se presentan a partir de situaciones complejas retomadas de la vida real en las cuales se hace uso de más de una forma de representación de información (textual, numérica, simbólica o gráfica). Los problemas de este tipo plan-tean exigencias en su interpretación y requieren que el sustentante reconozca la técnica matemática por utilizar, establezca relaciones, combine e integre información entre distintas formas de representación o diferentes aspectos de una situación y que utilice más de un paso o proceso, con el fin de solucionar un problema.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
36
3.2 Estructura de la prueba
En las pruebas que diseña el Ceneval la estructura se refiere a la distribución de los reactivos por contenido y por proceso para cada habilidad evaluada, lo cual se determina en congruen-cia con la definición del constructo previamente establecida. La cantidad y dificultad de los reactivos consideran la relevancia de cada contenido para el diagnóstico de la habilidad en general, de acuerdo con el nivel educativo y las condiciones de la aplicación.
La prueba enlace Media Superior 2008-2010 consta de 140 reactivos, de las cuales 50 corresponden a Habilidad Lectora y 90 a Habilidad Matemática. En la tabla 2 se presenta la distribución de reactivos por procesos y contenidos temáticos, que guio la construcción de la prueba.
Tabla 2. Estructura de enlace Media Superior
Habilidad Matemática
Habilidad Lectora
Subárea
Tipo de texto
Argumentativo
Narrativo
Expositivo
Apelativo
Cantidad
Espacio y Forma
Cambios y Relaciones
Matemáticas Básicas
Contenido Matemático
Total de reactivos por proceso
Total de reactivos por proceso
Extracción
Reproducción
20
4
7
5
5
7
9
4
5
26
Interpretación5
Conexión
22
4
13
7
10
8
11
3
10
44
Reflexión
8
2
5
2
5
2
5
2
5
20
50
10
25
14
20
17
25
9
20
90
Reflexión y evaluación
Área Número de reactivos por Proceso
Total en la prueba 140
Total de reactivos
5 Se presentan integrados en esta columna los procesos de desarrollo de la interpretación y de la comprensión, y en la columna siguiente los de reflexión y evaluación del contenido y la forma.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R37
Una vez delimitada una estructura congruente con el perfil referencial y los objetivos de la evaluación, la Metodología Ceneval prescribe la siguiente fase, la construcción de la prueba, la cual consta de dos etapas: elaboración de especificaciones y de reactivos.
3.2.1 Especificaciones de reactivosLas especificaciones son enunciados concretos que, tomando en cuenta el contenido temá-tico, el grupo de proceso y el nivel de complejidad al que pertenecen, nombran una tarea en particular cuya resolución muestra si el sustentante posee o no una parte específica de la Habilidad Lectora o la Habilidad Matemática de acuerdo con la definición que guía la prueba.
De manera adicional, se solicitó a los Comités Académicos que construyeran otros enunciados identificados como de acotamiento o delimitación que acompañan a cada espe-cificación. El acotamiento puntualiza aspectos relacionados con el formato de los reactivos, para indicar si se requiere presentar la información de una manera específica (en columnas, con datos numéricos, gráficos o verbales, entre otras) o si los datos pueden tener o no una rela-ción directa con los textos o los contenidos temáticos que se revisan en el aula.
Las especificaciones de reactivos tienen como propósito proporcionar un marco nor-mativo, claro y significativo, que aporte los elementos necesarios para que los elaboradores construyan reactivos adecuados para evaluar los contenidos y procesos cognitivos, así como los detalles técnicos para que los ítems resulten efectivos en la población objetivo y permitan generar interpretaciones válidas.
3.3 Elaboración y validación de reactivos
El Ceneval y la sems convocaron a especialistas en Habilidad Matemática y Habilidad Lectora para la elaboración de los reactivos. Un requisito indispensable para participar en los comités fue que sus integrantes contaran con experiencia en el nivel medio superior y tuvieran cono-cimientos en el área en la que elaborarían los reactivos.
El Ceneval impartió talleres de capacitación con la metodología institucional de elabo-ración de reactivos. Dicha capacitación es esencial para la calidad de la prueba, ya que contar con reactivos técnicamente adecuados es uno de los primeros pasos para asegurar que los resultados de la prueba son válidos y no se deben a aspectos de forma o detalles externos al objeto y estructura de la evaluación.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
38
Todos los reactivos cumplieron una fase de verificación con la que se asegura la calidad de los reactivos. De hecho, cada uno de los ítems pasó por una serie de revisiones cualitativas y cuantitativas (estándar 3.10). 3.3.1 Capacitación a elaboradores y validadoresDe acuerdo con la Metodología Ceneval, la labor de capacitación a los elaboradores de reactivos es permanente, aun cuando se cuente con los ítems necesarios para las diferentes versiones de la prueba (Vidal et al., 2000). Esto permite mantener en operación un banco de reac-tivos de buena calidad, que responda a los requerimientos de la prueba enlace Media Superior.
Tomando ello en consideración y de manera muy especial que la aplicación de la prueba es censal, todos los reactivos de la prueba enlace son de opción múltiple. El Ceneval posee una vasta experiencia en el desarrollo y calificación de este tipo de ítems, por lo que en la capaci-tación de los redactores y la posterior revisión técnica de los reactivos se siguen los requerimientos técnicos que han probado su eficacia en múltiples exámenes desarrollados por el Centro.
Dichos lineamientos son explicados a los elaboradores en cursos-taller que se organizan en las instalaciones de Ceneval, al igual que en cada sesión de los Comités Académicos de Validación. En las reuniones se informa a los asistentes de la historia y objetivos del Centro, así como de las particularidades de la prueba enlace Media Superior, de modo que los ítems correspondan con el propósito y modelo taxonómico de la evaluación.
Haladyna (2004, citado en Downing, 2006) considera que los reactivos de opción múltiple son los más adecuados para medir habilidades, especialmente las cognitivas de orden superior, como la capacidad de resolución de problemas, síntesis y valoración. Esto es así, entre otras cosas, porque permiten delimitar claramente los contenidos y tener una muestra representativa del universo amplio que implica cualquier área de conocimiento.
Para maximizar la validez de las interpretaciones que se derivan de los reactivos de opción múltiple (Vidal et al., 2000), enfatizan la importancia de elaborar ítems claros, con un formato que incluya siempre la base del reactivo, las opciones de respuesta con justificación, la respuesta correcta, la referencia o bibliografía, la fecha y el nombre del autor. Para llevar a cabo estas actividades, los elaboradores son capacitados también para almacenar los reactivos en un sistema electrónico, el intranet de Ceneval, que agiliza los posteriores procesos de verificación y ensamble de pruebas, entre otros.
Los validadores, en coordinación con un representante de Ceneval, llevan a cabo la revisión de reactivos en línea. Lo más importante es que ellos también dominen las temáticas y los lineamientos técnicos para que se cuente con ítems de calidad tanto en forma como en contenido.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R39
Una vez que los redactores informan que han concluido la elaboración de los reactivos, estos pasan por diferentes revisiones que se mencionan en la tabla 3 y se explican en las páginas siguientes.
Tabla 3. Actividades para la verificación de la calidad de los reactivos
3.3.2 Revisión cualitativaUna parte fundamental en la metodología institucional tiene que ver con los aspectos de verificación de la pertinencia y claridad del contenido de las especificaciones y los reactivos de las pruebas. Todo ello forma parte de los lineamientos internacionales que se deben cumplir durante la construcción de los exámenes (estándares 3.7, 7.2 y 13.18).
3.3.2.1 Revisión técnica
El primer filtro para los reactivos elaborados es la revisión técnica, que consiste en verificar que correspondan con la especificación ubicada en el perfil referencial, con el proceso cog-nitivo que se va a evaluar y con el tipo de texto asociado o al contenido matemático, según el área correspondiente del reactivo.
Esta actividad la realiza personal especializado del Ceneval con base en los siguientes lineamientos:•• 1. Base del reactivo. Debe incluir la información necesaria y suficiente para ser contes-
tado, implicar una sola tarea o cuestionamiento, cumplir con alguno de los formatos establecidos (jerarquización, completamiento, elección de elementos, relación de co-lumnas), y ser independiente de los demás ítems; es decir, la información contenida en un reactivo no ha de sugerir o requerir la solución de otro.
•• 2. Opciones de respuesta. Debe tener sólo una respuesta correcta y tres distractores. En lo referente a la respuesta correcta, esta debe ser incuestionable y resolver el plan-teamiento de manera satisfactoria, mientras que los distractores han de ser plausibles
Revisión técnica de reactivos
Validación con especialistas
Revisión de estilo
Piloteo de reactivos
Calibración
Cualitativa
Tipo de revisión
Cuantitativa
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
40
y totalmente incorrectos. Para corroborar esto, se revisan con especial cuidado las justificaciones o argumentaciones que los elaboradores indican para cada opción de respuesta.
Aunado a lo anterior, los textos que se utilizan para derivar los reactivos de Habilidad Lectora deben cubrir diversos criterios en cuanto al número de palabras, las características que los identifican y los temas a los que hacen referencia. Todos ellos se indican en una lista de verificación que los revisores técnicos tienen en cuenta para aceptar o pedir modificaciones.
En caso de que algún reactivo no cumpla con estos criterios o con lineamientos edito-riales, se proporciona retroalimentación al elaborador para su modificación, y sólo hasta que se cumplen las condiciones de calidad en contenido y forma, el reactivo es registrado en el sistema electrónico como aceptado y listo para la siguiente fase de verificación.
3.3.2.2 Validación con especialistas
Los reactivos que cumplen con los lineamientos técnicos del Ceneval son sometidos a un proceso de validación para garantizar que correspondan a la especificación, contenido y pro-ceso cognitivo que pretenden medir. De este modo, se asegura que representen, de manera clara y precisa, los elementos esenciales de las habilidades evaluadas en la prueba, ya sean conceptos, términos, definiciones, procedimientos, etcétera (estándares 3.7 y 3.17).
Cada reactivo es revisado y validado por lo menos por dos especialistas, en coordinación con un representante del Ceneval. Los primeros se encargan de leerlo y analizarlo de manera individual, discutir colectivamente su contenido, emitir un dictamen (Sin dictamen, Aceptado, Modificado y aceptado, Aceptado – Requiere diseño, o Descartado) y, en su caso, hacer propuestas de mejora. El coordinador de mesa del Ceneval se ocupa de resolver preguntas acerca del perfil referencial, del procedimiento, y de realizar los cambios necesarios a los reactivos a solicitud de los especialistas, además de imprimir los informes de los ítems validados.
3.3.2.3 Revisión de estilo
Únicamente los reactivos aceptados en la validación llegan a la tercera fase de verificación. La revisión de estilo, a cargo de personal de la Dirección General de Difusión del Ceneval, consiste en asegurar la presentación clara y homogénea de cada reactivo y de la prueba en su totalidad. Para ello se verifica el empleo correcto y uniforme del lenguaje, la puntuación, la ortografía, las abreviaturas y la presentación de tablas y otros apoyos gráficos, así como de la bibliografía y las citas textuales.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R41
La corrección de estilo le da mayor precisión y claridad de las preguntas, lo que aumen-ta la validez de la evaluación (estándar 7.2). El procedimiento de Ceneval para la verificación de estilo implica una retroalimentación constante entre los revisores técnico-pedagógicos y el personal de Difusión.
3.3.3 Revisión cuantitativaDespués del proceso de revisión de estilo, se lleva a cabo el ensamble de las versiones para el estudio piloto de los reactivos. Para ello se consideran únicamente los reactivos que fueron aceptados en el proceso de validación. Esta primera revisión cuantitativa es importante para que la prueba operativa final se conforme con reactivos que han probado su efectividad para brindar información en cuanto a las habilidades que posee la población objetivo.
Después de hacer las modificaciones señaladas por los correctores de estilo, se ensam-blan cuadernillos que presentan diferentes bloques de reactivos de cada habilidad evaluada. Todas las propuestas de ensamble de las versiones piloto son avaladas por el Consejo Técni-co de la prueba.
En la tabla 4 se presenta el esquema general de ensamble que se ha mantenido en los primeros tres años de aplicación de la prueba. El ordenamiento en la presentación de las áreas de habilidad es el mismo que caracteriza a la versión operativa, condición importante para neutralizar cualquier efecto que pudiera tener ello en la respuesta de los estudiantes.
Tabla 4. Formas para el estudio de reactivos piloto
Forma 1
96Reactivos por forma
HabilidadLectora
HabilidadLectora
HabilidadLectora
HabilidadLectora
HabilidadLectora
HabilidadLectora
HabilidadLectora
HabilidadLectora
HabilidadLectora
HabilidadMatemática
HabilidadMatemática
HabilidadMatemática
HabilidadMatemática
HabilidadMatemática
HabilidadMatemática
HabilidadMatemática
HabilidadMatemática
HabilidadMatemática
Forma 2
94
Forma 3
96
Forma 4
94
Forma 5
96
Forma 6
94
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
42
Otra de las razones por las que el diseño del piloteo se planteó de este modo fue para probar, en un inicio, qué cantidad de reactivos era adecuada para responderse en sesiones de 50 minutos, así como el número de sesiones pertinentes por día de aplicación, de modo que se controlaran variables como el cansancio o la deserción.
En general se procura que las condiciones del piloto sean las mismas que la aplicación operativa; las variaciones corresponden a la cantidad de sustentantes que responden la prueba y el número de reactivos que la conforman, ya que la aplicación de las formas piloto se realiza de manera matricial. En la tabla 5 aparecen los datos referentes al número de cuadernillos que se han ensamblado para contar con ítems suficientes de buena calidad y la cantidad de alumnos que han participado en el piloteo de reactivos. Cada año se ensamblan pruebas piloto con meses de antelación a la aplicación anual. De este modo se asegura la calidad psicomé-trica de los ítems que servirán para emitir el diagnóstico individual que pretende la prueba enlace Media Superior con su versión operativa.
Tabla 5. Cuadernillos y participantes en los estudios piloto
La impresión de los materiales, la aplicación, la lectura óptica de hojas de respuesta y la conformación de la base de datos está a cargo de la dgep-sep.
3.3.3.1 Calibración de reactivos
La calibración de los reactivos se lleva a cabo para valorar su comportamiento estadístico y obtener sus características psicométricas que permitirán seleccionar los que conforman la prueba operativa.
Para el análisis de los reactivos se revisa y depura la base de datos proporcionada por la dgep-sep eliminando los casos que presentan menos del 85% de respuestas. El análisis de los reactivos se realiza con base en la Teoría Clásica (tc) y la Teoría de la Respuesta al Ítem
Cuadernillos
2007
18
9,526
2008
16
4,709
2009 20106
38 30
8,525 9,953Sustentantes
6 Los reactivos que se pilotearon en 2010 corresponden, en su mayoría, a la estructura de la prueba que se utilizará en 2011, la cual presenta diferentes modificaciones que afectan de igual modo el ensamble de las versiones piloto.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R43
(tri) con el modelo logístico de tres parámetros. En el análisis de los reactivos, con base en la tc, se atienden dos indicadores:•• 1. Grado de dificultad. Se refiere al porcentaje de personas que responden correcta-
mente un reactivo de una prueba. Entre mayor sea esta proporción, menor será su dificultad. De acuerdo con la Metodología Ceneval, los valores que se consideran acep-tables en este parámetro son 20 ≤ GD ≤ 80%. La dificultad es una información básica al ensamblar el instrumento, ya que debe estar balanceado en cuanto a la dificultad global y en cada una de sus áreas o secciones (Vidal et al., 2000).
•• 2. Correlación punto biserial o coeficiente de discriminación. Se calcula para de-terminar el grado en que cada reactivo aporta información certera en cuanto a las habilidades que mide de manera particular, y en conjunto con los demás ítems que conforman la prueba. El índice de correlación permite relacionar la tendencia de res-puesta de cada ítem con respecto a la escala de la cual forma parte. Se supone que un sustentante con una puntuación alta en toda la prueba tiene mayores probabilidades de contestar correctamente un reactivo. También se debe esperar lo contrario, es decir, que quien tuvo bajas puntuaciones en la prueba, tenga pocas probabilidades de con-testar correctamente el reactivo. Así, un buen reactivo debe discriminar entre aquellos que obtuvieron buenas calificaciones en la prueba y aquellos que obtuvieron bajas ca-lificaciones. Generalmente, basta con que la correlación punto biserial de un reactivo sea positiva para aceptarla como medida de “discriminación” del reactivo; sin embargo, la Metodología Ceneval exige un mínimo de 0.2 para considerar que el ítem es óptimo (Vidal et al., op.cit).
Adicionalmente, se realizan análisis que se basan en la tri. La diferencia entre la tc y la tri reside en que esta última se centra en las propiedades de los reactivos individuales y no en las propiedades globales de la prueba. La herramienta de la tri que se utiliza para valorar la calidad de los reactivos es la curva característica del ítem, la cual resulta del ajuste de una función matemática al comportamiento del reactivo, y representa la probabilidad de que un sujeto, con una determinada habilidad, responda correctamente el reactivo.
Para el análisis de los reactivos de la prueba enlace Media Superior se utiliza el modelo de tres parámetros de tri. Los parámetros hacen alusión a los índices de discriminación, dificultad y pseudo-adivinación de los reactivos:•• 1. Índice de discriminación (a). Indica la cualidad que tiene el reactivo de diferenciar
a los sustentantes que dominan el conocimiento de aquellos que no. Para considerar aceptables a los reactivos deben presentar una discriminación mayor que 0.45.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
44
•• 2. Índice de dificultad (b). Indica la posición del ítem en la escala de aptitud. Cuanto más grande es el valor de dificultad, mayor es la aptitud requerida para que el examinado tenga una probabilidad alta de resolver correctamente el ítem. Lo ideal es que los reac-tivos se encuentren en un intervalo de -3 a 3.
•• 3. Índice de pseudo-adivinación (c). Permite conocer la probabilidad de que cada reactivo sea contestado correctamente al azar.7
Los datos psicométricos generales de las pruebas piloto correspondientes a 2007, 2008 y 2009 se presentan en el anexo II. El anexo III incluye los parámetros correspondientes a los ítems que integraron la versión operativa 2008 y que han servido para llevar a cabo los procedimientos de equiparación que se explican más adelante.
3.3.3.2 Corrección y validación externa
Después de la calibración es posible elegir los reactivos con parámetros óptimos que con-forman las versiones operativas. Los ítems restantes que cuentan con buenos estadísticos se mantienen en el banco de reactivos para posteriores aplicaciones o para presentarse en mate-riales de apoyo a los docentes y alumnado de educación media superior.
En 2009 y 2010, los reactivos que no cumplieron con los requerimientos mencionados en el apartado anterior fueron revisados y corregidos nuevamente por especialistas con base en los datos estadísticos. De este modo, se identificaron los tipos y estilos de distractores que no funcionan en la población objetivo, y aquellos contenidos cuyo planteamiento se requiere depurar con mayor cuidado para obtener reactivos de buena calidad. Toda esta información se usa para optimizar los materiales de capacitación a los elaboradores, así como la revisión técnica de los reactivos.
3.3.4 Mantenimiento del banco de reactivosUna de las etapas importantes en la Metodología Ceneval para la elaboración de pruebas tiene que ver con el mantenimiento del banco de reactivos. El coordinador del proyecto es el encargado de establecer la meta de reactivos elaborados que debe cubrirse, el tiempo que se tiene para ello, así como las fechas de validación y calibración de los ítems. Después de estas fases, el Coordinador está en posición de contar con un detalle de los parámetros y dictámenes de
7 Este índice también es conocido como pseudo-azar debido a que los sustentantes difícilmente responden por “azar puro”. Normal-mente intentan descartar algunas opciones de respuesta antes de adivinar.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R45
los reactivos; además, el mantenimiento del banco implica revisar constantemente la actuali-zación de los contenidos y de los parámetros de los ítems de acuerdo con el número de veces que se haya presentado en diferentes versiones ya sea piloto u operativas, y con las posibles modificaciones en el objeto de medición o las normas de revisión editorial.
En la tabla 6 se reporta la cantidad de reactivos que se han elaborado, validado y pilo-teado desde que comenzó la construcción de la prueba hasta agosto del 2010. Como puede verse, el mantenimiento del banco es de suma importancia para dar continuidad a las aplica-ciones año con año.
Tabla 6. Banco de reactivos enlace Media Superior 2008-2010
3.4 Ensamble de la prueba
En esta fase se integra la versión operativa de la prueba con los reactivos que resultaron ser los mejores tanto en las revisiones cualitativas como cuantitativas (estándares 3.7 y 3.8). La validez de las interpretaciones de la calificación final depende en gran parte de que el ensamble se realice de manera adecuada (Downing, 2006). La disposición de los reactivos debe obedecer al plan de prueba que se estableció desde el inicio; así, las versiones son con-gruentes con los contenidos y niveles taxonómicos necesarios para contar con una muestra representativa del dominio de conocimiento que se va a evaluar.
Todos estos aspectos contribuyen a la validez de contenido de la prueba. Sin embargo, para que las puntuaciones sean fiables no es suficiente con que se cumpla con el peso y can-tidad de reactivos determinados en la estructura del instrumento. También deben controlarse variables como las siguientes:
Reactivoselaborados
Reactivosvalidados
Reactivospiloteados
2007
570
1,389
2,010
2008
1,561
2,505
3,112
2009
3,590
4,332
4,379
2010
135
946
1,003
Total
5,856
9,172
10,504
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
46
• • • El orden de presentación de los reactivos, de modo que se facilite la lectura y minimice cualquier carga cognitiva derivada de este aspecto. Para el ensamble de enlace Media Superior 2008 se decidió alternar los bloques de reactivos por área y subárea de la prueba y, dentro de cada bloque, ordenar los ítems por su dificultad de manera ascendente. En las siguientes aplicaciones, en aras de asegurar la comparabilidad de la prueba, el orden de los reactivos se ha mantenido sin cambio. Los ítems de 2009 y 2010 poseen, en su mayoría, dificultades similares a las de su par en la primera prueba.
• • • La posición o localización de las respuestas correctas: esto disminuye la probabilidad de acertar por azar o por el sesgo natural a elegir las posiciones intermedias. Para la prueba enlace no existe alguna regla en el orden o frecuencia de presentación de cada clave de respuesta, los elaboradores la asignan según su criterio o en función de algunos lineamientos editoriales; por ejemplo, la longitud de las opciones, el orden ascendente de las respuestas numéricas, entre otros.
• • • Cualquier aspecto visual que pudiera confundir a los sustentantes: para ello se equilibra el tamaño y orientación de los reactivos en el papel, asegurando, por ejemplo, que las tablas o los textos no queden incompletos en una página y que las imágenes sean nítidas, entre otros detalles.
Otros aspectos que han de tomarse en cuenta para el ensamble son los aspectos de la administración de la prueba, la cual en el caso de enlace se realiza en seis sesiones de 50 minutos. Los 140 reactivos de la prueba operativa se ensamblan en un solo cuadernillo divi-dido en seis bloques: tres de Habilidad Lectora y tres de Habilidad Matemática, los cuales se intercalan para su aplicación. En la tabla 7 se muestra la distribución de la prueba operativa en función del número de reactivos y los contenidos.
Tabla 7. Distribución de la prueba operativa enlace Media Superior 2008-2010
Día 1 Día 2Reactivos Reactivos
3014
1730
3019Habilidad Lectora
(Apelativo y Argumentativo)Habilidad Matemática (Cambios y
Relaciones, y Matemáticas Básicas)
Habilidad Matemática (Espacio y Forma, y Matemáticas Básicas)
Habilidad Lectora(Expositivo)
Habilidad Matemática(Cantidad y Matemáticas Básicas)
Habilidad Lectora(Narrativo)
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R47
Cada sesión dura 50 minutos, aunque en los estudios piloto más recientes se ha estu-diado la posibilidad de que para la aplicación de 2012 se reduzcan a 45 minutos. Una de las razones para sugerir el cambio son los reportes constantes por parte de los aplicadores en cuanto a que la mayoría de los sustentantes terminan de responder cada sesión en menos tiempo; además, es posible que en aplicaciones futuras se incluya la evaluación de un campo disciplinar adicional para responder a los objetivos de la riems.
La logística de cada aplicación debe considerar los procedimientos necesarios para realizar la posterior equiparación y calificación de los instrumentos (Downing, 2006). En la prueba enlace Media Superior la escala se mantiene año con año gracias al ensamble y aplicación de una versión Pretest, que se distribuye mediante un diseño matricial a una mues-tra representativa de estudiantes que la contestan en el mismo periodo que la prueba operativa (apartado 5.2). Este esquema se denomina equiparación por población común (Moulton, 2007).
3.4.1 Revisión editorial e impresión del instrumentoTodos los cuadernillos de la prueba se someten a una revisión editorial con la finalidad de asegurar su calidad; después se envían a la Comisión Nacional de Libros de Texto Gratuito (Conaliteg), la cual es responsable de su impresión.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R49
La prueba operativa se aplica a los estudiantes que cursan el último grado de educación media superior en instituciones educativas de carácter público, federal y estatal, en los
planteles particulares con reconocimiento de validez oficial otorgado por la sep, así como en instituciones de carácter autónomo que lo soliciten y en escuelas particulares incorporadas. Todos los sustentantes contestan la prueba operativa en seis sesiones de 50 minutos distribuidas en dos días (únicamente una muestra representativa de la población responde una versión del Pretest en una sesión extra).
La aplicación de la prueba está a cargo de la dgep-sep, con el apoyo de los titulares de las Áreas Estatales de Evaluación de cada entidad federativa, responsables de elaborar la estrategia de aplicación, así como de coordinarla. Además, participan los representantes estatales de la sems y los titulares de las Oficinas de Servicios Federales de Apoyo a la Edu-cación en las entidades federativas que supervisan la logística de la aplicación. Existen a su vez coordinadores regionales y coordinadores de la aplicación para cada plantel que deben asegurar que las pruebas se apliquen de acuerdo con la normativa.
Es importante enfatizar que el control de la aplicación se considera bajo, ya que esta se realiza de manera censal en el ámbito nacional, a una población ubicada en localidades con características y sustentantes muy diferentes. Ahora bien, dada la importancia de contar con datos confiables para la calibración de reactivos y el proceso de calificación, cada año se selecciona una muestra representativa que aplica la prueba con un control más riguroso. En el apartado 4.1 se describe brevemente el diseño muestral utilizado.
En la aplicación participan también padres de familia invitados previamente por los directores de los planteles, así como observadores externos que verifican que el proceso se realice de forma adecuada. La organización y calendarización de la prueba asegura la par-ticipación de los alumnos, sin afectar las actividades normales de la escuela. Debido a que enlace Media Superior sólo se aplica a los estudiantes del último grado, no se suspenden clases ni actividades escolares para el resto de los estudiantes.
4. Aplicación
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
50
4.1 Diseño muestral
El diseño muestral permite contar con una muestra representativa de la población que res-ponde la prueba con un control de aplicación más estricto. Los aplicadores de la muestra controlada provienen de la dgep, de modo que se reduce la posibilidad de copia, mala distri-bución de cuadernillos o de tiempo durante las sesiones. Los datos de la muestra controlada sirven para realizar los análisis estadísticos necesarios para realizar la equiparación de las pruebas de un año a otro, definir los puntos de corte y llevar a cabo diversas investigaciones de interés para la sems. Además, estos sustentantes responden cuestionarios de contexto que permiten estudiar variables asociadas al logro académico.
Para 2008 y 2009 se aplicó un mismo diseño muestral con niveles de desagregación en que se trabajaron los resultados de enlace Media Superior, los cuales se muestran en la tabla 8.
Tabla 8. Niveles de desagregación de la muestra 2008-2009
Nivel de desagregación
1
2
4
3
Tipo de resultado
Nacional
Estatal
Nacional por tipo de bachillerato• General• Técnico• Tecnológico
Nacional por tipo de bachillerato• General• Técnico• Tecnológico
Nacional por tipo de sostenimiento• Público• Privado
Nacional por tipo de sostenimiento• Público• Privado
Nacional por nivel de urbanidad• Rural• Urbano
Nacional por nivel de urbanidad• Rural• Urbano
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R51
A petición de la sems, en 2010 se implementó un diseño muestral diferente. Para este nuevo diseño se determinó que no era posible alcanzar la desagregación por estados, dada la variabilidad que presentan las entidades en cuanto a la proporción de estudiantes de acuer-do con el tipo de bachillerato, tipo de sostenimiento y nivel de urbanidad. Por este motivo se establecieron los niveles de desagregación nacional en los tres diferentes rubros, como se muestra en la tabla 9.
Tabla 9. Niveles de desagregación de la muestra 2010
El procedimiento para calcular el tamaño de la muestra, así como los cambios requeridos desde la primera aplicación (2008) se describen en el anexo IV.
Nivel de desagregación
1
2
Tipo de resultado
Nacional
Por tipo de bachillerato• General• Técnico• Tecnológico
Por tipo de sostenimiento• Público• Privado
Por nivel de urbanidad• Rural• Urbano
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R53
Esta etapa es esencial para cumplir con los propósitos de la prueba, en particular con la generación de información acerca del nivel de desempeño en dos habili-
dades básicas por parte de los sustentantes. Para ello, todos los años se procesa la información recolectada durante la fase de aplicación mediante la lectura de hojas de respuesta para des-pués calificar a los sustentantes.
La lectura y calificación son responsabilidad de la dgep-sep, instancia que cada año entrega las bases de datos para que el Ceneval valide sus resultados. Adicional a esto, en 2008 el Centro fue responsable de coordinar las actividades para establecer los puntos de corte que se utilizan en el proceso de calificación, así como de definir los niveles de desempeño que se han incluido en los reportes de resultados de los sustentantes en todas las aplicaciones.
5. Calificación
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
54
5.1 Confiabilidad de la prueba
Los datos de cada aplicación han permitido evaluar la confiabilidad de la prueba y tener información sobre la consistencia interna de la prueba. Para medir la estabilidad del instru-mento se calcula el Alfa de Cronbach considerando que una prueba es confiable cuando obtiene un Alfa mayor a 0.70 (Nunally & Bernstein, 1994). La confiabilidad por año de la prueba enlace Media Superior se muestra en la tabla 10.
Tabla 10. Confiabilidad enlace Media Superior 2008-2010
5.2 Establecimiento de puntos de corte y definición de niveles de desempeño
Uno de los aspectos fundamentales al elaborar un examen referido a un criterio es determinar el nivel mínimo de habilidad que garantiza que un sustentante tiene dominio sobre los contenidos de la prueba. Para ello es necesario establecer un punto de corte que permita diferenciar entre los sujetos que alcanzan determinado nivel de habilidad y los que no lo han logrado.
En el caso de la prueba enlace Media Superior se utiliza el método Bookmark o del marcador (Mitzel, Lewis, Patz y Green, 2001). Este procedimiento toma en cuenta los resul-tados empíricos de la prueba (análisis empírico) y el juicio de los expertos (análisis de juicio), con el fin de identificar los contenidos que podría responder adecuadamente un sustentante per-teneciente a las distintas categorías o niveles de habilidades que la prueba es capaz de medir.
5.2.1 Análisis empíricoPara el análisis empírico es necesario contar con los datos de la primera aplicación del instru-mento y los siguientes insumos:
Año GlobalHabilidad
MatemáticaHabilidad
Lectora
.808
.858
.852
2008
2009
2010
.832
.890
.900
.885
.924
.928
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R55
•• a) descripción de cómo está conformada la prueba: temas, subtemas, número de reactivos en cada uno
•• b) clave de respuesta correcta de cada reactivo•• c) archivo con las respuestas de los sustentantes en formato .dbf o .txt (proporcionado
por la dgep-sep).
A partir de estos datos se estiman las características métricas de los reactivos (dificultad, discriminación, índice de adivinación) con base en la tc y del modelo logístico de tres pará-metros de tri para comprobar su calidad. Entre otras cosas, este análisis permite determinar si los reactivos están funcionando de manera adecuada y si se presenta estabilidad entre las diferentes aplicaciones (estándar 3.22).
Es importante detectar si existen ítems con problemas para no tomarlos en cuenta para la calificación ni para el establecimiento de puntos de corte (anexo V). Por ejemplo, en 2008, el análisis de los reactivos con tc permitió identificar 10 reactivos con correlación biserial negativa y/o dificultad muy alta que se eliminaron de la calificación. En 2009 se des-cartaron 11 reactivos y en 2010 sólo 3.
El resto de los ítems de cada prueba operativa obtuvo parámetros estadísticos adecuados y ofrecen información válida acerca de la habilidad de los sustentantes.
5.2.2 Análisis de juicioPara llevar a cabo las tareas relacionadas con el análisis de juicio se convocó a expertos en el área de Matemáticas y Habilidad Lectora que conformaron los Comités Académicos de Establecimiento de Puntos de Corte y Definición de Niveles de Dominio.
A los especialistas se les comisiona la descripción de los conocimientos y habilidades que los sustentantes deben mostrar para clasificarse en cada nivel de dominio. A petición de la sems, la clasificación de los niveles tomó en cuenta cuatro categorías: insuficiente, elemental, bueno y excelente. Después de tener una primera aproximación cualitativa, se procedió al establecimiento de los puntos de corte operacionales.
Los miembros de comité trabajaron con los resultados del análisis empírico de la prueba y con el perfil referencial, siguiendo los pasos del método Bookmark que se mencionan a continuación:• • • Revisar los reactivos de la prueba operativa ordenados por su dificultad empírica.• • • Identificar el reactivo marcador para cada uno los niveles de dominio. La tarea de los
jueces fue, tomando en cuenta la jerarquización por dificultad, elegir el ítem o tarea que
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
56
actúa como punto de inflexión entre dos niveles de dominio. El cambio de un nivel a otro se produce cuando se identifica un reactivo que un estudiante promedio del nivel actual no puede responder. El punto de corte se establece en función del valor del parámetro b (dificultad) y no del número de reactivos que están contenidos en los con-juntos correspondiente a cada nivel de dominio. En la prueba enlace Media Superior se manejan cuatro niveles, por lo que se identificaron tres marcadores.
• • • Determinar los rangos de habilidad en función de los puntos de corte que se estable-cieron (anexo V). La estructura de la prueba enlace Media Superior se mantuvo sin cambios durante los años 2008, 2009 y 2010, motivo por el cual los puntos de corte establecidos en 2008 han servido para los tres años.
• • • Redactar un párrafo que sintetice de manera global el tipo de habilidades que caracte-rizan a los estudiantes de cada nivel de dominio.
La descripción de cada nivel de dominio complementa la información tradicional-mente expresada en puntuaciones y permite conocer los elementos cualitativos relacionados con el desempeño de los sustentantes. En los reportes de resultados se indica que la persona evaluada posee las habilidades que se describen en el nivel en que está ubicado y las de los niveles inferiores.
A continuación se transcriben los niveles de dominio que se trabajaron con el comité académico y que se presentan en los reportes de resultados de los sustentantes.
5.2.2.1 Niveles de dominio de la Habilidad Lectora
• • • Insuficiente. Eres capaz de identificar elementos que se encuentran de manera explícita en textos narrativos y expositivos, ya sea acciones, hechos, episodios, personajes o sus características. Realizas inferencias sencillas sobre las acciones de los personajes y estableces relaciones entre dos o más elementos. Identificas si la estructura de algunas partes del texto es adecuada al contenido que presenta.
• • • Elemental. Ubicas e integras diferentes partes de un texto. Reconoces la idea central y comprendes relaciones del tipo: problema–solución, causa–efecto, comparación–con-traste. Infieres el significado de palabras, así como la relación entre párrafos e ideas. Reconoces la postura del autor. Relacionas la información del texto y la que se encuen-tra en tablas.
• • • Bueno. Relacionas elementos que se encuentran a lo largo del texto y/o en glosarios. Comprendes el texto de forma completa y detallada, y sintetizas su contenido global. Infieres relaciones del tipo: problema–solución, causa–efecto, comparación–contraste.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R57
Estableces relaciones entre la postura del autor y la información que apoya su punto de vista. Por ejemplo: un hecho, un dato, el contexto, etcétera. Reconoces la función que cumplen las tablas en los textos expositivos. Evalúas la estructura del texto en relación con su contenido.
• • • Excelente. Haces inferencias complejas para construir una interpretación global del texto. Comprendes la información contenida en tablas y esquemas y la relacionas con el contenido del texto. Estableces relaciones entre argumentos y contraargumentos. Analizas si la organización, las expresiones y los recursos que utiliza el autor son ade-cuados al tipo de texto y a su destinatario.
5.2.2.2 Niveles de dominio de la Habilidad Matemática
• • • Insuficiente. Resuelves problemas donde la tarea se presenta directamente. Identificas información en esquemas o gráficas y realizas estimaciones. Efectúas sumas y restas con números enteros y traduces del lenguaje común al lenguaje algebraico. Resuelves pro-blemas en los que se requiere identificar figuras planas y tridimensionales.
• • • Elemental. Realizas multiplicaciones y divisiones con números enteros, y sumas que los combinan con números fraccionarios. Calculas porcentajes, utilizas fracciones equiva-lentes, ordenas y comparas información numérica. Estableces relaciones entre variables y resuelves problemas que combinan datos en tablas y gráficas. Aplicas conceptos simples de probabilidad y estadística. Construyes expresiones equivalentes a una ecuación al-gebraica y resuelves ejercicios con sistemas de ecuaciones lineales. Manejas conceptos sencillos de simetría y resuelves problemas que involucran un razonamiento viso-espacial.
• • • Bueno. Resuelves problemas que involucran más de un procedimiento. Realizas mul-tiplicaciones y divisiones combinando números enteros y fraccionarios. Calculas la raíz cuadrada, razones y proporciones, y resuelves problemas con números mixtos. Analizas las relaciones entre dos o más variables de un proceso social o natural y re-suelves los sistemas de ecuaciones que las representan. Identificas funciones a partir de sus gráficas para estimar el comportamiento de un fenómeno. Construyes una figura tridimensional a partir de otras e identificas características de una figura transformada. Utilizas fórmulas para calcular superficies y volumen, y reconoces los elementos de una cónica a partir de su representación gráfica.
• • • Excelente. Empleas operaciones con fracciones para solucionar problemas y resuelves combinaciones con signos de agrupación. Conviertes cantidades en sistema decimal a sexagesimal. Identificas la relación existente entre gráficas y funciones lineales o cua-dráticas, y expresas algebraicamente una representación gráfica. Aplicas conceptos
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
58
avanzados de probabilidad. Solucionas problemas con series de imágenes tridimensio-nales y aplicas conceptos de simetría. Utilizas fórmulas para calcular el perímetro de composiciones geométricas. Determinas los valores de los elementos de la circunfe-rencia, la parábola y la elipse a partir de su ecuación y viceversa; identificas la ecuación de una recta a partir de sus elementos y la aplicas para encontrar la distancia entre dos puntos. Solucionas problemas donde se aplican funciones y leyes trigonométricas.
5.2.3 Validación de los puntos de corteLos puntos de corte permiten calificar a los sustentantes y calcular el porcentaje de población que pertenece a cada nivel de dominio. Para verificar que la clasificación refleje adecuada-mente la realidad, en 2008 se llevó a cabo un proceso de validación de los puntos de corte que consiste en corroborar que éstos se encuentren claramente diferenciados en la escala de calificación y cubran el espectro de puntuaciones de manera suficiente (Gaviria, 2008). En este proceso se consideraron, por un lado, la relación entre las puntuaciones de la escala y la puntuación verdadera y, por otro, el error típico de la estimación que se obtuvo para cada punto de la escala en función del valor que en el mismo toma la función de información.
A partir del estudio de validación, se concluyó que la separación entre los puntos de corte determinados para cada una de las áreas, es adecuada según los criterios que se maneja-ron. El detalle de la metodología utilizada y una descripción más exhaustiva de los resultados se presenta en el anexo VI.
La validación cuantitativa de los puntos de corte le da mayor fortaleza a la definición cualitativa de los mismos que se desarrolla en la descripción de los niveles de dominio, y es la que se presenta en los reportes de resultados de los sustentantes.
5.3 Equiparación de las pruebas
Si bien las estrategias de ensamble de las versiones de enlace Media Superior garantizan que las versiones sean equivalentes en los que contenidos que miden, en un momento pos-terior a la aplicación pueden existir diferencias en su dificultad. Para controlar este efecto en la calificación de la prueba se recurre a una equiparación horizontal. Los métodos de equiparación son procedimientos empíricos para establecer una relación estadística entre los puntajes de dos versiones de una misma prueba. Dicha relación puede utilizarse para expresar los puntajes de una versión en términos de los puntajes de otra versión, lo que permite que los resultados de la prueba sean comparables año con año.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R59
La equiparación requiere de un diseño de recolección de datos y de una regla para transformar los puntajes de una versión a los puntajes de otra. En relación al primer aspecto se tomó en cuenta que, por cuestiones de transparencia, la prueba enlace Media Superior hace públicos todos sus reactivos después de cada aplicación. Dicha condición impide incluir reactivos ancla en las versiones operativas, por lo que se aplica de manera matricial una prueba denominada Pretest que se utiliza para calibrar los reactivos y obtener los parámetros que se fijan en cada aplicación.
El Pretest es equivalente en contenido y dificultad a la prueba operativa. Se administra de manera matricial por lo que se ensamblan formas o cuadernillos que contienen entre 18 y 25 reactivos. La suma de todas las formas se convierte en la versión operativa del siguiente año.
El Pretest se presenta a una muestra representativa de la población que aplica la prueba operativa (Diseño muestral, apartado 4.1). Los sustentantes que conforman la muestra res-ponden ambos instrumentos (la prueba operativa y el Pretest), por lo que las puntuaciones de cada prueba son escaladas en un primer momento gracias a que se aplican a la misma población. La siguiente figura ejemplifica la forma en que se recolectan los datos para la equiparación horizontal.
Figura 1. Diseño de recolección de datos: Equiparación Horizontal
La totalidad de los sustentantes responde las seis sesiones de aplicación de la prueba operativa y, de manera adicional, la muestra se somete a una séptima sesión en la que se le aplica una forma correspondiente al Pretest. La aplicación de las formas o cuadernillos del Pretest a la muestra controlada se organiza mediante un sistema de contrabalanceo, de modo
enlace-ems operativa(Aplicación censal)
Pretest(Aplicación Matricial)
140 reactivos
Forma 1
Forma 2
Forma n
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
60
que algunos sustentantes lo responden en alguna de las sesiones del primer día de aplicación, otros del segundo y un grupo más en un tercer día.
Para lograr la equivalencia de los cuadernillos del Pretest, así como la que debe existir entre la versión Pretest-operativa, las formas se ensamblan con dos bloques intercalados de cada subárea considerando que todos deben ser similares en su índice global de dificultad en tc y cantidad de reactivos. En las tablas 11 y 12 se presenta el esquema general de ensamble del Pretest.
Tabla 11. Habilidad Lectora Dificultad (tc) por forma
Tabla 12. Habilidad Matemática Dificultad (tc) por forma
El ensamble de las diferentes versiones es muy importante para brindar confianza en los procedimientos de calificación y equiparación, ya que todas deben medir el mismo cons-tructo y conservar las condiciones de aplicación, de modo que se eliminen fuentes externas que afecten la respuesta del sustentante y esta dependa únicamente de su nivel de habilidad.
Formas
Formas
Reactivos
Reactivos
Dificultad
Dificultad
2
2
18
26
53.59
40.16
1
1
22
26
55.61
40.20
3
3
19
25
54.96
40.17
4
4
18
25
54.44
40.10
5
5
23
26
55.48
40.24
6 26 40.26
7 26 40.17
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R61
Posteriormente, para equiparar los puntajes se realiza una transformación lineal, a partir del modelo logístico de tres parámetros de tri. De este modo, las puntuaciones provenientes de distintas versiones son intercambiables y todos los sustentantes son evaluados bajo el mismo criterio (estándares 4.19 y 4.20). En la tabla 13 se muestra la similaridad estadística que se ha mantenido cada año en las versiones operativas.
Tabla 13. Parámetros globales equiparados 2008-2010
El procedimiento de equiparación se explica de manera detallada en el anexo VII.
Dificultad tc Corr. Biserial tc
2009 46.75 0.325
2008 44.74 0.221
2010 48.63 0.257
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R63
Los resultados de la prueba enlace Media Superior se encuentran disponibles al público en general en diferentes medios:
• • • En la página electrónica oficial, con ligas a los reportes por alumno, por escuela y los resultados nacionales.
• • • En carteles que se distribuyen a la comunidad educativa en cada escuela.• • • En notas de prensa.
En la página electrónica se pueden revisar, durante todo el año, las características gene-rales de la prueba, las fechas de aplicación y noticias relacionadas con la evaluación. También se pueden consultar los reactivos que conformaron la prueba enlace Media Superior, así como los resultados por alumno, por escuela y por entidad federativa.
Cualquier consulta a los datos disponibles debe hacerse considerando el propósito para el que fue diseñada la prueba: brindar un diagnóstico individual y general de fortalezas y debilidades en dos habilidades básicas: lectora y matemática. Si bien enlace Media Superior forma parte del sneems, como ya se explicó, es una prueba dirigida al alumnado y no puede utilizarse para evaluar el sistema educativo, los subsistemas, las escuelas o los docentes. Por todo esto, los resultados sólo deben ser usados para conocer el nivel de dominio de los susten-tantes y planear estrategias de estudio, secuencias didácticas, campañas particulares, entre otras, que sean consecuentes con las necesidades que puedan detectarse haciendo uso de los datos.
6. Resultados
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
64
Estas consideraciones se reiteran varias veces en la página electrónica y las autoridades de la Subsecretaría se encargan de recordarlas al público en general en las conferencias y eventos de prensa. El Ceneval también hace énfasis en los alcances y limitaciones de la prueba, en todos los Comités que se organizan durante el desarrollo y mantenimiento de la prueba, y se pide a los participantes que divulguen la información para evitar malos usos de los datos y maximizar la validez de las interpretaciones de la propia evaluación (estándar 13.19).
Los resultados de las primeras tres aplicaciones se muestran en la tabla 14.
Tabla 14. Resultados aplicación enlace 2008-20108
En la tabla se presentan únicamente los resultados nacionales; sin embargo, en la pá-gina electrónica se pueden consultar los porcentajes para cada entidad federativa, tipo de bachillerato, sostenimiento y grado de marginación. Estas y otras características se utilizan para hacer estudios y tomar decisiones en cuanto a políticas públicas.
8 Datos disponibles en http://enlace.sep.gob.mx/ms/
884,663808,346 835,741
11,007
6.7
45.5
35.4
12.4
3.4
12.2
37.8
46.6
11,716
7.2
42.6
33.1
17
4.8
13.9
35.1
46.1
12,246
9.6
47.7
31.2
11.5
5.3
15.1
39.1
40.6
2008
N sustentantes
Habilidad Lectora
Habilidad Matemática
Proporción de sustentantes por nivel de dominio
N escuelas
% Excelente
% Excelente
% Bueno
% Bueno
% Elemental
% Elemental
% Insuficiente
% Insuficiente
2009 2010
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R65
6.1 Reporte de resultados
A continuación se muestra el reporte de resultados que se entregó a cada sustentante en las aplicaciones de 2008 y 2009. Desde 2010, está disponible únicamente en línea. En él se en-cuentran los datos de identificación del alumno, el objetivo de la prueba, la descripción de los niveles de desempeño y la ubicación del alumno en cada una de las habilidades evaluadas.
Aunado a estos datos, se muestra el porcentaje de alumnos por cada nivel de dominio por plantel, entidad y a escala nacional.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R67
Los datos y porcentajes que se presentan en los reportes individuales incluyen los resultados de la población que asiste a escuelas del mismo tipo de sostenimiento (público o privado), que corresponda a la modalidad de bachillerato (general, tecnológico, técnico) y grado de marginación (muy alto, alto, medio, bajo, muy bajo). La intención de presentar los porcentajes que se obtuvieron en planteles con las mismas características es evitar que se hagan comparaciones que resultarían inválidas dadas las diferencias de los bachilleratos en cuanto a recursos, propósito, etcétera; por lo mismo, se incluye un breve párrafo que explica el propósito de la prueba en cada uno de los reportes (estándares 11.6, 11.12 y 11.15).
Los cuatro niveles de dominio se describen de manera general con la intención de que el sustentante, el docente y el padre o madre de familia conozcan las fortalezas y debilidades que indica cada uno, considerando que determinado nivel implica las habilidades del o los anteriores.
Además, se pueden consultar todos los reactivos con las respuestas que el estudiante eligió y compararlas con la opción correcta; cada pregunta incluye un enunciado que describe lo que es capaz de hacer el sustentante que responde adecuadamente al reactivo.
En caso de que se requiera consultar el resultado de una escuela en particular, la liga correspondiente pedirá que se ingrese la Clave del Centro de Trabajo (cct) y que se indique el turno para el que se quiere consultar los datos. La información que se despliega incluye la ubicación, los datos generales de la escuela (tipo de sostenimiento, modalidad, grado de mar-ginación) y el número de sustentantes evaluados del último grado escolar en relación con los programados para aplicar el examen.
La posibilidad de revisar los resultados por escuela representa una ganancia para los docentes, especialmente porque cada pregunta se acompaña del porcentaje de estudiantes que la contestó incorrectamente, y se menciona la fortaleza o debilidad que los datos evi-dencian. De este modo, cada docente puede conocer aquellos contenidos y procesos que provocan más errores en su alumnado y así, mejorar su práctica educativa.
6.2 Usos y difusión de resultados
De forma independiente a la utilidad que cada sustentante o docente le pueda dar a los datos obtenidos con base en la información del reporte individual, la sems, la sep y el Ceneval organizan un seminario acerca de los usos y difusión de los resultados de la prueba.
Autoridades de cada instancia y representantes de organizaciones de la sociedad civil presentan diferentes ponencias en el seminario con el objetivo de que la comunidad en general conozca los propósitos de la prueba enlace Media Superior, sus características técnicas y la
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
68
forma en cómo puede aprovecharse no sólo en el ámbito académico, sino en planificación de políticas públicas o campañas sociales para promover actividades que favorezcan la lectura y la comprensión de las matemáticas como herramientas de la vida cotidiana.
Otra estrategia para contribuir a que los resultados de la prueba sean de utilidad es la publicación de un Manual para Docentes y Directivos que se encuentra disponible en la página electrónica de la prueba. Se hace hincapié en los propósitos, los alcances y limitaciones de enlace Media Superior, además de que se presentan sugerencias en cuanto a las actividades en plantel o en el aula que pueden organizar los docentes para mejorar las habilidades de los sustentantes.
En el manual se enfatiza el evitar las comparaciones entre alumnos, entre escuelas, y sobre todo el evitar los ejercicios de preparación exclusivamente para la prueba. Se incluye una explicación amplia de la forma en que se concibió el instrumento, entre otras cosas, como la medición de una muestra representativa de los contenidos a través de los cuales se pueden evaluar las habili-dades básicas, pero que de ninguna manera incluyen todos los temas y ejercicios que forman parte de los planes y programas. Esta idea se refuerza con la descripción de la Habilidad Lectora y la Habilidad Matemática, como ejemplos de habilidades transversales que pueden y deben ser promovidas en todas las disciplinas y asignaturas del bachillerato, ya sea con tra-bajos de investigación bibliográfica, prácticas de campo, portafolios y ensayos, entre otros.
Por algunas de las razones expuestas anteriormente, así como por el objetivo meramen-te diagnóstico de la prueba, enlace Media Superior no distribuye guías para el sustentante, únicamente se elabora anualmente el Manual para docentes y directivos.
6.3 Cuestionarios de contexto
El Ceneval aplica un cuestionario de contexto a la muestra controlada de sustentantes, maestros y directores, con el fin de recabar datos relacionados con variables de contraste específicas: subsistema educativo, nivel socioeconómico, motivación, compromiso académico, actividades extraescolares, situación laboral, recursos cognitivos y no cognitivos, trayectoria académica, características de las escuelas de procedencia y contexto familiar.
Las variables de contexto son elegidas por un Consejo Técnico conformado por espe-cialistas y autoridades de la sep. En el cuadro 2 se muestra la estructura del cuestionario de contexto de alumnos utilizada en 2010. En años anteriores se presentaron algunas variaciones en cuanto a los rubros y la cantidad de preguntas asociadas a cada uno, hasta que en 2010
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R69
se estableció una estructura que contiene un mayor abanico de variables de contexto que permiten describir a la población sustentante del examen operativo y explicar su desempeño.
Los cuestionarios de los sustentantes se aplican en una sesión de 50 minutos, mientras que los dedicados a docentes y directivos pueden ser contestados en línea. Las preguntas dirigi-das a los directores recaban información acerca de las características de la escuela, mientras que el cuestionario dirigido a los docentes se centra en variables asociadas a la función educativa.
Cuadro 2. Estructura del cuestionario de contexto para alumnos 2010
Dominio VariableÁrea
Personal
Escolar
Social
Preguntas
Total 160
Sexo 1
Datos generales
Recursos no cognitivos
Tiempo libre
Situación laboralComportamientos de riesgo
Recursos cognitivos
Trayectoria académica
Características de las escuelas de procedencia
Calidad de la escuela
Familiar
Edad 1Estado civil 1Discapacidades 5Lengua indígena 1Motivación 3Compromiso académico 10Ejercicios físicos 4Actividades extracurriculares 3Otros 5Trabajo actual 7Consumo de sustancias adictivas 10Habilidad percibida para el uso del idioma Inglés
5
4Habilidad percibida para el uso de la computadora
Preescolar 1
Secundaria 7
Secundaria 2
Tiempo utilizado en traslado 1Exigencia de la escuela 1
Estructura familiar 1Capital cultural 10Capital económico 19
Tutorías 3Calidad de los maestros 20Clima escolar 8
Nivel medio superior 17
Nivel medio superior 4
Primaria 5
Primaria 1
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
70
Los hallazgos hasta ahora han resultado interesantes. Entre otros, los datos muestran de manera consistente que las variables que mejor predicen el desempeño de los sustentantes son, en orden de importancia, las asociadas al capital cultural y económico en el dominio familiar, las relacionadas con la motivación en cuanto a recursos no cognitivos y, por último, la habilidad percibida para el uso del idioma inglés y de la computadora.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R71
La prueba enlace Media Superior fue creada con la intención de proporcionar un diagnóstico general de fortalezas y debilidades en dos habilidades básicas para la
vida, de tal forma que los datos sean útiles para mejorar la calidad de este tramo educativo trascendente en la vida profesional y académica de los individuos.
Para contribuir con un propósito tan importante y fundamental, es prioritario que se sigan lineamientos de calidad estrictos en el desarrollo de la prueba. Por ello, además de usar como base la Metodología Ceneval, se organiza cada etapa procurando el cumplimiento de los estándares internacionales de evaluación educativa que instituciones como la apa y la aera publican periódicamente.
Desde su origen, la prueba enlace Media Superior se planificó con la participación de reconocidos especialistas nacionales e internacionales; además, cada una de las decisiones importantes en su desarrollo ha sido consultada con autoridades en el tema y se ha recibido retroalimentación constante por parte de diferentes asesores.
7. Reflexiones acerca de la prueba
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
72
En cada una de las etapas de construcción de la prueba, la participación de personas con actividades y grados de profesionalización muy diferentes ha resultado enriquecedora. En los comités académicos se establecen diálogos y discusiones para llegar a acuerdos en cuanto a los contenidos que se deben evaluar para tener información válida y representativa; de la misma manera, llegar a un consenso en la redacción de especificaciones y delimitaciones implica que se intercambien muchos puntos de vista y experiencias en el plano docente, para equilibrar la dificultad de la prueba y adecuarla al nivel del alumnado de media superior. La misma experiencia de retroalimentación caracteriza a las reuniones de validación y posterior corrección de reactivos, donde los especialistas tienen que encontrar una única respuesta co-rrecta y tres distractores que, si bien son plausibles, deben ser totalmente incorrectos.
En el Ceneval, una constante es el trabajo en conjunto, tanto para los encargados de la coordinación como de quienes se ocupan de los bancos de reactivos y los análisis psicométri-cos, pues cada una de las actividades debe contribuir a los propósitos de la prueba y a la calidad de la misma. Todo el trabajo se ve materializado con la integración de diversas versiones cada año, no sólo para calificar a los sustentantes sino para verificar constantemente la calidad de los reactivos. En la prueba enlace Media Superior las formas piloto se ensam-blan y aplican con anterioridad a la versión operativa y la versión Pretest, de modo que en la aplicación definitiva se incluyen siempre los mejores ítems.
El cronograma de actividades se adapta a las necesidades de la prueba y las indicaciones de la sep-sems, de manera que en todo momento se cumpla con los lineamientos de calidad en cada fase del desarrollo de la evaluación.
Todo ello no ha evitado que la prueba sufra críticas, sobre todo por el mal uso que en muchos sectores se hace de los resultados. Como se ha mencionado, la prueba enlace no está diseñada para hacer comparaciones entre subsistemas, entre escuelas o entre docentes, y las interpretaciones que se hacen al respecto son erróneas. El diseño de la prueba corresponde con el de una evaluación diagnóstica individual, y su función principal es representar una retroalimentación para cada estudiante, de modo que conozca el nivel de dominio que posee en cada habilidad y ponga en práctica estrategias para mejorarlo.
Es común encontrar que algunos centros escolares se promocionan a sí mismos ha-ciendo uso de los buenos resultados de su alumnado en la prueba enlace. Eso carece de fundamento, el hecho de que sea posible consultar los resultados de cada cct no implica que deban compararse, pues cada centro tiene sus condiciones particulares en cuanto a número de alumnos, tipo de sostenimiento, modalidad, etcétera, además de que los resultados, po-sitivos o negativos, pueden deberse a multitud de variables que no están relacionadas con la calidad de la escuela en sí.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R73
La posibilidad de consultar los resultados año con año en la página electrónica de enlace Media Superior responde a la necesidad de tener un diagnóstico general constante que muestre las áreas de fortaleza y debilidad. Las comparaciones que pueden ser de utilidad son las que pueda hacer cada director de plantel en cuanto a los resultados año con año de su propia escuela, aunque esto de ninguna manera debe llevar a un veredicto en cuanto a las capacidades de sus docentes (ya se ha dicho que la prueba está dirigida al alumnado). Más bien puede dar indicios de las áreas acerca de las que pueden planificarse campañas internas, acti-vidades extracurriculares, entre otras.
Además de la fuente de información que representan los resultados de enlace, un propósito que se ha visto cumplido en estos tres años de aplicación ha sido la creciente con-cientización en la población acerca de la importancia de las habilidades evaluadas.
Los interesados en el nivel medio superior pueden utilizar los resultados de la prueba de diferentes formas:• • • Para mejorar la práctica educativa después de analizar los errores y aciertos más co-
munes del alumnado, así como las concepciones que poseen acerca de los contenidos evaluados en la prueba. Esto debe hacerse considerando que la prueba enlace Media Superior únicamente evalúa una muestra representativa de lo que constituye y debe promoverse como parte de la Habilidad Lectora y la Habilidad Matemática.
• • • Para planificar intervenciones en el aula, en el plantel, en un estado o en todo el país que fortalezcan el desarrollo de habilidades básicas.
• • • Para tener datos que ayuden a detectar tendencias en el plantel y contar con una línea-base que permita la comparación con los resultados de aplicaciones posteriores y esta-blecer el efecto que han tenido determinadas acciones educativas.
• • • Para caracterizar a la población de un plantel o entidad federativa en términos de su distribución por niveles de logro, siempre y cuando la proporción de alumnos evaluados sea significativa.
• • • Para promover investigaciones que detecten factores (económicos, sociales, de infra-estructura, de enseñanza aprendizaje, entre otros) asociados al nivel de logro de las distintas muestras de población, sobre las cuales puedan actuarse.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
74
7.1 Comparación con evaluaciones similares
En nuestro país existen otras pruebas que también se aplican a los estudiantes del nivel medio superior. Algunas poseen características en común con enlace Media Superior pero tienen objetivos distintos. En la tabla 15 se presentan las características de dichos instrumentos.
A partir de la tabla pueden reconocerse las diferencias que tiene enlace Media Superior con las demás pruebas; las más importantes se encuentran en su propósito y su método de aplicación. Mientras que enlace es una prueba de bajo impacto (su objetivo es meramente diagnóstico), existen otras evaluaciones que sí tienen consecuencias en la población objetivo, como la correspondiente al Acuerdo 286 Bachillerato (cuyo propósito es de acreditación) y el exani-i (que es una prueba de selección).
La evaluación internacional de pisa, el egrems y el exani-ii al que se refiere la tabla, comparten con enlace Media Superior su carácter diagnóstico; sin embargo, la primera prueba se administra únicamente a una muestra representativa de la población, mientras que las otras dos se aplican de acuerdo con las solicitudes de las instituciones. En contraste con ello, la aplicación de enlace Media Superior se caracteriza por ser censal ya que se aplica casi al 100% de la población objetivo nacional, una vez al año.
Los rasgos que comparten las seis pruebas reseñadas en la tabla tienen que ver con sus características psicométricas. Todas son evaluaciones objetivas ya que su calificación no depende de un criterio variable, además de que los controles en sus condiciones de aplicación y calificación las clasifican como pruebas estandarizadas. En todos los casos se evalúa a partir de reactivos de opción múltiple, aunque la prueba derivada del Acuerdo 286 también incluye la elaboración de un texto por parte del sustentante, y la de pisa complementa la información obtenida con los ítems cerrados con preguntas de respuesta construida.
Como se mencionó, el proceso de construcción de la prueba enlace Media Superior retomó varios aspectos de la evaluación de pisa, pero ambas evaluaciones son muy distintas en su estructura, su método de aplicación y, sobre todo, en el uso de los resultados. El Pro-grama pisa pretende comparar sistemas educativos nacionales por lo que sólo aplica una muestra de los reactivos a cada estudiante, que a su vez es seleccionado de manera aleatoria de una muestra. Los resultados se combinan en escalas globales que permiten comparar el desempeño de los países participantes. El esquema de aplicación de enlace Media Supe-rior es distinto puesto que fue diseñado únicamente para emitir un diagnóstico individual de fortalezas y debilidades, que de ninguna manera debe ser utilizado para comparar escuelas o subsistemas.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R75
Tabl
a 15
. Car
acte
rístic
as d
e lo
s in
stru
men
tos
de e
valu
ació
n pa
ra la
edu
caci
ón m
edia
sup
erio
r en
Méx
ico
(1 d
e 2)
9
enla
ceM
edia
Sup
erio
r
Eval
uar
pers
onas
.D
iagn
óstic
o in
divi
dual
de fo
rtal
ezas
y
debi
lidad
es.
Prop
ósit
o ge
nera
l y
espe
cífic
o
Eval
uar
pers
onas
. A
cred
itaci
ón d
eco
noci
mie
ntos
eq
uiva
lent
es a
l niv
el
educ
ativo
.
Eval
uar
pers
onas
. Se
lecc
ión
de e
stud
iant
es
para
el i
ngre
so a
l niv
el
med
io s
uper
ior.
Eval
uar
pers
onas
.D
iagn
óstic
o de
niv
el d
e co
noci
mie
ntos
en
áre
as e
spec
ífica
s.
Eval
uar
pers
onas
. D
iagn
óstic
o de
niv
el
dom
inio
en
cont
enid
os
gene
rale
s de
l niv
el
med
io s
uper
ior.
Eval
uar
sist
emas
ed
ucati
vos.
Dia
gnós
tico
naci
onal
.
286
Bach
iller
ato
exan
i-iex
ani-i
ieg
rem
spi
sa M
éxic
o (*
*)
Hab
ilida
des
bási
cas.
Com
pete
ncia
s di
scip
linar
es.
Cono
cim
ient
os
espe
cífic
os.
Cono
cim
ient
os
disc
iplin
ares
.Co
mpe
tenc
ias
bási
cas.
Com
pete
ncia
s di
scip
linar
es/g
enér
icas
Dom
inio
ex
plor
ado
Rest
ring
ido.
Rest
ring
ido.
Rest
ring
ido.
Rest
ring
ido.
Rest
ring
ido.
Am
plio
.Co
bert
ura
de d
omin
io
Baja
.M
edia
/Alta
.A
lta.
Med
ia/A
lta.
Med
ia/B
aja.
Med
ia/B
aja.
Sens
ibili
dad
a la
inst
rucc
ión
Cens
o.Ba
jo d
eman
da.
Bajo
dem
anda
.Ba
jo d
eman
da.
Bajo
dem
anda
.M
uest
ra.
Cobe
rtur
a de
la p
obla
ción
Alu
mna
do d
el ú
ltim
o ci
clo
de b
achi
llera
to.
Pers
onas
con
21
años
cum
plid
os.
Egre
sado
s de
educ
ació
n se
cund
aria
, as
pira
ntes
a in
gres
aral
bac
hille
rato
.
Egre
sado
s de
edu
caci
ón
med
ia s
uper
ior.
Asp
irant
es a
un
área
es
pecí
fica
de
educ
ació
n su
peri
or.
Estu
dian
tes
de 1
5 añ
os
tres
mes
es a
16
años
do
s m
eses
.
Pobl
ació
n ob
jeti
vo
140
reac
tivos
de
opci
ón m
últip
le: 5
0 de
H
abili
dad
Lect
ora
y 90
de
Hab
ilida
dM
atem
ática
.
180
reac
tivos
de
opci
ón
múl
tiple
: 28
de
Com
unic
ació
n, 6
1 de
M
atem
ática
s, 4
6 de
Ci
enci
as E
xper
imen
tale
s,
45 d
e Ci
enci
as S
ocia
les
(1ª
fase
), 20
reac
tivos
de
Com
pren
sión
Lec
tora
y
elab
orac
ión
de 1
text
o ar
gum
enta
tivo
(2ª
fase
).
80 re
activ
os d
e op
ción
múl
tiple
: 20
de R
azon
amie
nto
lógi
co-m
atem
ático
, 20
de M
atem
ática
s, 2
0 de
Ra
zona
mie
nto
Verb
al,
20 d
e Es
paño
l.
Nue
ve in
stru
men
tos
de d
ifere
ntes
áre
as d
e es
tudi
o co
n 10
0 re
activ
os
de o
pció
n m
últip
le.
180
reac
tivos
de
opci
ón
múl
tiple
y re
spue
sta
cons
trui
da, d
istr
ibui
dos
de m
aner
a. L
os ít
ems
pued
en s
er d
e Co
mpe
tenc
ia L
ecto
ra,
Mat
emáti
ca y
Cie
ntífic
a.
300
reac
tivos
de
opci
ón
múl
tiple
, 25
de c
ada
área
(B
iolo
gía,
Esp
añol
, Étic
a,
Físi
ca, F
iloso
fía, H
isto
ria,
In
form
ática
, Ing
lés,
M
atem
ática
s, M
etod
olog
ía
de la
inve
stiga
ción
, Q
uím
ica)
.
Pobl
ació
n ob
jeti
vo
9 In
form
ació
n di
spon
ible
en
http:
//w
ww
.cen
eval
.edu
.mx
y en
htt
p://
ww
w.in
ee.e
du.m
x (*
*)
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
76
Tabl
a 15
. Car
acte
rístic
as d
e lo
s in
stru
men
tos
de e
valu
ació
n pa
ra la
edu
caci
ón m
edia
sup
erio
r en
Méx
ico
(2 d
e 2)
10
enla
ceM
edia
Sup
erio
r28
6 Ba
chill
erat
oex
ani-i
exan
i-ii
egre
ms
pisa
Méx
ico
(**)
10 I
nfor
mac
ión
disp
onib
le e
n htt
p://
ww
w.c
enev
al.e
du.m
x y
en h
ttp:
//w
ww
.inee
.edu
.mx
(**)
Crite
rial
.Cr
iteri
al.
Crite
rial
.Cr
iteri
al.
Crite
rial
.N
orm
ativo
.Re
fere
nte
de c
alifi
caci
ón
Bajo
.A
lto.
Alto
.Ba
jo.
Bajo
.A
lto.
Cont
rol
de la
apl
icac
ión
Anu
al.
Tres
per
iodo
s po
r añ
o.Ca
da p
roce
so d
ead
mis
ión
a la
s in
stitu
cion
es
de b
achi
llera
to.
Bajo
dem
anda
,de
acu
erdo
con
las
solic
itude
s de
las
insti
tuci
ones
.
Bajo
dem
anda
, de
acue
rdo
con
las
solic
itude
s de
las
insti
tuci
ones
.Ca
da tr
es a
ños.
Peri
odic
idad
Impa
cto
Cuat
ro n
ivel
es
de d
omin
io:
Insu
ficie
nte,
Bue
no,
Elem
enta
l, Ex
cele
nte.
icne
(Índ
ice
Cene
val):
esca
la d
e 70
0 y
1300
pu
ntos
, con
un
límite
de
100
0 pa
ra c
onsi
dera
rse
apro
bato
rio.
Cua
tro
cate
gorí
as:
Sobr
esal
ient
e,Su
peri
or, S
ufici
ente
oN
o su
ficie
nte.
icne
(Índ
ice
Cene
val).
A
prob
ator
io o
no
apro
bato
rio.
icne
(Índ
ice
Cene
val).
Cu
atro
cat
egor
ías:
So
bres
alie
nte,
Sa
tisfa
ctor
io, E
lem
enta
l o
Sin
dict
amen
.
Esca
la c
ontin
ua c
on
med
ia e
n 50
0 pu
ntos
y
una
desv
iaci
ón tí
pica
de
100
pun
tos.
Sei
s ni
vele
s de
hab
ilida
d.
Tres
niv
eles
de
logr
o:
Elem
enta
l, Sa
tisfa
ctor
io,
Sobr
esal
ient
e.Re
sult
ados
Bajo
.A
lto.
Alto
.Ba
jo.
Bajo
.Ba
jo.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R77
La existencia de estas y otras pruebas cuyo desarrollo y aplicación se ha multiplicado recientemente ha generado conciencia en las personas acerca de la importancia de contar con indicadores y datos del desempeño de los estudiantes que permitan mejorar el trabajo que se hace en las instituciones educativas. En respuesta a la concepción de que dicho fenómeno provoca que la población esté sobreevaluada, Vidal (2009) destaca el hecho de que cada ins-trumento tiene objetivos distintos y por tanto ofrece información en diferentes esferas que puede y debe ser revisada para contribuir a la mejora de la calidad de la educación de una manera integral.
7.2 enlace Media Superior y la riems
La experiencia de evaluación de la prueba enlace ha significado aportaciones importantes que pudieran multiplicarse si se le utiliza adecuadamente. El equipo de Ceneval que trabaja en su desarrollo y mantenimiento también ha adquirido diversas enseñanzas en cuanto al cuidado y trabajo que implica una prueba de esta magnitud.
En 2011 inició una nueva etapa para la prueba, ya que fue su primera aplicación con una estructura modificada en congruencia con la riems. El cambio más importante es la inclusión paulatina de la evaluación de indicios de competencias disciplinares básicas. Para 2011, además de 81 especificaciones iguales a las utilizadas de 2008-2010, se evalúan otras 29 completamente nuevas que se abocan a elementos particulares del mcc en los campos disciplinares de Comunicación (Comprensión Lectora) y Matemáticas. En futuras aplicacio-nes se prevé seguir el modelo de enlace Básica, el cual determina una rotación anual en los campos de Ciencias; esto significa aplicar una evaluación de competencias disciplinares para los campos de 1) Ciencias Sociales y Humanidades, y 2) Ciencias Experimentales, los cuales se alternarían año con año a partir de 2013, previa aprobación del Consejo Técnico.
Con la conciencia de que todo proceso es perfectible, el Ceneval trabaja actualmente para optimizar cada una de las fases de construcción del instrumento esperando que, como hasta ahora, los resultados de la evaluación impacten en la calidad de la educación.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R79
• • • Angoff, W.H. (1984). Scales, norms and equivalent scores. Princenton, NJ: Educational Testing Service.
• • • apa, aera y ncme (1999). The Standards for Educational and Psychological Testing. Washington, DC: aera Publications.
• • • Ceneval (2008). Metodología Ceneval. México: Centro Nacional de Evaluación para la Educación Media Superior, A.C.
• • • dgep (2010). Normas operativas. enlace 2010, Educación Media Superior. Unidad de Planeación y Evaluación de Políticas Educativas, sep. Disponible en http://enlace.sep.gob.mx/ms/docs/EMS2010_Normas_Operativas.pdf
• • • Dorans, N.J. (1990). Equating methods and sampling designs. Applied Measurement in Education, 3, 3-17.
• • • Downing, S. y Haladayna, T. (eds.) (2006). Handbook of test development. NJ: Lawrence Erlbaum Associates.
• • • Freudenthal, H. (1983). Didactical Phenomenology of Mathematical Structures. Mathematics Education Library. Chicago: D. Reidel Publishing Company.
• • • Gaviria, J. (2008). Informe de validación de puntos de corte en las pruebas de Matemáticas y Comprensión Lectora de enlace Media Superior. Universidad Complutense de Madrid, Documento Impreso.
• • • Gravemeijer, K y Terwel, J. (2000). Hans Freudenthal, un matemático en Didáctica y teoría curricular. Journal of Curriculum Studies, 32, 6, pp.777-796.
• • • Mitzel, H.C., Lewis, D.M., Patz, R.J., and Green, D.R. (2001). The bookmark procedure: Psychological perspectives. En G.J. Cizek (ed.), Setting performance standards: Concepts, methods and perspectives. Mahwah, NJ: Lawrence Erlbaum.
• • • Moulton, N. (2007). One Ruler, Many Tests: A Primer on Test Equating. eds Publications, disponible en http://www.eddata.com/resources/publications/
• • • Niss, M. (1999). Aspects of the nature and state of research in mathematics education. Educational Studies in Mathematics, 40, 1-24.
• • • Nunnally J.C., y Bernstein, T.H. (1994). Psychometric theory. New York: McGraw-Hill.• • • oecd (2006). Assessing Scientific, Reading and Mathematical Literacy: A Framework for pisa
2006. Paris: ocde.• • • Pajares, R., Sanz, A., y Rico, L. (2004). Aproximación a un modelo de evaluación: el proyecto
Pisa 2000. Madrid: Ministerio de Educación, Cultura y Deporte.• • • Steen, L. (1990). On the Shoulders of Giants: New Approaches to Numeracy. National Re-
search Council, Washington, D.C.: National Academy Press.• • • simce (2005). Diseño de instrumentos con metodología de enseñanza de habilidades. Chile: Copiapó.• • • Treffers, A. (1987). Three Dimensions. A Model of Goal and Theory Description in Mathematics
Instruction: The Wiskobas Project. Dordrecht: Kluwer Academic Publishers.• • • Vidal, R. (2009). ¿Enlace, Exani, Excale o pisa? México: Ceneval. Disponible en http://
archivos.ceneval.edu.mx/archivos_portal/3065/Enlace_Exani_Excali_Pisa.pdf• • • Vidal, R. et al. (2000). Manual Técnico del Centro Nacional de Evaluación para la Educación
Superior. México: Ceneval.
Referencias
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
82
Lic. Miguel Ángel Martínez Espinosa
Lic. Ana María Aceves Estrada
Lic. Elena Verdugo Quiñones
M. en C. Daffny Rosado Moreno
Ing. Roberto Peña Resendiz
Ing. Carlos Goñi Carmona
Dr. Eugenio González
Dr. José Luís Gaviria
M. en A. Ed. Maricruz Moreno Zagal
Dra. Rosamaría Valle-Gómez Tagle
Dra. Carmen Villatoro Alvaradejo
Dra. Teresa Bracho González
Dra. Lucía Monroy Cazorla
Subsecretario de Educación Media Superior. sep.
Directora General de Evaluación, dgep. sep.
Coordinadora de Asesores. sems.
Coordinador Sectorial de Desarrollo Académico. sems.
Director de Evaluación de Políticas y Sistemas Educativos. sep.
Director de Evaluación y Análisis del Proceso Educativo. sep.
Asesor externo de Ceneval. iea-ets.
Asesor externo de sep. Universidad Complutense.
Directora General Académica. anuies.
Directora General de la dgee. unam.
Coordinadora del Bachillerato a Distancia. unam.
Profesora investigadora. flacso.
Directora General Adjunta Técnica y de Investigación. Ceneval.
Lic. Miguel Ángel Martínez Espinosa
Lic. Ana María Aceves Estrada
Lic. Elena Verdugo Quiñones
M en C. Daffny Rosado Moreno
Ing. Roberto Peña Resendiz
Dra. Margarita María Zorrilla Fierro
Dra. Annette Santos del Real
Mtro. Rafael Santiago Vidal Uribe
Dra. Rocío Llarena de Thierry
Subsecretario de Educación Media Superior. sep.
Directora General de Evaluación, dgep. sep.
Coordinadora de Asesores. sems.
Coordinador Sectorial de Desarrollo Académico. sems.
Director de Evaluación de Políticas y Sistemas Educativos. sep.
Directora General. inee.
Directora General Adjunta. inee.
Director General. Ceneval.
Directora General Adjunta de Programas Especiales. Ceneval.
Consejo Directivo
Consejo Técnico
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R83
Mtra. Ma. Lourdes Oliver Conde
Lic. Mariana Godínez Morales
Mtro. Felipe Mejía Rodríguez
Lic. Martha P. Martín Ramírez
Lic. Diego Valenzuela Vázquez
Mtro. Cesar Darío Fonseca
Dra. Celia Díaz Agüero
Dra. Sylvia Margarita Rojas Ramírez
Dra. Margarita Peón Zapata
Mtro. Marco Antonio López
Mtro. Miguel Ángel León Hernández
Biol. Rodrigo Nava Mora
Lic. María Isabel Segura Gortarés
Lic. Gilberto Castillo Peña
Mtro. Leonardo Martínez Galván
Mtro. Igor Rodríguez Ugaldez
Dr. Fernando Brambila
Dr. Luis Fernando Magaña Solis
Mtro. Salvador Zamora Muñoz
dgeti
cosnet
dgep
dgeta
dgeta
dgeti
Asesora independiente
unam
inee
dgeta
inee
dgcytm
cecyt
dgb
dgep
conalep
unam
unam
unam
Comités Académicos para el Diseño
Comité Académico para la Validación de contenidos y especificaciones
Habilidad Lectora
Habilidad Lectora
Habilidad Matemática
Habilidad Matemática
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
84
Dra. Celia Díaz Agüero
Dra. Sylvia Margarita Rojas Ramírez
Dra. Nancy Mazón Parra
Dr. Luis Fernando Magaña Solis
Mtro. Salvador Zamora Muñoz
Asesora independiente
unam
unam
unam
unam
Comité Académico para el establecimiento de puntos de corte y definición de niveles de dominio
Habilidad Lectora
Habilidad Matemática
Dr. Eugenio González
Mtro. Edgar Andrade
Lic. Gustavo Rodríguez
Dr. José Luis Gaviria
iea-ets
inee
inee
Universidad Complutense, Madrid
Asesores externos
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R85
Alberto Saavedra MirandaAlejandro Rojas González Araceli Hernández PérezArmando Axayácatl Viloria CoronaBeatriz Ramírez PeñaBenedicto Priego Hernández Camerina Medina Sáenz Carmen Luz MartínezClaudia Patricia Padilla RomeroEdith Serrano MaldonadoEnrique Arronte RosalesGenoveva Brambila SánchezGladys Isabel Yerbes OrdóñezGloria Castellanos HernándezGloria Elena Schmelling VillaseñorGloria Hortensia Mondragón GuzmánGloria Luz Hernández PadillaGriselda Cid AgamaGuillermo Aguilar FernándezHildelisa ArceIrma Anselma Alvarado SánchezJorge Toledo SalasJosé Antonio Rivera SorianoJosé de Jesús Velázquez Rendón José Pedro Hernández AcostaJuan Manuel Rodríguez San JuanJulián Domingo España Solís Laura Elena Gómez CruzLeticia Vega Montoya Ma. de Jesús Barboza MoránMa. del Carmen González RubíMa. del Carmen Hernández González Ma. del Carmen Larumbe Radilla Ma. del Corazón de Jesús Huerta Franco Ma. Catalina Ramírez BonillaMa. Elena Chávez MoralesMa. Guadalupe Sandoval CornejoMa. Ofelia Villeda HidalgoMa. Teresa Herrera DelgadoMarcela Vega GarcíaMarco Antonio Flores VargasMario Castillo Sánchez HidalgoMartha Galindo BecerraMiguel Ángel García Cueto
Preparatoria 6, unamcetis 35cecyt, ipnColegio Montessorifca, unamCentro de Estudios de Bachillerato “Lic. Jesús Reyes Heroles”cbtis 114IndependientePreparatoria 5, unamCCH Azcapotzalco, unamInstituto Carlos PellicerColegio de BachilleresCentro de Estudios Tecnológicos del Mar 02, CampecheColegio de BachilleresUniversidad Autónoma de MorelosCCH Naucalpan, unamUniversidad Justo SierraamoreColegio Méxicocbtis 201amoreulsaColegio de BachilleresPreparatoria LuzacColegio de MontaignacPreparatoria Villa de Cortéscbtis 107conalepUniversidad etacIndependienteColegio de BachilleresDirección General de Ciencia y Tecnologías del Mar, Ensenadacetis 116Centro de Enseñanza Técnica Industrialcch Vallejo, unamColegio de BachilleresconalepColegio de Bachillerescbetis 40cetis 03Colegio de BachilleresUniversidad Simón Bolívarcch Sur, unamIndependiente
Comité Académico de elaboración de reactivos
Habilidad Lectora
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
86
Miguel Ángel Jiménez RobledoMiguel Ángel Ortiz LunaMiguel Villaseñor TrinidadMónica Karla Pérez ViverosNorma Angélica Reséndiz HernándezOctavio Cano SilvaOfelia Mulliert Carlín Olimpia Escalona SotoOralia Prado Govea Óscar Benítez HernándezRaúl Zavala Cortés Rocío Rodríguez Benítez Rosalía Duarte ArgándarRosalía Mendizábal IzquierdoRosalía Sonia Guerrero GarcíaRosana Patricia Montalvo HinojosaSalvador Saulés EstradaSandra Cara CamarenaSandra Carreto CabreraSergio Gabriel Gamero Jiménez Susana Ortega LunaTeresa Espinosa ContrerasThelma Alcántara AyalaTomás Gontran López CansecoVictoria Araceli Ibarra Soto
Colegio de BachilleresCentro de Estudios de Bachillerato “Juana Inés de Asbaje”conalepColegio de BachilleresColegio de BachilleresIndependienteIndependienteColegio de BachilleresCentro de Estudios Tecnológicos Aguas Continentales (Jalisco)unitecColegio de Bachillerescbta 88Preparatoria 6, unamPreparatoria 5, unamIndependienteCentro de Estudios de Bachillerato “José Vasconcelos”enep, unam enep, unamCCH Oriente, unamColegio de BachilleresColegio de BachilleresamoreColegio BritánicoCentro de Estudios de Bachillerato “José Vasconcelos”cetis 71
Comité Académico de elaboración de reactivos
Habilidad Lectora
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R87
Aidée Guevara MaycotteAlejandra Calvo FloresAlejandro Espino GonzálezAlejandro Olea DíazAlejandro Raúl Reyes EsparzaAlfredo EncisoAmalia Sánchez BarreraAna María García ZúñigaAraceli Guzmán TristánArmando Carlos Meza RomeroArmando Castillo NievesArmando Jesús Velasco SorianoArturo Martínez EspitiaCarlos Flores ArvizoCésar Augusto Santamaría VergaraCésar Esteban Mejía AcevedoColbert Jerónimo LópezDavid Simón Contreras RivasEdmundo Jorge Alejandro Lara CastilloEduardo Basurto HidalgoEduardo Guadalupe Tellez Carmona Efraín Nava AlvarezEleazar López CruzEugelio Gerónimo LópezFausto Gómez LorenceFelipe Huerta OreaFidel Alejandro Cortés LorenzoFrancisco Javier Cortés CruzFrancisco Javier Olivares GonzálezFrancisco Pliego LópezFrancisco Torres PlacidoGenoveva Olgín RamírezGerardo Luna SotoGilberto Orozco MayrenGuillermo Tinoco OjedaGustavo Peralta EnríquezHeriberto MarínIsrael Díaz GarcíaJaime Nieves MedranoJavier Cervantes SantiagoJavier Villanueva RamosJesús Alejandro Arreola HernándezJoel Camacho SalazarJosé Enrique Maciel
CONALEPFacultad de Ciencias, UNAMCentro de Estudios de Bachillerato “Dr. Ignacio Chávez”Dirección Operativa 5, DGBCCH Azcapotzalco, UNAMColegio de BachilleresCONALEPCETIS 102AMORECCH Sur, UNAMCBTIS 215Colegio de BachilleresIndependienteCentro de Estudios de Bachillerato “Lic. Jesús Reyes Heroles”CONALEPCentro de Estudios de Bachillerato “José Vasconcelos”Universidad Tecnológica de NezahualcóyotlColegio de BachilleresPreparatoria Mixcoac ValleCINVESTAVCONALEPColegio de BachilleresENEP 6, UNAMColegio de BachilleresCCH Sur, UNAMColegio de BachilleresCBTIS 145Colegio de BachilleresColegio de BachilleresCONALEPFacultad de Ciencias, UNAMCCH Oriente, UNAMUniversidad Justo SierraCentro de Bachillerato Tecnológico Agropecuario 39Bachillerato de la Universidad Autónoma del Estado de MorelosCentro de Estudios de Bachillerato “Lic. Jesús Reyes Heroles”Preparatoria 5, UNAMPreparatoria 2, UNAMUniversidad Autónoma de QuerétaroColegio de BachilleresULSAVocacional, IPNCETIS 131CINVESTAV, IPN
Comité Académico de elaboración de reactivos
Habilidad Matemática
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
88
José Fernando Maldonado HernándezJosé Hilario CidJosé Humberto López SevillaJosé Juan Nieves MedranoJosé Juan RodríguezJosé Luis Alvarado ChávezJosé Manuel Pérez CoronaJosé Miguel García MuñozJosé Salvador Mendieta OsorioJosueth Vázquez RománJuan Francisco Hernández CruzJuan Gerardo Luna SotoJuan Manuel Lozano VieyraJuan Manuel Osorio FernándezJuan Manuel Rodríguez MarínJulio César García de Alba IbarraJulio García ValenciaJulio Hernández HernándezKesia Paola Audiffred UriegaLaura Angélica Hernández MartínezLilia Montoya GutiérrezLuis Miguel Ramírez MartínezLuis Rafael de la O SorianoLuz Adriana Bolaños GarcíaMa. Crisalda Valdéz MartínezMa. Elena García SalgueroMa. Zolayma Alcalá CastañedaMarciano Espinosa FloresMarcos Belisario González LoriaMario Aldana SugarazoMaritza Pescador RiveraMiguel Agustín Castañeda MirandaMiguel Arcángel Núñez TorresNelson Muriel TorreroOscar Guadalupe Tovar ContrerasOscar Nelson López LópezPatricia Rangel OntiverosPatricio Luna RamalesRaymundo García SamudioRebeca Juárez SalomónRita Ochoa CruzRocío Rodríguez RodríguezRogelio Toledo ToledoRoque Ruíz López
conalepprefecocbtis 260Universidad Autónoma de Querétaroamoreenep 6, unamUniversidad Justo Sierracetis 50Preparatoria 5, unamcetis 50conalepUniversidad InsurgentesPreparatoria PanamericanaCentro de Estudios de Bachillerato “Lic. Jesús Reyes Heroles”ulsaCentro de Enseñanza Técnica IndustrialUniversidad Insurgentesenep 6, unamIndependienteIndependientePreparatoria 5, unamcetis 163cbta 88cetis 109Colegio de BachilleresIndependienteconalepCentro de Estudios Tecnológicos del Mar 05, Salina Cruz, Oaxacacetis 118Colegio de BachilleresFacultad de Ciencias, unamColegio de BachilleresCentro de Estudios Tecnológicos del Mar 16, La Paz, Baja CaliforniaFacultad de Ciencias, unamPreparatoria 5, unamEscuela Preparatoria Federal por Cooperación “Antonio Audirac”conalepprefecocch Vallejo, unamfes Zaragoza, unamUniversidad Autónoma de QuerétaroColegio de MontaignacCentro de Estudios de Bachillerato “Dr. Ignacio Chávez”cbtis 59
Comité Académico de elaboración de reactivos
Habilidad Matemática
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R89
Rubén Telésforo JiménezSalvador González MendietaSergio Agustín Brambila HortaSilvia de la Vega HernándezSonia Elizabeth Ruelas MorenoVictor Agustín Sosa GómezVíctor Manuel Talamante Estrada
Colegio de BachilleresIndependienteCentro de Enseñanza Técnica IndustrialPreparatoria 7, unamprefecocbtis 6Centro de Estudios Tecnológicos del Mar 18, Acapulco, Guerrero
Comité Académico de elaboración de reactivos
Habilidad Matemática
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
90
Araceli Hernández Pérez
Alejandro Vega Solís
Adriana Reyes-Márquez Hernández
Edith Serrano Maldonado
Francisco Javier Ortiz Ramos
Guadalupe Salcedo Gutiérrez
Gloria Elena Schmeling Villaseñor
Gloria Hortensia Mondragón Guzmán
Gloria Luz Hernández Padilla
Gloria Castellanos Hernández
Ma. Catalina Ramírez Bonilla
Ma. Martha Acosta y Carrasco
Mario Agustín Jesús Castillo Sánchez Hidalgo
Marcela Vega García
Martha Galindo Becerra
Mónica Karla Pérez Viveros
Ramón López Valdepeña
Roberto Hernández Álvarez
Rocío Edith González García
Sergio Centeno García
Sandra Obdulia Carreto Cabrera
cecyt, ipn
Universidad Autónoma de Querétaro
Colegio de Bachilleres
cch Azcapotzalco, unam
Colegio de Bachilleres
Colegio de Bachilleres
Universidad Autónoma de Morelos
cch Naucalpan, unam
Universidad Justo Sierra
Colegio de Bachilleres
cch Vallejo, unam
cch Oriente,unam
Preparatoria Panamericana
cetis 03
cch Sur, unam
Colegio de Bachilleres
Universidad Marista
Colegio de Bachilleres
Universidad Autónoma de Querétaro
Universidad Autónoma de Querétaro
Colegio de Bachilleres
Comité Académico de validación de reactivos
Habilidad Lectora
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R91
Alejandro Raúl Reyes Esparza
Armando Jesús Velasco Soriano
Bernardo Tarango Frutos
Erick Mier Moreno
Fausto Gómez Lorence
Francisco Javier Cortés Cruz
Genoveva Olguín Ramírez
Guadalupe Mercedes Rodríguez
Guillermo Tinoco Ojeda
Héctor Barajas Valdez
Israel Díaz García
Jaime Nieves Medrano
Jesús Alejandro Arreola Hernández
José Juan Nieves Medrano
José Manuel Pérez Corona
Josueth Vázquez Román
Juan Manuel Lozano Vieyra
Mario Aldana Sugarazo
Nelson Muriel Torrero
Rebeca Juárez Salomón
Rita Ochoa Cruz
Raymundo García Zamudio
Víctor Agustín Sosa Gómez
cch Azcapotzalco, unam
Colegio de Bachilleres
Universidad Marista
Aprendizaje Matemático, amat
cch Sur, unam
Colegio de Bachilleres
cch Oriente, unam
Colegio de Bachilleres
Universidad Autónoma de Morelos
Aprendizaje Matemático, amat
Preparatoria 2, unam
Universidad Autónoma de Querétaro
Instituto Politécnico Nacional
Universidad Autónoma de Querétaro
Universidad Justo Sierra
cetis 50
Preparatoria Panamericana
Colegio de Bachilleres
Facultad de Ciencias, unam
fes Zaragoza, unam
Universidad Autónoma de Querétaro
cch Vallejo, unam
Colegio de Bachilleres
Comité Académico de validación de reactivos
Habilidad Matemática
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R93
Anexo IIDatos psicométricos de los reactivos piloteados
De acuerdo con lo mencionado en el apartado de Revisión Cualitativa, los ítems que se aplican en las versiones Operativas son piloteados con un año de anticipación.
En la siguiente tabla se presentan los datos psicométricos generales de las pruebas piloto aplicadas en 2007, 2008 y 2009.
Como puede observarse en la aplicación de 2009 se piloteó la mayor cantidad de reac-tivos, ya que fue necesario probar ítems de dos nuevas áreas disciplinares cuya introducción en la prueba Operativa está actualmente en estudio.
En las siguientes páginas se muestra un ejemplo de cómo se manejan las tablas estadís-ticas donde se reportan los datos psicométricos de los reactivos.• • • La columna Tipo de texto, en el caso de Habilidad Lectora, y Contenido, para Habilidad
Matemática, indica las habilidades a evaluar en cada área.• • • La columna Ítem contiene el identificador del reactivo.• • • La columna cve muestra la opción de respuesta correcta a cada reactivo.• • • Las columnas agrupadas en Estadísticos comprenden los datos correspondientes al
porcentaje de alumnos que contestaron correctamente al ítem, los datos obtenidos con Teoría Clásica (tc) y Teoría de Respuesta al Ítem (tri). En tc la columna dif indica la dificultad obtenida y la columna cpb contiene la correlación punto biserial de cada reactivo. En tri se identifica la discriminación del reactivo con A, la dificultad con B y el azar con C.
Correlación biserial media (tc)
Reactivos elaborados
Reactivos validados
Reactivos piloteados
Dificultad media (tc)
Coeficiente de discriminación (tri)
Coeficiente de dificultad (tri)
Reactivos con parámetros óptimos
2007
2010
1389
45.5
570
0.201
1.248
1.286
270
2008
3112
2505
1561
47.2
0.200
1.055
1.185
578
2009
4379
4332
3590
37.6
0.123
0.595
1.247
1890
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
94
10718107201072710730107341073710741107521075511213100721007310075100761007710080100821008310714107151071710725107281072910731107361074010745107471075310756107591076210089100931009710098101031010410106
DCBAACBADCBCDACBCDCCCBADACBCDBADCADDABAD
49.6082.2057.6047.5057.802.30
61.8041.1069.2061.9089.874.148386845
56.532.444.877
73.372.937.467.635.585.930.253.525.928.653.624.624.391.557.978.556.888.360.248.8
0.2870.1690.1860.0480.097-0.0930.1730.2020.2040.3270.1890.2250.2070.1870.1860.1910.3390.3770.2410.4170.4170.2160.2760.3730.1010.3370.0690.3090.0770.1440.3340.195-0.0060.3920.4030.4590.3610.4120.2210.274
0.756-2.2330.2222.5850.571
0.0951.241-0.918-0.283-2.18-0.860.8151.527-0.5841.2940.2760.9311.082-0.963-0.763-1.1261.184-0.5282.811-1.4993.4240.5763.6571.9330.6562.1367.536-1.735-0.142-1.064-0.063-1.53
-0.4050.484
6.3190.5920.5620.2630.374
0.6960.8020.6491.2581.05
0.8780.7232.1160.7590.96
1.8862.57
1.0711.6421.6340.72
1.0471.2320.4911.49
0.8651.37
0.7411.7422.5170.9670.2492.2391.3451.7181.1621.98
0.6130.895
0.3390.2140.1990.2080.234
0.2660.1660.1630.1200.2130.2450.1730.29
0.2060.2540.2480.13
0.2290.1030.1130.1690.1450.1410.1810.1620.2520.2670.1970.2150.33
0.1170.1290.1110.0870.0620.1040.1230.1030.131
Tipo de texto Ítem cvedif cpb
tc triEstadísticos
b a c
ApelativoApelativoApelativoApelativoApelativoApelativoApelativoApelativoApelativoApelativo
ArgumentativoArgumentativoArgumentativoArgumentativoArgumentativoArgumentativoArgumentativoArgumentativo
ExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoNarrativoNarrativoNarrativoNarrativoNarrativoNarrativoNarrativo
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R95
10515104771035910243105631043210821100271049710211105191041410508113031109211332104291048410521105301040710532102141009911378102501012611036108111098611011103961024911150110891104311265110681103711090
BDDDDBBBBBDBBCCCBDDBBDAAADCDAADCDCBCCBAA
65.7035.6031.2058.3031.7045.9051.8071.7047.8072.0054.5058.5056.4067.5016.8047.5052.9017.3016.7035.7043.0043.6041.1033.9055.4034.4056.605.50
19.9022.2018.2019.8027.7026.3029.6034.3022.6029.9030.2016.20
0.3970.5250.4880.3490.4610.2010.1340.3760.3830.2990.3850.3660.4230.3400.0320.3130.3710.1750.003-0.0250.1690.2300.1550.0400.2210.2950.1510.1040.0120.0500.058-0.0180.0820.1040.1090.0500.0500.031-0.005-0.033
-0.1860.6680.8560.6110.9101.3641.866-0.6890.575-0.6300.231-0.049-0.009-0.3763.1800.3930.4242.4165.3115.5071.2080.6411.7303.5180.5080.9330.4532.6095.7886.0316.1037.5953.7151.3921.2544.1846.2665.4666.2099.323
1.7872.9733.6532.3444.1101.9201.5761.4561.8341.1901.6881.4781.8501.6161.8401.0721.9041.5200.5850.1860.9901.0171.0970.7221.0171.4460.6282.4370.2830.2440.2870.2040.3291.0080.9430.2060.3120.2950.2490.225
0.2320.1000.1140.3870.1400.3530.4550.1420.2080.2200.1920.1500.1250.1860.1560.1020.2390.1200.1240.1270.2170.1050.2830.2740.2600.0960.2310.0370.0400.0410.0370.0290.0560.0310.0350.0640.1120.1540.1490.060
Contenido Ítem cvedif cpb
tc triEstadísticos
b a c
CantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidad
Cambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y Relaciones
Espacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y Forma
Matemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas Básicas
Habilidad Matemática
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R97
Anexo IIIParámetros versión operativa 2008
La siguiente tabla técnica de la prueba enlace Media Superior Operativa 2008 se utilizó para el establecimiento de los puntos de corte que sirvieron para la ubicación de los
sustentantes en los diferentes niveles de dominio en las primeras tres aplicaciones. Asimismo, estos datos se utilizaron para los posteriores estudios de equiparación.
La tabla contiene los siguientes datos en el orden en que se presentaron los ítems a los sustentantes:• • • Contenido. En el caso de Habilidad Lectora indica el tipo de texto y en Habilidad
Matemática el contenido matemático a evaluar. • • • Ítem. Presenta el identificador del reactivo.• • • Estadísticos. Las columnas agrupadas comprenden los datos psicométricos de los
reactivos en Teoría Clásica (tc) y Teoría de Respuesta al Ítem (tri). En TC la colum-na dif indica la dificultad obtenida y la columna cpb contiene la correlación punto biserial de cada reactivo. En tri se identifica la discriminación del reactivo con A, la dificultad con B y el azar con C.
• • • cov. Contiene el valor obtenido de la covarianza de cada reactivo.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
98
dif cpb b a c
tc tri
Estadísticos
10727107341075210755112131122011223112351123810073100751007710080100821052010526105391054010542105151042310359102361096810432107931041210497102111051010003100231037110419100041021511299104211027610996
0.1860.0970.2020.2040.3270.1320.2850.3580.2410.2250.2070.1860.1910.3390.1850.1970.2770.3350.1200.3970.5120.4880.2390.3150.2010.3510.2890.3830.2990.1430.2690.2920.1800.26
0.4410.3620.1440.2830.3510.277
57.6057.8041.1069.2061.9021.7048.6056.6077.8074.1048.0068.0045.0056.5034.0054.9051.4048.8024.5065.7037.7031.2036.4031.4045.9043.5061.3047.8072.0028.8034.8046.1038.9043.2061.4057.7031.0067.6023.5046.90
0.2220.5711.241-0.918-0.2832.2820.718-0.072-1.193-0.8600.815-0.5841.2940.2761.7050.4650.8350.3732.834-0.1860.4870.8561.5611.3001.3640.831-0.2990.575-0.6301.9151.4790.7711.7461.230-0.138-0.0911.959-0.3601.3641.073
0.5620.3740.8020.6491.2581.3258.1261.4150.9810.8780.7230.7590.9601.8861.7510.8602.0551.3060.8641.7872.8213.6531.9531.7281.9201.9950.9591.8341.1902.9211.5051.1772.2151.4611.9131.6722.0881.3541.8881.542
0.1990.2340.1660.1630.1200.1440.3280.0980.1920.2450.1730.2060.2540.2480.2520.2290.3360.1330.1580.2320.0520.1140.2710.1620.3530.2260.1230.2080.2200.2480.2150.1950.3270.2730.1620.1110.2560.2120.0890.298
1.5150.9082.0261.2322.09
1.0011.7782.6321.5861.4731.5891.5371.3062.2241.4221.2581.7952.1510.8252.2872.2912.2751.2541.5541.2182.0061.5472.1661.9580.6641.5051.7471.0811.2192.485
2.21.0161.4881.5851.513
Contenido Ítem
ApelativoApelativoApelativoApelativoApelativoApelativoApelativoApelativoApelativo
ArgumentativoArgumentativoArgumentativoArgumentativoArgumentativoArgumentativoArgumentativoArgumentativoArgumentativoArgumentativo
CantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidadCantidad
cov
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R99
dif cpb b a c
tc tri
Estadísticos
11114109421102610738112651127311081113271132510269102721027510444104451045310459104681119111193111971120811231112361055510936108031037811311105231047610519104141057410296104081130410429104841042210212
0.3180.3180.1280.0460.0500.0350.0530.0610.1130.2380.2390.2540.2180.4570.2390.3420.0400.3560.4300.4540.2080.4930.3460.1980.3300.1700.2060.0210.1290.0790.3850.3660.3090.2160.1830.3050.3710.1750.0640.226
51.9020.8030.5036.8022.6022.9031.4030.2030.1047.0041.1035.8059.8059.0045.9065.0035.9054.1077.4071.2055.2076.5049.6057.3056.0026.7029.6024.8014.1033.8054.5058.5040.2079.3043.9049.8052.9017.3033.1040.50
0.6611.5442.3632.4976.2663.9581.9262.1771.4360.7790.9551.172-0.1700.0450.854-0.5374.2880.350-0.980-0.515-0.059-0.6950.2320.0480.3862.2191.9612.6092.9182.3530.231-0.0490.748-1.1060.7870.3060.4242.4162.1091.240
1.7311.9781.4642.3240.3120.3480.4820.4530.6570.8560.6591.7290.6271.9720.8011.0140.2261.6971.6161.7750.5252.2541.0500.7241.5121.3641.5143.6841.2811.9001.6881.4781.6221.3170.7781.4941.9041.5203.9751.110
0.2890.0940.2540.3480.1120.0280.0280.0280.0070.1690.0790.1890.1530.1890.1590.1010.1160.2210.1100.1870.0900.1940.0790.1590.2630.1950.2140.2410.1010.3040.1920.1500.1380.1780.1120.1340.2390.1200.3080.207
2.0161.4660.5630.5660.6530.0140.191-0.1770.0891.3981.3111.6161.2042.2431.2651.5350.1171.8371.53
1.7430.9931.8971.8081.5722.0350.93
1.1320.2
0.6370.5672.2572.1541.9441.4341.3391.9752.16
0.6790.5651.52
Contenido Ítem
CantidadCantidadCantidadCantidad
Matemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas Básicas
NarrativoNarrativoNarrativoNarrativoNarrativoNarrativoNarrativoNarrativoNarrativoNarrativoNarrativoNarrativoNarrativoNarrativo
Cambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y Relaciones
cov
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
100
dif cpb b a c
tc tri
Estadísticos
10509112921024811028102461045811042110551104911044109901097111056108931090310905109081091110913109161091910921109231092410926109271124411248112501125110214100991137811047103451031710156103981022611138
0.1480.2280.3160.2510.2660.0150.2000.1340.0850.1310.1370.1340.1050.3080.3620.2760.2400.2010.3020.3150.3170.2100.2190.3110.3570.1690.3290.1820.4400.2540.1550.0400.2210.2550.1630.0290.1620.2250.1340.162
34.7045.5036.2031.2034.9034.9028.4057.5055.8036.4026.1037.1022.1052.6079.3052.1038.2045.3060.6046.6081.4038.5041.1063.8062.7054.1050.0022.0061.9041.8041.1033.9055.4027.6062.9029.1049.6044.6049.7041.20
1.7880.9101.1361.4491.2423.7591.9200.7660.0030.9231.6801.1642.4540.618-1.1030.8391.2751.4010.2210.610-1.2771.4741.411-0.427-0.1810.7430.7491.843-0.1971.1551.7303.5180.5081.376-0.4163.5191.3650.8061.2681.485
2.8291.2991.7572.4292.4191.2121.7660.6130.4851.0031.0121.5080.8151.3271.2481.3000.8460.7821.0960.9721.1061.4601.0870.8941.1620.5071.6902.0761.5371.2521.0970.7221.0171.2050.7611.0771.8330.9050.8011.470
0.2940.2240.1880.2120.2150.3340.2120.2960.1160.0670.0810.1890.0890.2630.1980.3060.1390.2440.2760.1380.2330.2550.2390.1370.1840.2180.2790.1510.1450.2240.2830.2740.2600.0780.1380.2630.3930.1460.2880.289
1.1431.6011.8781.3991.6840.4880.8881.2811.04
0.8361.1121.5560.6641.7121.49
1.5221.3711.1721.5161.7531.3171.3831.3041.5051.7840.9511.9651.1312.2311.4521.1390.6961.6211.4991.37
0.5041.4471.6351.3011.324
Contenido Ítem
Cambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesCambios y RelacionesMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas Básicas
ExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivoExpositivo
Espacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y Forma
cov
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R101
dif cpb b a c
tc tri
Estadísticos
1107610554105331130511330110291080910129109471053211057107351081110986105771038210264111501108911006
0.1120.1700.2530.2800.1670.0880.1630.1100.2570.2300.0840.0240.0120.0500.0790.1440.1090.1040.1090.019
21.3044.7057.6063.4051.4027.6054.4051.5040.3043.6033.3024.8019.9022.2032.7035.9034.9026.3029.6027.40
2.8091.198-0.070-0.1210.6603.1120.5581.2850.9980.6411.5614.7425.7886.0313.0031.5180.8851.3921.2544.113
1.1880.7261.0151.1880.6330.7500.6640.5001.6821.0173.6500.2860.2830.2440.2812.2570.9291.0080.9430.267
0.1630.1920.1260.2230.1800.1890.2170.2490.2090.1050.2690.0500.0400.0410.0340.2700.0220.0310.0350.029
0.5771.1851.6431.4831.6190.6780.9760.7511.7651.7011.5680.3760.2720.3960.8331.1991.6180.8670.4450.635
Contenido Ítem
Espacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y FormaEspacio y Forma
Matemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas BásicasMatemáticas Básicas
cov
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R103
Anexo IVMarco Muestral
Levantamiento de datos de la prueba
Introducción
En marzo de 2009, se llevó a cabo la administración de la prueba enlace Media Superior (Evaluación Nacional del Logro Académico en Centros Escolares) a alumnos del
nivel medio superior (bachillerato). La prueba enlace ms consta de 140 reactivos: 50 para medir la habilidad lectora y 90 para medir la habilidad matemática. A cada alumno evaluado se le proporciona un reporte de resultados, en el cual se identifica su nivel de dominio para cada una de las áreas evaluadas. La prueba se aplica de manera censal. Esta aplicación se lleva a cabo en 6 sesiones, distribuidas en dos días (tres sesiones por día)
Con la finalidad de tener un control más estricto sobre la aplicación, se seleccionó una muestra representativa a la que además de aplicarle la prueba enlace ms, también le fueron suministradas, de forma matricial, tres pruebas: pretest, alfa y gama, además del cuestionario de contexto.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
104
Los reactivos de cada una de las pruebas (pretest, alfa y gama) se distribuyeron en 6 formas. En total se conformaron 18 formas; las cuales se aplicaron en un tercer día, esto es, en dos días se aplicó la prueba enlace ms y en un tercer día se aplicaron las formas de las tres pruebas adicionales, todo esto tomando en cuenta un contrabalanceo.
El presente documento tiene por objetivo describir la metodología utilizada para selec-cionar los planteles o cct que conforman la muestra, además de describir como se calculan los factores de expansión. Es importante mencionar que la selección de las escuelas que conformaron la muestra se hace tomando como referencia las bases de datos enviadas por la sems y la dgep. Una de ellas proporciona la información relacionada con entidad, datos de ubicación del cct, modalidad del bachillerato, tipo de sostenimiento y la cantidad de alumnos que presentan la prueba enlace; y otra los datos de nivel de urbanidad del cct
A continuación se hace una descripción general del marco muestral que se utilizó en 2008 y 2009. El documento del 2008 fue elaborado por expertos del inee y el del 2009 fue realizado por Ceneval y avalado por el inee. El marco muestral de 2008 fue avalado en sesión de Consejo Técnico. Para 2009 se utilizaron los mismos dominios de estudio pero se selec-cionaron otras escuelas. Más adelante se describen las diferencias con el marco muestral de 2010 realizado por la empresa Investigaciones Sociales, Políticas y de Opinión Pública, S. A. de C. V a petición de la sems.
Objetivo del marco muestral
Con los datos obtenidos de la aplicación de los distintos instrumentos a la muestra contro-lada de estudiantes se pretende:• • • obtener los valores psicométricos de los reactivos que se utilizarán para la calificación1
• • • equiparar la prueba enlace Media Superior año con año con la aplicación del Pretest• • • obtener información a partir de los cuestionarios de contexto• • • realizar investigaciones adicionales que solicita la sep o instituciones usuarias.
1 En la primera aplicación, los datos de la muestra se utilizaron además para determinar los puntos de corte.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R105
Población Objetivo
La población objetivo son los alumnos que estén en el último año de bachillerato que se en-cuentren en cualquiera de las siguientes modalidades educativas:• • • Bachillerato General• • • Bachillerato Técnico• • • Bachillerato Tecnológico
Los alumnos del último año de bachillerato se determinan de la siguiente manera:• • • Si son bachilleres anuales, se evaluarán a los del último año.• • • Si son bachilleres semestrales, con ingreso anual, se evaluarán a los de sexto semestre.• • • Si son bachilleres semestrales, con ingreso semestral, se evaluarán a los de quinto y
sexto semestre.• • • Si son cuatrimestrales con entrada anual, se evaluarán a los del último cuatrimestre.• • • Si son cuatrimestrales con entrada cuatrimestral, se evaluarán a los de los tres últimos
cuatrimestres.
Para efectos del proceso de muestreo, se define a la escuela como la unión de cct y turno. Por ejemplo: si un cct cuenta con dos turnos, cada uno de los turnos se considera como una escuela o unidad primaria de muestreo. Para el proceso de selección de escuelas no se tomó en cuenta aquellas que tienen menos de 10 alumnos.
Estratos muestrales
La estratificación de la población consiste en agrupar a elementos de iguales características según criterios previamente establecidos. La estratificación de poblaciones se realiza en las primeras etapas del diseño muestral, ya que ésta ayudará a la selección de la misma. Un marco muestral generalmente esta estratificado en relación con una o más características. Las va-riables a ser objeto de análisis para la estratificación de los elementos de la población deben proporcionar información discriminante, es decir, que identifiquen y aíslen a estos elementos en relación con otros. De la misma manera, las variables seleccionadas para la estratificación de los sujetos deben ir con relación al estudio, es decir que la estratificación propuesta ayude a diferenciar a los distintos grupos de personas sobre la base de los objetivos del estudio que se realizará.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
106
Características de los estratosLas características esenciales en la creación de los estratos son que éstos deben tener homo-geneidad interna, es decir que todos los integrantes posean una serie de características que los convierten en similares. La otra característica fundamental es que exista heterogeneidad entre los diferentes estratos construidos, es decir que los elementos de diferentes estratos se diferencian los unos de los otros. Los elementos de un estrato deberán ser mutuamente excluyentes en relación con los elementos de otros estratos, es decir que no se puede perte-necer a dos o más estratos a la vez. En este sentido uno de los objetivos de la construcción de estratos es disminuir el error de muestreo y permitir el cálculo de los parámetros.
La estratificación de la población surge naturalmente de la combinación de las entida-des federativas con la clasificación de tipo de bachillerato, tipo de sostenimiento y nivel de urbanidad de las escuelas como a continuación se presenta.
Al definir esta división de la población existen estratos que no contienen alumnos, los cuales se eliminan.
Cálculo de tamaño de muestra
El cálculo de tamaño de muestra se realiza bajo la consideración de que se van a estimar determinados estadísticos. Con la muestra se pretende estimar medias poblacionales del ren-dimiento escolar escalado con un modelo tri.
No
Iden
tifica
do
Tipo de urbanidad
Tipo de bachillerato General
Público Público Público Privado Privado Privado
Tecnológico Técnico
Tipo de sostenimiento
Entidad n n n n n n n n n n n n n n n n n
No
Iden
tifica
do
Rura
l
Rura
l
Rura
l
Rura
l
Rura
l
Rura
l
Urb
ano
Urb
ano
Urb
ano
Urb
ano
Urb
ano
Urb
ano
No
Iden
tifica
do
No
Iden
tifica
do
No
Iden
tifica
do
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R107
Por otra parte, se calcula la proporción de respuestas correctas para cada reactivo y para este aspecto se consideran proporciones de respuesta a cada uno de ellos de 0.5, en donde la varianza del estimador es máxima.
Para calcular el tamaño de la muestra considerando que se estimará la proporción de respuesta a cada reactivo se utiliza la siguiente expresión.
(1)
En donde:n0 = Número de alumnos necesarios para la estimación de un reactivo.deff = Efecto de diseño.TNR = Tasa de no respuesta de alumnos.δ = Error de muestreo máximo admisible.P = Proporción de la población.z = Cuantil de distribución normal estándar que deja un área de a la derecha de él.N = Tamaño de la población.
Tomando en cuenta el diseño matricial de las pruebas, el número total de alumnos necesario está dado por la siguiente fórmula:
(2)
En donde:n = número de alumnos necesarios para la estimación de todos los reactivos de la prueba.C = Número de cuadernillos en la prueba.A = Número de apariciones de un reactivo en los cuadernillos.
En este diseño se considera que α =0.05, es decir z =1.96 lo cual fija el nivel de con-fianza de los intervalos en 95%. C =18 cuadernillos, A =1 apariciones cada 18 cuadernillos y como porcentaje de falta de respuesta de los alumnos se usa tnr =5% dada la existencia de escuelas pequeñas. Se fijó el efecto de diseño debido al muestreo en deff =1.2 que es un valor promedio que efectivamente ha aparecido en otras evaluaciones.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
108
El estimador de P tiene su varianza máxima cuando P =0.5 por lo que se fija y se usa como margen de seguridad para los otros valores estimados de P diferentes a 0.5. Se esta-bleció como criterio general que en cada dominio de estudio las estimaciones resultantes alrededor de las proporciones tuvieran un error de muestreo máximo de 5% correspondiente a una confianza del 95%.
Distribución de la muestra
En todos los casos, los alumnos se agrupan en la muestra de manera proporcional a la cantidad de alumnos en cada uno de los estratos. La distribución se describe con la siguiente relación:
(3)
En donde:nh = Es el número de alumnos en muestra para el estrato muestral hn = Es el número de alumnos en muestra.Nh = Es el número de alumnos del último año de bachillerato en el estrato h.N = Es el número de alumnos en la población.
La distribución de la muestra se realiza tomando en cuenta:•• 1. el total de alumnos de la población•• 2. el total de alumnos de cada tipo de bachillerato•• 3. el total de alumnos de cada entidad
Factores de expansión
Para fines de las investigaciones relacionadas con la aplicación de la prueba enlace ms se calculan los factores de expansión. Los pesos muestrales o factores de expansión son pon-deradores que asociados a los datos son necesarios para garantizar la confiabilidad de los re-sultados. Esto ha permitido corroborar que la muestra utilizada en cada año de aplicación es representativa de la población de estudio y por tanto, las estimaciones estadísticas derivadas de ella resultan confiables.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R109
El factor de expansión se puede interpretar como la cantidad de alumnos de la población que representa un estudiante de la muestra. Bajo el diseño muestral unietápico, los pesos muestrales por estrato para cada uno de los alumnos son los siguientes.
(4)
Donde:whij = Peso muestral del alumno j de la escuela i en el estrato h.h = 1,…, H.H = Cantidad de estratos en la población.NhI = Cantidad de escuelas en la población del estrato h.nhI = Cantidad de escuelas en muestra del estrato h.i = 1,…, NhI.
Diferencias del marco muestral 2010 con los años anteriores
Debido a las necesidades de la sems, el diseño muestral para la prueba 2010 fue realizado por una institución especializada ajena al Ceneval. El esquema conserva variables como la población objetivo, el esquema de selección y el cálculo de los factores de expansión utili-zando las mismas herramientas estadísticas; sin embargo, hay algunas diferencias que vale la pena mencionar:• • • La propuesta del dominio de estudio a nivel Entidad (con niveles de desagregación
como el tipo de bachillerato, tipo de sostenimiento y nivel de urbanidad) fue rechazada debido a la dificultad que conlleva calcular muestras representativas, dada la variabili-dad de características dentro de cada una de las entidades y la proporción que repre-senta para el resto del país.
• • • Se agregan tres estratos: centros de trabajo con menos de ocho alumnos, centros de Bachillerato en Arte y las instituciones que habían participado en años anteriores, pero no habían confirmado su participación al momento de establecer el diseño muestral.
En la siguiente tabla se muestran las características generales de cada uno de los marcos muestrales utilizados para llevar a cabo las aplicaciones controladas de enlace, Pretest y Cuestionarios de Contexto.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
110
Niveles de desagregaciónMarco
MuestralEstratos
Escuelas seleccionadas
Alumnos
2009 353 2184 220,233
2008 320 2003 301,483
2010 313 2072 283,245
41. Nacional2. Nacional por tipo de bachillerato,
nacional por tipo de sostenimiento y nacional por nivel de urbanidad3. Estatal4. Estatal por tipo de bachillerato, estatal
por tipo de sostenimiento y estatal por nivel de urbanidad
41. Nacional2. Nacional por tipo de bachillerato,
nacional por tipo de sostenimiento y nacional por nivel de urbanidad3. Estatal4. Estatal por tipo de bachillerato, estatal
por tipo de sostenimiento y estatal por nivel de urbanidad
21. Nacional2. Nacional por tipo de bachillerato,
nacional por tipo de sostenimiento y nacional por nivel de urbanidad
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R111
Anexo VEstablecimiento de los puntos de corte
y generación de algoritmo de calificación
El presente anexo describe el procedimiento con el cual se califica y dictamina a los sustentantes que presentaron la prueba enlace Media Superior, haciendo uso de
la metodología Bookmark para el establecimiento de puntos de corte y la definición de los niveles de dominio.
Es importante mencionar que el algoritmo de calificación con el que se obtienen los puntajes de habilidad que se presentan en las siguientes páginas se aplicó con base en los datos de la muestra controlada.1 Los resultados obtenidos están sujetos a las condiciones de la apli-cación y, por tanto, son estimaciones que pueden diferir de los resultados que se obtienen de manera censal.
1 Para el análisis se consideraron a los sustentantes que contestaron el 85% o más de la prueba, por lo tanto el tamaño de la muestra con que se trabajó es 98,849
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
112
La prueba enlace Media Superior fue construida para evaluar dos habilidades: Habi-lidad Lectora y Habilidad Matemática, con 50 y 90 reactivos respectivamente, por lo tanto, el dictamen de los sustentantes se realiza para cada una de las áreas que lo conforman.
Para llevar a cabo el proceso de calificación se realizó lo siguiente:• • • Estimación de los parámetros del reactivo, dificultad, discriminación, azar y de la ha-
bilidad de los sustentantes con base en la Teoría de Respuesta al Ítem (tri), así como el cálculo del porcentaje de respuestas correctas de los sustentantes y la correlación punto biserial de los reactivos.
• • • El análisis de los reactivos se hizo con base en los datos de la muestra y se dejaron fuera los reactivos que obtuvieron una correlación punto biserial negativa y los reactivos con dificultad extrema. En la Tabla 1 se muestran los reactivos que se eliminaron por área.
Tabla 1. Reactivos eliminados que no se consideraron para calificación 2008
• • • Establecimiento de los puntos de corte para cada una de las áreas del examen. Para ello se definieron conceptualmente los niveles de dominio en los cuales se ubicaría a cada sustentante que presentó la prueba enlace Media Superior, (Insuficiente, Elemental, Bueno y Excelente); después, se establecieron los puntos de corte para cada categoría a partir del método Bookmark o del marcador.
TC
%_RCN_Resp
CorrNÍtemÁrea
Habilidad Matemática
Comprensión Lectora
Posición en versión CPBIS DISC DIF AZAR
TRI
Parámetros Estadísticos
57 10468 98849 37457 37.90 0.007 0.041 16.185 0.057
30 10510 98849 30820 31.20 0.020 0.027 38.055 0.069
46 11273 98849 20268 20.50 -0.094 0.001 22.449 0.006
47 11081 98849 24712 25.00 0.047 2.180 3.160 0.243
48 11327 98849 27813 28.10 -0.059 0.001 15.876 0.006
49 11325 98849 26155 26.50 0.025 0.081 22.685 0.146
68 11311 98849 30109 30.50 -0.045 0.008 126.644 0.048
86 10458 98849 34144 34.50 0.056 0.290 6.641 0.247
133 10811 98849 22368 22.60 0.018 0.048 27.642 0.023
139 11089 98849 26703 27.00 0.001 0.025 45.115 0.030
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R113
Nivel de Dominio
Nivel de Dominio
Reactivo Marcador
Reactivo Marcador
Puntos de corte (habilidad)
Puntos de corte (habilidad)
Elemental
Elemental
21
33
Insuficiente
Insuficiente
7
10
Menores o iguales que -0.916000
Menores o iguales que -0.053000
Mayores o iguales que 1.455001
Mayores o iguales que 2.018001
0.096000
1.176000
1.455000
2.018000
0.096001
1.176001
-0.915999
-0.052999
Bueno
Bueno
42
53
Excelente
Excelente
–
–
En las Tablas 2 y 3 se muestran los rangos obtenidos por área en el 2008, que son los mismos que se utilizaron en 2009 y 2010 para asegurar la comparabilidad de la prueba.
Como se puede observar los puntos de corte incluyen seis decimales esto permite que todas las habilidades que resultan de la calificación con el programa bilog se ubiquen en alguna de las categorías de manera más precisa.
Tabla 2. Rangos de habilidad en Habilidad Lectora
La calificación censal la lleva a cabo la dgep, al igual que la ubicación de los sustentantes en los niveles de dominio de acuerdo con la habilidad que obtuvieron.
Tabla 3. Rangos de habilidad en Habilidad Matemática
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
116
Informe de validación de puntos de corte en las pruebas de Matemáticas y Comprensión Lectora de Enlace Media Superior
José Luis Gaviria Soto Universidad Complutense de Madrid
México, 10 de Septiembre de 2008
IntroducciónEn este informe se hace un estudio de validación empírica de los puntos de corte determinados para las pruebas de ‘Español’ y ‘Matemáticas’ de tercero de Bachillerato del programa de evaluación ‘Enlace Media Superior’.
Dado que la posición de los puntos de corte para los Niveles de Logro determina com-pletamente el porcentaje de alumnos en cada uno de ellos, es muy importante asegurarse de que la información que se proporciona refleja adecuadamente la realidad y no es un artefacto del procedimiento de cálculo.
Los Niveles de Logro tienen necesariamente un componente intrínsecamente valorativo y, de algún modo, subjetivo o arbitrario. Efectivamente, que el resultado obtenido por un estudiante se considere insuficiente, elemental, bueno o excelente depende en gran parte de las expectativas que tengamos. Por eso la determinación de los puntos de corte es un proceso delicado y sujeto siempre a discusión. La mayor parte de los procedimientos consisten en acuerdos entre expertos que deben justificar sus decisiones. Una vez justificadas esas decisiones es posible hacer un juicio que se base en evidencia empírica acerca de la congruencia de las decisiones adoptadas.
SupuestosPara juzgar lo adecuado de los puntos de corte partimos del supuesto básico de que la prueba refleja adecuadamente los conocimientos, destrezas o habilidades necesarios para demostrar el nivel adecuado de competencia en tercero de Bachillerato.
Asumimos además que cuando los expertos han determinado los puntos de corte se han basado en el contenido de los reactivos que componen la prueba y que han determinado zonas de la escala en las que el nivel de dominio de los alumnos que se encuentran en cada una de ellas se diferencia claramente del nivel de dominio de otros alumnos que están en niveles superiores o inferiores.
Nuestro juicio pretende ser empírico, es decir, debemos comprobar si es posible clasi-ficar adecuadamente a los sujetos utilizando los puntos de corte definidos por los expertos.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R117
Para ello estos puntos de corte deben estar claramente diferenciados en la escala, suficiente-mente alejados unos de otros y cubriendo razonablemente bien el espectro de puntuaciones que corresponde a la escala.
ProcedimientoEl procedimiento empleado para esta valoración se basa en dos puntos de vista:• • • por un lado nos fijamos en la relación entre las puntuaciones de la escala y la puntuación
verdadera;• • • por otro lado nos fijamos en el error típico de estimación que se obtiene para cada
punto de la escala en función del valor que en el mismo toma la función de información.
Los puntos de corte son valores de la escala de habilidad cuyas propiedades derivan del modelo tri bajo el que se ha construido. Dado que este tipo de escalas tienen un origen y una unidad de medida arbitrarios es todavía más difícil juzgar lo adecuado de los puntos de corte basándose en los valores de los mismos. Pero como ya hemos establecido entre los supuestos que los ítems de la prueba reflejan adecuadamente los conocimientos o habilidades que deben poseer los alumnos, podemos basarnos en la relación entre la escala de habilidades y la puntuación verdadera para hacer algunos juicios.
En efecto, una propiedad del modelo tri es que para cada alumno la suma de sus pro-babilidades de responder correctamente a cada uno de los reactivos es igual a la puntuación verdadera, es decir, al número de respuestas correctas que obtendría ese alumno si el test le midiese sin error. Si conociésemos la medida en el rasgo latente de θ1 entonces T1 es
Cuando lo que tenemos es una estimación de θ1 entonces
Esta relación la vemos empíricamente en las figuras 1• y 2. En ellas tenemos el diagrama de dispersión de la relación entre las puntuaciones en las respectivas habilidades latentes y el número de respuestas correctas en cada una de las pruebas. En el eje de ordenadas tene-mos el número de respuestas correctas observadas. Para cada valor de la habilidad latente
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
118
los valores observados se distribuyen por encima y por debajo del valor esperado, que es la puntuación verdadera.
En las dos nubes de puntos de estas figuras puede apreciarse que la dispersión es mayor en la parte izquierda, lo que evidencia que en esa zona, especialmente en la prueba de Mate-máticas, la cantidad de información es menor, por lo que se obtienen estimaciones con mayor incertidumbre.
La incertidumbre con la que se produce la estimación de un parámetro determinado está en relación inversa con la cantidad de información de que se dispone. Cada reactivo en cada una de las pruebas proporciona una cantidad de información que es función de θ. De este modo la función de información del reactivo i viene dada por:
La información que proporcionan todos los ítems del test es la suma de la de cada uno de ellos.
En la ilustración 3 y 4 podemos ver las funciones de información de los reactivos de Comprensión Lectora y de la prueba completa, respectivamente. Del mismo modo en las ilustraciones 5 y 6 tenemos lo mismo respecto de las Matemáticas.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R119
Ilustración 1. Relación entre la Habilidad Matemática y el número de respuestas
correctas en Matemáticas
Ilustración 2. Relación entre la Habilidad Lectora y el número de respuestas
correctas en Lectura
-2,000000 ,000000 2,000000 4,000000
Habilidad
Num
_res
pues
tas
80,00
60,00
40,00
20,00
,00
50,00
40,00
30,00
20,00
10,00
,00
-2,000000 ,000000 2,000000 4,000000
Habilidad
Num
_res
pues
tas
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
120
Ilustración 3. Función de información de los reactivos de Comprensión Lectora
Ilustración 4. Función de información de la prueba de Comprensión Lectora
-3.2
00-3
.079
-2.9
58-2
.836
-2.7
15-2
.594
-2.4
73-2
.362
-2.2
30-2
.109
-1.9
88-1
.867
-1.7
46-1
.624
-1.5
03-1
.382
-1.2
61-1
.140
-1.0
18-0
.897
-0.7
76-0
.655
-0.5
34-0
.412
-0.2
91-0
.170
-0.0
49 0
.072
0.1
94 0
.315
0.4
36 0
.557
0.6
78 0
.800
0.9
21 1
.042
1.1
63 1
.284
1.4
06 1
.527
1.6
48 1
.769
1.8
90 2
.012
2.1
33 2
.254
2.3
75 2
.496
2.6
18 2
.739
2.8
60 2
.981
3.1
03 3
.224
3.3
45
Función de Información de la Prueba. Habilidad lectora 2008
Func
ión
de In
form
ació
n
Habilidad
8
7
6
5
4
3
2
1
0
Habilidad
Func
ión
de In
form
ació
n
1.2
1
0.8
0.6
0.4
0.2
0
-3.2
00-3
.079
-2.9
58-2
.836
-2.7
15-2
.594
-2.4
73-2
.362
-2.2
30-2
.109
-1.9
88-1
.867
-1.7
45-1
.624
-1.5
03-1
.382
-1.2
61-1
.140
-1.0
18-0
.897
-0.7
76-0
.655
-0.5
34-0
.412
-0.2
91-0
.170
-0.0
49 0
.072
0.1
94 0
.315
0.4
36 0
.557
0.6
78 0
.800
0.9
21 1
.042
1.1
63 1
.284
1.4
06 1
.527
1.6
48 1
.769
1.8
90 2
.012
2.1
33 2
.254
2.3
75 2
.496
2.6
18 2
.739
2.8
60 2
.981
3.1
03 3
.224
3.3
45
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R121
Ilustración 5. Función de información de los reactivos de Matemáticas
Ilustración 6. Función de información de la prueba de Matemáticas
-3.2
00
-3.0
79-2
.958
-2.8
36-2
.715
-2.5
94-2
.473
-2.3
62-2
.230
-2.1
09-1
.988
-1.8
67-1
.746
-1.6
24-1
.503
-1.3
82-1
.261
-1.1
40-1
.018
-0.8
97-0
.776
-0.6
55-0
.534
-0.4
12-0
.291
-0.1
70-0
.049
0.0
72 0
.194
0.3
15 0
.436
0.5
57 0
.678
0.8
00 0
.921
1.0
42 1
.163
1.2
84 1
.406
1.5
27 1
.648
1.7
69 1
.890
2.0
12 2
.133
2.2
54 2
.375
2.4
96 2
.618
2.7
89 2
.860
2.9
81 3
.103
3.2
24 3
.345
Habilidad
Func
ión
de In
form
ació
n
1.4
1.2
1
0.8
0.6
0.4
0.2
0
Func
ión
de In
form
ació
n
Habilidad
25
20
15
10
5
0
-3.2
00-3
.079
-2.9
58-2
.836
-2.7
15-2
.594
-2.4
73-2
.362
-2.2
30-2
.109
-1.9
88-1
.867
-1.7
46-1
.624
-1.5
03-1
.382
-1.2
61-1
.140
-1.0
18-0
.897
-0.7
76-0
.655
-0.5
34-0
.412
-0.2
91-0
.170
-0.0
49 0
.072
0.1
94 0
.315
0.4
36 0
.557
0.6
78 0
.800
0.9
21 1
.042
1.1
63 1
.284
1.4
06 1
.527
1.6
48 1
.769
1.8
90 2
.012
2.1
33 2
.254
2.3
75 2
.496
2.6
18 2
.739
2.8
60 2
.981
3.1
03 3
.224
3.3
45
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
122
Una primera cosa que hay que destacar es que en la prueba de Matemáticas la mayor cantidad de información está en la parte derecha de la escala. Esto quiere decir que la distin-ción entre los alumnos de los niveles de logro ‘Bueno’ y ‘Excelente’ se hace con mayor precisión que entre los alumnos de los niveles ‘Insuficiente’ y ‘Elemental’ y ‘Elemental’ y ‘Bueno’.
En Comprensión Lectora la cantidad de información está más distribuida, aunque alcanza valores más bajos, entre otras cosas porque esta prueba tiene un número mucho menor de reactivos. Por eso la distinción entre los cuatro niveles tiene una precisión similar.
Estudio de los puntos de corte
Dado el porcentaje tan elevado de alumnos situados en el nivel ‘Insuficiente’, el punto de corte más crítico es precisamente el que separa los niveles de ‘Insuficiente’ y ‘Elemental’.
Si este punto está demasiado a la derecha, un gran número de alumnos serán indebida-mente asignados al nivel ‘Insuficiente’.
Si este punto está demasiado a la izquierda un gran número de alumnos con un nivel de desempeño muy bajo será clasificados como de nivel ‘Elemental’.
Para valorar lo adecuado del primer punto de corte comenzamos por definir un punto al que denominamos ‘Punto de Partida’.
La prueba constaba de reactivos de cuatro alternativas de respuesta y una sola correcta. Como consecuencia, un alumno que hubiese contestado completamente al azar toda la prueba tendría una esperanza de respuestas correctas igual a un cuarto del número de ítems. En el caso de la prueba de Matemáticas ese valor es 20,25, ya que la prueba consta de 81 reactivos. En el caso de Español es de 12,25, ya que la prueba consta de 49 reactivos.
Es evidente por tanto que un alumno que obtuviese sólo 20,25 respuestas correctas en Matemáticas o 12,25 en Español tiene un nivel de conocimientos o de habilidades equivalente a los de un alumno que sin saber nada hubiese contestado al azar.
Es posible saber cuál es la puntuación en la escala de habilidad que corresponde a ese número de respuestas correctas ya que como hemos visto en el punto anterior hay una correspondencia entre la puntuación del rasgo latente y la puntuación verdadera.
Para cada reactivo tenemos los valores estimados de sus parámetros por lo que es posible calcular cuál es la puntuación verdadera que corresponde a en estos dos tests a cada valor la escala de habilidad. Con esos valores es posible obtener una estimación de la pun-tuación verdadera. De este modo sabemos que en Matemáticas a la puntuación verdadera de
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R123
20,25 corresponde una puntuación de habilidad de -1,966, mientras que en Español a 12,25 corresponde una habilidad de -2,67. Estos dos son los que denominamos punto de partida.
Estos puntos nos sirven para valorar la posición del primer punto de corte. En una primera aproximación, no tendría ningún sentido que el primer punto de corte estuviese a la izquierda o muy cerca del punto de partida. Es evidente que un alumno con número de respuestas correctas equivalentes a responder al azar está en un nivel de logro insuficiente.
Pero por otra parte si el primer punto de corte se aleja en exceso del punto de partida entonces tal vez estemos exigiendo demasiados conocimientos o habilidades para acceder al nivel elemental.
En las tablas 1 y 2 podemos ver la correspondencia entre los puntos de corte y las pun-tuaciones verdaderas respectivas. También podemos ver el porcentaje de respuestas correctas que les corresponde y el incremento en respuestas correctas que supone el pasar de un punto de corte al siguiente.
Por definición el punto de partida se toma como la puntuación de habilidad y pun-tuación verdadera que corresponde a un porcentaje de respuestas correctas igual a 1/n° alternativas.
En el caso de Matemáticas el punto de partida es -1,966. El primer punto de corte está en -0,053, y le corresponde una puntuación verdadera de 28,71, es decir, 8,46 respuestas co-rrectas por encima del punto de partida. Podemos decir que no parece una exigencia excesiva el tener aproximadamente 9 respuestas correctas por encima de las que cabría esperar al res-ponder por azar para ingresar en el nivel de logro ‘Elemental’. El incremento en respuestas correctas entre los otros dos puntos de corte está entre 12 y 13.
Tabla 1. Puntos de corte de Matemáticas 30 de Bachillerato
Punto de partida
Primer punto de corte
Segundo punto de corte
Tercer punto de corte
Matemáticas
Porcentaje
-1,966 -0,053 1,176 2,018
20,25 28,71 41,54 54,07
0,25 0,3544 0,51284 0,6675
8,46 12,83 12,53
Puntuación de habilidad
PuntuaciónVerdadera
Incremento sobre punto
anterior
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
124
Tabla 2. Puntos de corte de Lectura 30 de Bachillerato
Punto de partida
Primer punto de corte
Segundo punto de corte
Tercer punto de corte
Español
Porcentaje
-2,67 .-0,916 0,096 1,455
12,25 19,16 26,29 36,76
0,25 0,391 0,53653 0,7502
6,91 7,13 10,47
Puntuación de habilidad
PuntuaciónVerdadera
Incremento sobre punto
anterior
En Lectura el número de reactivos es de 49, por lo que el 25% es 12,25. Otra vez, un alumno que respondiese correctamente 12 reactivos está produciendo un resultado equi-valente al que se obtendría si hubiese contestado todo el test al azar. El incremento en respuestas correctas desde el punto de partida hasta el primer punto de corte es de 7, aproxi-madamente. La diferencia entre el primer punto de corte y el segundo es también de 7, y del segundo al tercero de 10,47.
Por lo anterior podemos decir que basándonos en la relación entre el rasgo latente y la puntuación verdadera la distribución de los puntos de corte en las dos escalas parece muy razonable.
La distancia de los puntos de corte entre sí, y del primer punto de corte con el punto de partida puede juzgarse también basándonos en la función de información. En efecto, en cada punto de la escala hay una relación entre la cantidad de información del test y el error típico de estimación del parámetro en ese punto.
En las figuras 7 y 8 tenemos representada la distribución en la estimación de los puntos de corte. En la distribución correspondiente al punto de partida hemos sombreado la zona de las puntuaciones que quedan a la derecha del punto de corte más dos errores típicos. Como vemos el primer punto de corte queda muy cerca de ese límite. De hecho la probabilidad de que al estimar una puntuación en la escala de habilidad igual al punto de partida, la estimación
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R125
obtenida sea mayor o igual al primer punto de corte es 0,055 para Matemáticas. Por otra parte la probabilidad de que un sujeto con una puntuación de habilidad igual al primer punto de corte se le estimase una puntuación menor o igual al punto de partida es de 9,68475E-06. Para Español esas cifras son 0,03884637 y 0,00013097 respectivamente.
Podemos interpretar estas cifras del siguiente modo: un alumno que tenga una habilidad como máximo igual al punto de partida, tiene una probabilidad de ser asignado al nivel de logro ‘Elemental’ de 0,055 en Matemáticas y de 0,038 en Español; la probabilidad de que un sujeto que tenga como mínimo una habilidad igual a la del primer punto de corte tiene una probabilidad de estar realmente por debajo del punto de partida de 9,68x10-6 en Matemáticas y de 0,00013 en Español.
Ilustración 7. Densidad de probabilidad de la estimación alrededor de los puntos
de corte en Matemáticas
1,8
1,6
1,4
1,2
1
0,8
0,6
0,4
1,2
0
-3
-2.9
-2,7
-2,6
-2,4
-2,3
-2,1 ,2
-1,6
-1,7
-1,5
-1,4
-1,2
-1,1
-0,9
-0,8
-0,6
-0,5
-0,3
-0,2 0
0,1
5 0
,3 0
,45
0,6
0,7
5 0
,9 1
,05
1,2
1,3
5 1
,5 1
,65
1,8
1,9
5 2
,1 2
,25
2,4
2,5
5 2
,7 2
,85 3
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
126
Ilustración 8. Densidad de probabilidad de la estimación alrededor de los puntos
de corte en Comprensión Lectora
Del mismo modo podemos juzgar la separación de los puntos de corte entre sí. Entre dos niveles consecutivos hay siempre una gran superposición de áreas. Por ejemplo, dado el primer punto de corte, en el caso extremadamente favorable de que el error de estimación sea muy pequeño, la mitad del área de la distribución se encontrará sobre el nivel de logro ‘Elemental’. Y así con cada punto de corte. Por ello para juzgar lo separado de los puntos de corte es más adecuado observar cuál es área de la distribución que está más allá del siguiente punto, es decir, dos niveles de logro más allá.
En las tablas 3 a 5 tenemos las áreas mencionadas. En la 3 y la 5 vemos el área de cada distribución que recae en dos niveles de logro más allá En la 4 y la 6 vemos el área que recae dos niveles por debajo. Es muy interesante comprobar que ésta es siempre mucho más pequeña. Esto se debe a que tanto en la prueba de Comprensión Lectora como en la de Matemáticas la mayor cantidad de información se encuentra a la derecha de la escala. Por eso es siempre más probable que sea mejor clasificado un sujeto con puntuación de habilidad alta que otro de habilidad más baja. Podemos comprobar que en todos los casos, excepto en uno, el valor de probabilidad es menor que 0,05. En el caso restante el valor es muy próximo al 5 por ciento.
1.2
1
0.8
0.6
0.4
0.2
0
-3
-2.9
-2,7
-2,6
-2,4
-2,3
-2,1 ,2
-1,6
-1,7
-1,5
-1,4
-1,2
-1,1
-0,9
-0,8
-0,6
-0,5
-0,3
-0,2 0
0,1
5 0
,3 0
,45
0,6
0,7
5 0
,9 1
,05
1,2
1,3
5 1
,5 1
,65
1,8
1,9
5 2
,1 2
,25
2,4
2,5
5 2
,7 2
,85 3
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R127
Tabla 3. Probabilidades de ser clasificado dos niveles por encima en Comprensión Lectora
Tabla 5. Probabilidades de ser clasificado dos niveles por encima en Matemáticas
Tabla 4. Probabilidades de ser clasificado dos niveles por debajo en Comprensión Lectora
Comprensión Lectora
Matemáticas
Comprensión Lectora
Probabilidad de que estando por debajo de Punto de partida sea Clasificado como ‘Elemental’
Probabilidad de que estando por debajo de Punto de partida sea Clasificado como ‘Elemental’
Probabilidad de que estando en el primer Punto de Corte obtenga una estimación inferior al Punto de Partida
0,03884637
0,05517635
0,00013097
Probabilidad de que estando por debajo de primer Punto de Corte sea clasificado como ‘Bueno’
Probabilidad de que estando por debajo de primer Punto de Corte seaClasificado como ‘Bueno’
Probabilidad de que estando en el segundo Punto de Corte obtenga una estimación inferior al Primer Punto de Corte
0,01759606
0,00313079
0,00400921
Probabilidad de que estando por debajo de segundo Punto de Corte sea clasificado como ‘Bueno’
Probabilidad de que estando por debajo de segundo Punto de Corte seaClasificado como ‘Bueno’
Probabilidad de que estando en el tercer Punto de Corte obtenga una estimación inferior al segundo Punto de Corte
0,00018519
0,00090651
0,0001053
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
128
Tabla 6. Probabilidades de ser clasificado dos niveles por debajo en Matemáticas
Matemáticas
Probabilidad de que estando en el primer Punto de Corte obtenga una estimación inferior al Punto de Partida
9,68 1475E-06
Probabilidad de que estando en el segundo Punto de Corte obtenga una estimación inferior al Primer Punto de Corte
2,7907E-06
Probabilidad de que estando tercer Punto de Corte obtenga una estimación inferior al segundo Punto de Corte
0,00100023
Conclusiones y recomendaciones
Analizados los puntos de corte determinados para las pruebas de Comprensión Lectora y Matemáticas y sus respectivas distancias en términos de la puntuación verdadera corres-pondiente y en términos de unidades de error típico de estimación, la separación entre ellos parece adecuada según los criterios que se han manejado.
Si damos por supuesto que la prueba refleja adecuadamente el dominio de evaluación, entonces podemos concluir que la posición de los puntos de corte es adecuada en las dos pruebas analizadas.
Probablemente es la posición del primer punto de corte la que más puede preocupar, ya que estamos indicando que los alumnos por debajo de ese punto tienen un nivel insufi-ciente de conocimientos. Pues bien, los análisis que hemos realizado nos permiten afirmar que si se mantiene el supuesto de que el contenido de las pruebas refleja adecuadamente el dominio que evaluamos, el primer punto de corte no es en absoluto excesivamente alto.
Las recomendaciones que haremos tienen que ver con la función de información.En efecto, esta primera versión de las pruebas ha servido para determinar la escala y
los puntos de corte. Pero hemos podido observar que la mayor cantidad de información se encuentra en la parte derecha de la distribución. Esto quiere decir que nuestras estimaciones tienen mayor precisión para los sujetos de capacidad relativamente alta, es decir, los que se encuentran en los niveles ‘Bueno’ y ‘Excelente’, pero menor en los otros dos. Sin embargo en la población evaluada la mayor parte de los individuos se encuentra en los niveles ‘In-suficiente’ y ‘Elemental’. Por eso en las evaluaciones subsiguientes, si se mantiene la distri-bución de los reactivos como en la actual, será difícil captar adecuadamente los incrementos
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R129
que pudiesen producirse en los individuos de esos niveles. Por ese motivo se recomienda que, manteniéndose los mismos niveles de corte para el futuro, se redistribuyan sin embargo las dificultades de los reactivos, de modo que se incluyan más reactivos que midan adecuada-mente en la parte inferior de la distribución para poder captar adecuadamente los cambios que puedan darse.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R131
Anexo VIIEquiparación
La equiparación por población que se realiza para la prueba enlace Media Superior tiene como objetivo igualar la escala de calificación de los sustentantes año con año
de modo que los resultados en cada aplicación sean comparables.Para la realización de este proceso se seleccionó el método de equiparación por trans-
formación lineal a partir del modelo logístico de tres parámetros de tri. La importancia de elegir este modelo logístico reside en el tipo de reactivos que utiliza la prueba (opción múl-tiple, con una sólo respuesta correcta) y la intención de generar un dictamen de la habilidad de los sustentantes. Esto último se relaciona con que, al ser un modelo de variables latentes, se asume que la respuesta de un sustentante a un reactivo depende únicamente del grado en que posee el atributo que se quiere medir (timss, 2003), en este caso su habilidad lectora o matemática. A través del cálculo de la dificultad, la discriminación y la pseudo-adivinación asociada a los ítems se puede describir la probabilidad de respuesta de los estudiantes y, por tanto, estimar su habilidad.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
132
Otra de las ventajas de realizar la equiparación partiendo de tri reside en el principio de invarianza, el cual reitera que la habilidad de los sustentantes no depende de la muestra de reactivos que les fueron presentados y, por su parte, los parámetros obtenidos de los reacti-vos son independientes a la distribución de habilidad de los sustentantes. Como resultado, la dificultad de las distintas versiones de la prueba puede variar moderadamente una de la otra siempre y cuando se cumplan los siguientes requerimientos: a) todas las versiones deben medir el mismo constructo y la confiabilidad de ambas debe ser similar; b) las puntuaciones escala obtenidas deben ser independientes de la prueba de referencia; c) las puntuaciones de ambos instrumentos pueden intercambiarse y d) la ecuación o tabla de equivalencia obtenida debe ser independiente del grupo de sujetos utilizados para derivarla (Angoff, 1984).
En el caso de enlace Media Superior, todas las pruebas Operativas y el Pretest se con-forman con reactivos que miden las mismas habilidades, cada uno de ellos tiene características específicas que no dependen del grupo de reactivos con los que es aplicado, y siempre se man-tiene el orden de presentación de los mismos para este factor no afecte el patrón de respuesta.
El Pretest se caracteriza por:•• 1. conformarse por una serie de cuadernillos, que en su conjunto constituye la prueba
operativa del año siguiente,•• 2. administrarse de manera matricial a una muestra controlada seleccionada bajo el método
de muestreo aleatorio estratificado unietápico (v. anexo V), y•• 3. ser útil para equiparar las pruebas año con año, pues a través de la aplicación de este
instrumento se obtienen los datos psicométricos de los reactivos que se anclan.
En el siguiente esquema se presenta de manera gráfica el proceso de equiparación.
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R133
Form
a 1
Form
a 2
Form
a 3
Form
a n
Mue
stra
Mue
stra
Mue
stra
Mue
stra
Form
a 1
Form
a 2
Form
a 3
Form
a n
Mue
stra
Mue
stra
Mue
stra
Mue
stra
2008
2009
2010
Prue
ba e
nlac
e M
edia
Supe
rior
200
8 (A
plic
ació
n Ce
nsal
)
Se o
btien
en lo
s pa
rám
etro
s es
tadí
stico
s a,
b y
c d
e lo
s re
activ
os
y se
fija
n pa
ra c
alib
rar
el
Pret
est 2
009
Se c
alib
ra fi
jand
o lo
s pa
rám
etro
s a,
b y
c d
e la
pru
eba
enla
ce M
edia
Su
peri
or 2
008
y se
ob
tiene
n lo
s pa
rám
etro
s a,
b y
c fi
jan
para
ca
libra
r la
prue
ba e
nlac
e M
edia
Sup
erio
r 20
09
Se c
alib
ra fi
jand
o lo
s pa
rám
etro
s a,
b y
c
del P
etes
t 200
9 y
se
obtie
nen
los
pará
met
ros
a, b
y c
que
se
fijan
par
a ca
libra
r el
Pre
test
201
0
Se c
alib
ra fi
jand
o lo
s pa
rám
etro
s a,
b y
c d
el
Pete
st 2
010
y se
ob
tiene
n lo
s pa
rám
etro
s a,
b y
c q
ue s
e fij
an p
ara
calib
rar
el P
rete
st 2
011
Se c
alib
ra fi
jand
o lo
s pa
rám
etro
s a,
b y
c d
e la
pru
eba
enla
ce M
edia
Su
peri
or 2
009
y se
ob
tiene
n lo
s pa
rám
etro
s a,
b y
c q
ue s
e fij
an p
ara
calib
rar l
a pr
ueba
enl
ace
Med
ia S
uper
ior
2010
Prue
ba e
nlac
e M
edia
Supe
rior
200
9 (A
plic
ació
n Ce
nsal
)
Prue
ba e
nlac
e M
edia
Supe
rior
201
0 (A
plic
ació
n Ce
nsal
)
Pret
est 2
009
(Apl
icac
ión
Mat
rici
al)
Pret
est 2
010
(Apl
icac
ión
Mat
rici
al)
Toda
la p
obla
ción
Toda
la p
obla
ción
Toda
la p
obla
ción
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
134
Escalamiento
Para poder equiparar las puntuaciones entre las distintas versiones de la prueba, es necesario ubicar los parámetros estimados en una escala común, a este procedimiento se le conoce como escalamiento. El método de escalamiento utilizado en este caso es una transformación lineal de los parámetros, es decir, teniendo como base los parámetros obtenidos de la primera versión de la prueba, se ajustan las puntuaciones de las siguientes pruebas a la escala común por medio de modelos lineales de aplicación sencilla y que no requieren transformaciones complicadas.
Para lograr la transformación lineal, hay que transformar cada uno de los tres paráme-tros en una escala común (Cook y Eignor, 1992):
Tomando como base el modelo de tres parámetros de la tri:
Dónde:Pi (θ) = Probabilidad de un examinado con una habilidad (θ) en contestar correctamente el reactivo ibi = Dificultad del reactivo iai = Discriminación del reactivo ici = Pseudo-adivinación del reactivo ie = Base de los logaritmos naturales (2,7183).
Transformamos los parámetros de habilidad de forma lineal a través del siguiente mo-delo lineal simple:
Dónde:θ*
a = a la habilidad del sustentante en escalaA = la pendiente de la transformación linealθa = a la habilidad del sustentante estimada en el modelo triB = es la raíz de la transformación lineal
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R135
Para el parámetro a (discriminación)
Dónde:a*
i = a la discriminación en escalaai = a la discriminación estimada en el modelo tri
Para el parámetro b (dificultad)
Dónde:b*
i = a la discriminación en escalabi = a la discriminación estimada en el modelo tri
Puesto que el parámetro c (pseudo- adivinación) se toma de la probabilidad de acertar el reactivo correctamente por el simple hecho de dar una respuesta, es localizado en el eje Y del modelo y no necesita ser transformado a la escala. Sin embargo, éste se fija para la calibra-ción ya que es parte de los parámetros con los que se obtienen las P(θ) de cada sustentante.
Igualación de calificaciones entre pruebas
Una vez que los parámetros son puestos en una escala común, las habilidades calculadas de los alumnos evaluados con ambas pruebas serán equivalentes, es decir si dos sustentantes en distintas aplicaciones, mostraran habilidades que los ubicaran dentro del mismo nivel de dominio (ver anexo VI), ambos poseen las habilidades equivalentes descritas en ese nivel.
Revisión de resultados
En primer lugar se realiza un análisis libre (sin estadísticos previos) de la prueba para obtener los parámetros estadísticos de los reactivos. Con este análisis se calcula correlación bivariada
MA
NU
AL
TÉCN
ICO
EN
LACE
MED
IA S
UPE
RIO
R
136
y se realizan gráficas de dispersión para los parámetros a, b y c. Asimismo se obtiene la habi-lidad de los sustentantes y se grafican en un histograma.
En segundo lugar se hace un análisis fijando los parámetros y se calcula nuevamente la correlación bivariada y se realizan gráficas de dispersión para los parámetros a, b y c y se obtiene la habilidad de los sustentantes y se corrobora la distribución de las habilidades a partir del ajuste de los parámetros equiparados.
Una vez que se ha equiparado la prueba de enlace Media Superior y se obtiene la habilidad de los sujetos, se asigna el nivel de dominio de acuerdo con los Puntos de Corte establecidos.
Referencias
• • • Brennan, R.J. (2006). Chained Linear Equating. casma Technical Note. Center for Advanced Studies in Measurement and Assessment. Universidad de Iowa: IA. Dispo-nible en http://www.education.uiowa.edu/casma/documents/clinearreport3.pdf
• • • Cook, L., & Eignor (1992). irt Equating Methods. items: The Instructional Topics in Educational Measurement Series, module 10 (fall 1991). Disponible en http://www.ncme.org/pubs/items/17.pdf
• • • Livingston, S. (2004). Equating Test Scores (Without irt). Educational Testing Service: Princeton, NJ.
• • • Moulton, N. (2007) One Ruler, Many Tests: A Primer on Test Equating. eds Publica-tions, disponible en http://www.eddata.com/resources/publications/
• • • timss (2003). Technical Manual. timms & pirls International Study Center, Lynch School of Education: Boston, MA.