os artigos de investigação do centro de estudos de gestão ... · b ceg-ist, centro de estudos de...
TRANSCRIPT
Os artigos de investigação do Centro de Estudos de Gestão do Instituto Superior Técnico (CEG-IST) destinam-se a divulgar os resultados da investigação realizada pelos seus membros. The working papers of the Centre of Management Studies of IST (CEG-IST) are aimed at making known the results of research undertaken by its members. Pedidos de informação sobre estes artigos, ou relativos a investigação feita pelo Centro devem ser enviados para: Enquiries about this series, or concerning research undertaken within the Centre should be sent to: Coordenador do CEG-IST Instituto Superior Técnico Av. Rovisco Pais, 1049-001 Lisboa Portugal e-mail: [email protected]
Artigo de Investigação / Working Paper
ISSN 1646-2955
Nº 2/2009
El enfoque MACBETH para la incorporación de temas transversales en la evaluación de
proyectos de desarrollo
Ramiro Sanchez Lopez, Carlos A. Bana e Costa
EL ENFOQUE MACBETH PARA LA INCORPORACIÓN DE TEMAS
TRANSVERSALES EN LA EVALUACIÓN DE PROYECTOS DE DESARROLLO
Ramiro Sanchez-Lopez a, b
Carlos A. Bana e Costa b, c
a KERMIT, Research Unit Knowledge-based Systems, Ghent University, Belgium
b CEG-IST, Centro de Estudos de Gestão do Instituto Superior Técnico, Universidade
Técnica de Lisboa, Portugal
c Department of Management, Operational Research Group, London School of
Economics, UK
RESUMEN:
Los esfuerzos de la Unión Europea para la cooperación al desarrollo están basados en el
principio de desarrollo humano sostenible, equitativo y participativo, lo que ha llevado a la
inclusión en las políticas de desarrollo de los llamados "temas transversales" (cross-cutting
issues): la promoción de los derechos humanos, la igualdad de género, la dimensión
medioambiental, la democracia como valor social y el empoderamiento de los beneficiarios de
las iniciativas de desarrollo, entre otros. En consecuencia, la evaluación de proyectos de
desarrollo debía pasar a incorporar operacionalmente dichos temas, cuestionando así la
adecuación de ciertas metodologías tradicionales, como el análisis Costo Beneficio, para
considerar la naturaleza intangible y cualitativa de las nuevas dimensiones de evaluación. Este
artículo describe cómo la metodología multicriterio MACBETH fue utilizada para ayudar a un
importante programa de desarrollo rural en Bolivia -PRAEDAC- a construir un sistema
específico para la evaluación de proyectos respecto a estos temas. El sistema fue diseñado a
través de una serie de entrevistas individuales y de conferencias de decisión llevadas a cabo
entre especialistas y técnicos de campo.
Palabras clave: análisis multicriterio, MACBETH, cooperación al desarrollo, evaluación de
proyectos, temas transversales.
2
1. INTRODUCCIÓN: CUESTIONES A RESPONDER
Según reportes de la OECD (cf. Brolin 2007), la Unión Europea es el mayor dispensador
de ayuda oficial al desarrollo (AOD), contribuyendo con más de la mitad del monto total
global. Sus esfuerzos para reducir la pobreza están sustentados en el principio de
desarrollo humano sostenible, equitativo y participativo (Comisión Europea, 2001), el
cual concibe a las personas como eje central y objeto del desarrollo, potenciando el
fortalecimiento de sus capacidades individuales y colectivas para que sean a la vez
diseñadores, actores y beneficiarios de los procesos de desarrollo.
El respeto al principio de desarrollo humano sostenible implica la inclusión, en
las políticas de desarrollo, de los llamados "temas transversales" (cross-cutting issues).
Estos hacen referencia a aspectos de interés general que han de tenerse en cuenta en
todos los niveles de intervención, y comprenden la promoción de los derechos humanos,
la igualdad de género, la dimensión medioambiental, la democracia como valor social y
el empoderamiento de los beneficiarios de las iniciativas de desarrollo, entre otros. La
relación entre los temas transversales y el desarrollo humano sostenible se muestra
claramente en el esquema de la Figura 1. Hoy por hoy −y formalmente desde que el
Consejo de la Unión Europea, el Parlamento Europeo y la Comisión Europea emitieran
el documento titulado "El Consenso Europeo para el Desarrollo" (European
Commission, 2006)− tales temas constituyen los lineamientos básicos obligatorios para
la implementación de los esfuerzos de cooperación de la Unión Europea.
FIGURA 1
Relación entre temas transversales y desarrollo humano sostenible, adaptada de (Gayraud y Quiroga,
2005)
Género
Derechos Humanos
Medioambiente
Participación / Empoderamiento
Equidady
crecimientoeconómico
DesarrolloHumano
Sostenible
Género
Derechos Humanos
Medioambiente
Participación / Empoderamiento
Equidady
crecimientoeconómico
DesarrolloHumano
Sostenible
3
Los temas transversales también han sido integrados en las iniciativas de
cooperación de la Unión Europea en Bolivia. Por ejemplo, en un importante programa
de desarrollo rural denominado PRAEDAC (Programa de Apoyo a la Estrategia de
Desarrollo Alternativo en el Chapare), financiado en su mayor parte por la Comisión
Europea, se pasó a incorporar desde 2003 cuatro temas transversales específicos
(PRAEDAC 2006): 1) el grado de participación ciudadana en los procesos de desarrollo,
2) la equidad de género, 3) el cuidado del medio ambiente y 4) el grado de garantía y
promoción de los derechos humanos. Los mismos debían ser incorporados en la
formulación y evaluación de proyectos de desarrollo independientemente de su
naturaleza, tamaño u objetivos.
En la Unión Europea, una de las metodologías de evaluación de proyectos más
utilizadas es el Análisis Costo Beneficio (European Commission, 1997). Sin embargo,
la naturaleza intangible y cualitativa de los temas transversales compromete la
conmensurabilidad monetaria de gran parte de los impactos de los proyectos de
desarrollo. Así pues, el Análisis Costo Beneficio no es adecuado para evaluar todos los
beneficios que el proyecto genera en términos de, por ejemplo, la equidad de género, el
grado de empoderamiento de la población, la potenciación de los derechos humanos o
los impactos medioambientales.
El Marco Lógico es también una técnica ampliamente utilizada en la
formulación y evaluación de programas y proyectos de desarrollo (EVO, 1997). Esta
técnica hace uso de los llamados "Indicadores Objetivamente Verificables", los cuales
deben permitir ser verificados en términos de calidad, cantidad y tiempo. En el contexto
del programa PRAEDAC, dicha técnica demostró ser de difícil aplicación. Las
instituciones de cooperación al desarrollo intervienen normalmente en áreas con escasa
infraestructura y población diseminada en vastas áreas de difícil acceso. Existe casi
siempre gran movilidad demográfica y escaso control censal sobre la población. Todo
ello ocasiona que el planteamiento de evaluar los proyectos de desarrollo mediante
indicadores de naturaleza estadística sea sumamente difícil y costoso, y por ello
inviable. Por este motivo, en el caso del PRAEDAC, el Marco Lógico se mostró
insuficiente para la evaluación de los proyectos respecto a temas transversales, motivo
por el cual se optó por crear un sistema específicamente diseñado para ese efecto.
4
El reto que planteaba la necesidad de crear un nuevo sistema de evaluación de
proyectos radicaba en:
I) Primero, la dificultad de encontrar medidas de desempeño que brinden información
sobre las bondades o los inconvenientes de los proyectos respecto a temas de naturaleza
cualitativa y multidimensional, tan poco tangibles y conmensurables en términos
monetarios. Esta dificultad a su vez encierra dos cuestiones a responder:
1) ¿Cómo traducir operacionalmente los temas transversales en criterios de
evaluación?
2) ¿Cómo describir cuantitativa o cualitativamente los diferentes niveles de
desempeño (impacto o performance) de los proyectos con respecto a tales
criterios?
II) Segundo, la dificultad de distinguir entre el desempeño de un proyecto y su valor
(atractivo o utilidad). Esta dificultad encierra otras dos cuestiones a responder:
3) ¿Cómo estimar el valor asociado a cada nivel de desempeño en cada criterio?
4) ¿Cómo evaluar globalmente un proyecto, teniendo en cuenta criterios de
diferente importancia para la comunidad?
Dado el tipo de problema que enfrentábamos, con cuatro temas transversales
bien definidos e intuitivamente multidimensionales, resultó muy conveniente utilizar el
enfoque multicriterio de evaluación. Desde esta perspectiva metodológica, es frecuente
encontrar instituciones de cooperación al desarrollo que dan respuestas técnicas a las
dificultades enunciadas, consistentes en atribuir discrecionalmente pesos a los criterios
de evaluación y puntos al desempeño de los proyectos en cada criterio, y enseguida
calcular puntuaciones globales por suma ponderada. Desafortunadamente, ciertos
procedimientos de ponderación y de puntuación muy utilizados en la práctica no
respetan las condiciones teóricas subyacentes a un modelo multicriterio de tipo aditivo
(Krantz et al. 1971; French, 1988; Keeney y Raiffa, 1993). Las buenas prácticas de
ponderación y puntuación están basadas en juicios de valor cualitativos o cuantitativos,
dependiendo de las técnicas utilizadas. Por ejemplo, SMART (Edwards y Barron, 1994)
requiere estimaciones numéricas directas, mientras que MACBETH (Bana e Costa y
5
Vansnick, 1994; Bana e Costa et al., 2003) requiere sólo juicios cualitativos de
diferencia de atractivo (valor), (cf. Bana e Costa y Chagas, 2004).
Este artículo describe cómo la metodología MACBETH fue utilizada para ayudar a
la Unidad de Gestión del PRAEDAC a crear un nuevo sistema multicriterio de evaluación
de proyectos. El proceso se llevó a cabo a través de una serie de entrevistas individuales
y de conferencias de decisión (Phillips y Bana e Costa, 2007) realizadas con cuatro
especialistas en temas transversales (uno de cada tema) y otros técnicos de PRAEDAC.
El artículo presenta en el apartado 2 las respuestas a las preguntas 1) y 2) planteadas
anteriormente, referidas a la etapa de estructuración del modelo; en el apartado 3
presenta las respuestas a las preguntas 3) y 4) referidas a la etapa de evaluación, es
decir, de construcción del modelo de evaluación propiamente dicho; finalmente, el
apartado 4 presenta las conclusiones del caso.
2. ESTRUCTURACIÓN
2.1. ¿Cómo traducir los temas transversales en criterios de evaluación?
Para facilitar la identificación de criterios por nuestros interlocutores, hicimos
uso de un procedimiento de estructuración de tipo "de arriba hacia abajo" (top-down),
(cf. Watson y Buede, 1987; von Winterfeldt y Edwards, 1986), que pasa por pedir al
especialista en cada tema transversal que describa de forma sucinta lo que para sí sería
un proyecto totalmente satisfactorio, designado como "prototipo" en (Sanchez-Lopez,
2005 y 2008), con respecto al tema de su especialidad. Posteriormente, se invita al
especialista a elaborar un texto explicativo del prototipo, tal que pueda ser sometido a
los comentarios de los otros especialistas con la finalidad de enriquecerlo con aspectos
importantes adicionales quizás dejados de lado en la concepción original. Este proceso
iterativo conduce a la reformulación definitiva del prototipo, de manera que cuente con
cierto grado de consenso grupal. Por ejemplo, en el tema transversal Participación, se
formuló el siguiente prototipo:
"El proyecto contempla un ‘nosotros inclusivo’, cuenta con mecanismos
democráticos para la resolución de conflictos y los actores cuentan con
6
capacidades desarrolladas y oportunidades que les permiten participar en los
procesos de desarrollo local" (Bazoberry Chali, 2005).
El siguiente paso es identificar cada uno de los conceptos contenidos en la frase
descriptiva del prototipo, los cuales serán utilizados como criterios de evaluación.
Como puede apreciarse, el prototipo de Participación contiene cuatro conceptos
diferentes: “un nosotros inclusivo”, “mecanismos democráticos para la resolución de
conflictos”, “actores con capacidades desarrolladas para participar” y “actores con
oportunidades de participar”. Se siguió un proceso similar para todos los temas
transversales, arrojando un total de 17 criterios de evaluación como se muestra en la
7
Figura 2.
Para completar el proceso, los cuatro especialistas elaboraron textos explicativos
de los pormenores de los criterios incluidos en sus respectivos temas (PRAEDAC 2005).
Estos textos fueron utilizados para verificar que los criterios no eran redundantes entre
sí y que cada uno de ellos era "aislable", es decir, que era posible evaluar el desempeño
de los proyectos en ese criterio, independientemente de los desempeños en los restantes
criterios. Por último, se concluyó que el conjunto de criterios estaba completo, dado que
los especialistas concordaron en que si dos proyectos tuvieran niveles de desempeño
idénticos en los 17 criterios no existiría ninguna razón adicional que justifique que
tengan valores globales diferentes.
9
2.2. ¿Cómo describir con respecto a cada criterio los diferentes niveles de desempeño de los
proyectos?
Dada la naturaleza intangible de los temas transversales, no es de extrañar que
los criterios de evaluación correspondientes estén compuestos por varias dimensiones
elementales interrelacionadas. Para describir adecuadamente los niveles de desempeño
en cada criterio, es necesario primero identificar las dimensiones más relevantes y
posteriormente describir cualitativamente subniveles de desempeño para cada
dimensión. Este es el punto de partida para la aplicación del proceso de construcción de
descriptores multidimensionales propuesto por Bana e Costa y Beinat (2005) y puesto
en práctica en otros contextos (cf. Bana e Costa et al., 2006 y 2008). Seguidamente, se
agrupan subniveles de dimensiones diferentes para componer niveles factibles de
desempeño y ordenarlos por orden de atractivo. Esto permite llegar finalmente a la
definición de una escala de evaluación (
Tabla 1).
TABLA 1
Proceso de construcción de descriptores multidimensionales
Pasos Tareas
Paso 1 Definir un conjunto discreto de niveles de desempeño relacionados con cada una de las dimensiones de evaluación.
Paso 2 Establecer todas las combinaciones posibles de los sub-niveles de las diferentes dimensiones de evaluación.
Paso 3 Identificar y eliminar las combinaciones no factibles.
Paso 4 Comparar el grado de atractivo de las combinaciones factibles y agrupar aquellas que son equivalentes. Esto requiere comparaciones holísticas de perfiles multidimensionales, lo cual puede involucrar un esfuerzo considerable de parte del evaluador. El proceso puede ser facilitado utilizando un proceso de comparación biunívoco.
10
Paso 5 Desarrollar la descripción semántica de cada nivel de desempeño factible, tan detalladamente y tan objetivamente como sea posible.
Por ejemplo, para el descriptor del criterio "Inclusión" del tema transversal
"Participación", el especialista identificó dos dimensiones a tener en cuenta: 1) ¿quiénes
son tomados en cuenta en la toma de decisiones? y 2) ¿cómo son incorporadas estas
personas en los procesos de toma de decisiones? Seguidamente, para cada una de las
dos dimensiones identificadas, el especialista formuló tres subniveles de desempeño
(X.1, X.2, X.3, y Y.1, Y.2, Y.3 respectivamente), ordenados de mayor a menor en cuanto a
su grado de atractivo. En la formulación de cada subnivel de desempeño se evitó en lo
posible el uso de términos ambiguos. La calidad del modelo de evaluación depende, en
gran medida, de la calidad de la redacción de cada uno de los subniveles de desempeño,
pues éstos servirán para estimar cuantitativamente el valor del proyecto.
11
Ejemplo: criterio "Inclusión" del tema transversal "Participación".
Dimensión X: ¿quienes?
Se toma en cuenta en la toma de decisiones...
• X.1 ...a los involucrados directos e indirectos, incluidas las fuerzas opositoras y los
grupos de involucrados que no están explícitamente identificados en el documento
de proyecto (como, por ejemplo, las asociaciones de transportistas o los grupos de
consumidores).
• X.2 ...sólo a los involucrados que determina la norma (por ejemplo, autoridades
municipales, técnicos y comité de vigilancia), o el diseño del proyecto (por ejemplo,
asociación de productores, o ente financiador).
• X.3 ...sólo a los involucrados que financian o administran el proyecto (es decir, se
sigue una racionalidad política o burocrática en la que participan sólo los dueños del
proyecto).
Dimensión Y: ¿cómo?
Se incluye a los involucrados...
• Y.1 ...de forma propositiva (es decir, es evidente la participación protagónica y
activa de los involucrados).
• Y.2 ...de forma pasiva (es decir, no existen mecanismos para motivar la
participación propositiva de los involucrados).
• Y.3 ...de manera instrumental (es decir, los diseñadores de proyecto presuponen los
intereses de los involucrados sin hacer validaciones de campo).
La combinación de dos subniveles de desempeño, uno de cada dimensión, da como
resultado una frase que describe cualitativamente el desempeño de un proyecto dado
respecto del criterio en cuestión. Por ejemplo, la concatenación de los sub-niveles X.1 e
Y.3 del criterio Inclusión da como resultado la siguiente frase:
12
Se toma en cuenta en la toma de decisiones a los involucrados directos e
indirectos, incluidas las fuerzas opositoras y los grupos de involucrados que no
están explícitamente identificados en el documento de proyecto (como, por
ejemplo, las asociaciones de transportistas o los grupos de consumidores) y se los
incluye de manera instrumental (es decir, los diseñadores de proyecto presuponen
los intereses de los involucrados sin hacer validaciones de campo).
El siguiente paso es formular todas las combinaciones posibles de sub-niveles de
desempeño, identificando aquellas combinaciones que no sean factibles y ordenando el
resto de mayor a menor según su grado de atractivo (
Tabla 2). Puede darse el caso de que dos o más combinaciones sean equivalentes y,
por tanto, formarán parte del mismo nivel de desempeño, como en el caso de los
Niveles D y E de la
Tabla 2.
TABLA 2
Combinación de subniveles de desempeño para la creación de niveles del descriptor
Dimensión: X
Sub-nivel: X.1
Sub-nivel: X.2
Sub-nivel: X.3
Combinaciones
(X.1, Y.1)
(X.1, Y.2)
(X.1, Y.3)
(X.2, Y.1)
(X.2, Y.2)
(X.2, Y.3)
(X.3, Y.1)
(X.3, Y.2)
(X.3, Y.3)
Niveles del descriptor
Nivel A: (X.1, Y.1)
Nivel B: (X.2, Y.1)
Nivel C: (X.1, Y.2)
Nivel D: (X.2, Y.2) ó (X.1, Y.3)
Nivel E: (X.3, Y.1) ó (X.3, Y.2) ó (X.2, Y.3)
No-factible: (X.3, Y.3) Dimensión: Y
Sub-nivel: Y.1
Sub-nivel: Y.2
Sub-nivel: Y.3
13
Finalmente, los niveles del descriptor son expresados en lenguaje común. En
este sentido, la Tabla 3 muestra la descripción de cada uno de los niveles de desempeño
del descriptor del criterio Inclusión.
TABLA 3
Descriptor del criterio Inclusión
Nivel A: (X.1, Y.1) Se toma en cuenta en la toma de decisiones a los involucrados directos e indirectos, incluidas las fuerzas opositoras y los grupos de involucrados que no están explícitamente identificados en el documento de proyecto (como, por ejemplo, las asociaciones de transportistas o los grupos de consumidores). Se incluye a los involucrados de forma propositiva (es decir, es evidente la participación protagónica y activa de los involucrados).
Nivel B: (X.2, Y.1) Se toma en cuenta en la toma de decisiones sólo a los involucrados que determina la norma (por ejemplo, autoridades municipales, técnicos y comité de vigilancia) o el diseño del proyecto (por ejemplo, asociación de productores o ente financiador). Se incluye a los involucrados de forma propositiva (es decir, es evidente la participación protagónica y activa de los involucrados).
NIvel C: (X.1, Y.2) Se toma en cuenta en la toma de decisiones a los involucrados directos e indirectos, incluidas las fuerzas opositoras y los grupos de involucrados que no están explícitamente identificados en el documento de proyecto (como, por ejemplo, las asociaciones de transportistas o los grupos de consumidores). Se incluye a los involucrados de forma pasiva (es decir, no existen mecanismos para motivar la participación propositiva de los involucrados).
14
Nivel D: (X.2, Y.2) Se toma en cuenta en la toma de decisiones sólo a los involucrados que determina la norma (por ejemplo, autoridades municipales, técnicos y comité de vigilancia) o el diseño del proyecto (por ejemplo, asociación de productores, o ente financiador). Se incluye a los involucrados de forma pasiva (es decir, no existen mecanismos para motivar la participación propositiva de los involucrados).
(X.1, Y.3) Se toma en cuenta en la toma de decisiones a los involucrados directos e indirectos, incluidas las fuerzas opositoras y los grupos de involucrados que no están explícitamente identificados en el documento de proyecto (como, por ejemplo, las asociaciones de transportistas o los grupos de consumidores). Se incluye a los involucrados de manera instrumental (es decir, los diseñadores de proyecto presuponen los intereses de los involucrados sin hacer validaciones de campo).
Nivel E: (X.3, Y.1) Se toma en cuenta en la toma de decisiones sólo a los involucrados que financian o administran el proyecto (es decir, se sigue una racionalidad política o burocrática en la que participan sólo los dueños del proyecto). Se incluye a los involucrados de forma propositiva (es decir, es evidente la participación protagónica y activa de los involucrados).
(X.3, Y.2) Se toma en cuenta en la toma de decisiones sólo a los involucrados que financian o administran el proyecto (es decir, se sigue una racionalidad política o burocrática en la que participan sólo los dueños del proyecto). Se incluye a los involucrados de forma pasiva (es decir, no existen mecanismos para motivar la participación propositiva de los involucrados).
(X.2, Y.3) Se toma en cuenta en la toma de decisiones sólo a los involucrados que determina la norma (por ejemplo, autoridades municipales, técnicos y comité de vigilancia), o el diseño del proyecto (por ejemplo, asociación de productores, o ente financiador). Se incluye a los involucrados de manera instrumental (es decir, los diseñadores de proyecto presuponen los intereses de los involucrados sin hacer validaciones de campo).
15
3. EVALUACIÓN
3.1. ¿Cómo estimar el valor asociado a cada nivel de desempeño en cada criterio?
3.1.1. Técnicas numéricas y no numéricas para la construcción de funciones de valor
El descriptor construido para un criterio dado hace posible definir el desempeño
de un proyecto, asociando al proyecto uno de los niveles de desempeño que conforman
el descriptor. Sin embargo, como se dijo en la introducción, una cosa es el desempeño
de un proyecto y otra distinta el valor o atractivo que tal desempeño tiene. Para lograr
medir el atractivo de los proyectos, se construye una función de valor para cada uno de
los descriptores. Para ello existen varias técnicas numéricas y no numéricas (cf. von
Winterfeldt y Edwards, 1986; Kirkwood, 1997; Belton y Stewart, 2002). Para el caso
que nos concierne, de descriptores conformados por un conjunto discreto de niveles de
desempeño, la "puntuación directa" (direct rating) (cf. von Winterfeldt y Edwards,
1986) es la técnica numérica más utilizada. Esta técnica consiste esencialmente en tres
tareas: 1) seleccionar dos niveles de anclaje para la escala de puntuación, generalmente
el mejor y el peor niveles de desempeño del descriptor; 2) asignarles valores numéricos,
digamos 100 y 0, respectivamente, y 3) pedir al evaluador (ya sea una persona o un
grupo) que asigne, a cada uno de los niveles restantes, un valor numérico que refleje su
atractivo con relación a los dos niveles de anclaje. La escala de puntuación final debe
ser tal que la diferencia de puntuación entre dos niveles de desempeño refleje (mida) su
diferencia de atractivo para el evaluador. En contraste, MACBETH es una técnica no
numérica que basa la construcción de funciones de valor en juicios cualitativos acerca
de la diferencia de atractivo entre cada dos niveles. MACBETH permite así evitar la
dificultad (cf. von Winterfeldt y Edwards, 1986 p. 210), o incomodidad cognitiva (cf.
Fasolo y Bana e Costa, 2009) sentida por ciertos evaluadores, al expresar sus juicios de
valor directamente en números.
3.1.2. El enfoque MACBETH
El proceso MACBETH está basado en preguntas y respuestas en forma de juicios
cualitativos acerca de la diferencia de atractivo entre cada dos niveles de un descriptor
dado. El evaluador es invitado a juzgar cualitativamente cuán grande es esa diferencia,
16
escogiendo una de las seis categorías semánticas MACBETH de diferencia de atractivo:
muy débil, débil, moderada, fuerte, muy fuerte y extrema. De ahí el origen de la
designación MACBETH: "Measuring Attractiveness by a Category Based Evaluation
Technique" (Midiendo el Atractivo mediante una Técnica de Evaluación Basada en
Categorías).
El software M-MACBETH (Bana Consulting, 2005), que implementa el enfoque
MACBETH, permite también expresar juicios por medio de varias categorías
consecutivas (por ejemplo, "diferencia de atractivo fuerte a muy fuerte"). Las respuestas
van alimentando la mitad superior de una matriz de juicios MACBETH, es decir, la mitad
que queda a la derecha de la diagonal principal.
Tomemos como ejemplo el criterio Inclusión. La Figura 3 muestra los juicios
cualitativos emitidos por el especialista, los cuales se referían a la diferencia de atractivo
entre los niveles de desempeño del descriptor respectivo. Partiendo de la diferencia
entre el primer nivel (el más atractivo) y el último (el menos atractivo), considerada
"extrema" por el especialista, éste comparó enseguida la diferencia de atractivo entre
cada dos niveles consecutivos del descriptor. De esta manera, se completó en primer
término la primera diagonal de la porción triangular superior de la matriz. Luego, se
pidió valorar la diferencia de atractivo entre el primer nivel con el tercero, el segundo
nivel con el cuarto, y así sucesivamente, rellenando de este modo la segunda diagonal
de la matriz. Al respecto (Bana e Costa y Chagas, 2004) presenta un proceso alternativo
que consiste en comenzar por los juicios de la última columna de la matriz (de arriba
hacia abajo), enseguida los de la primera fila (de derecha hacia izquierda) y, finalmente,
completar la primera diagonal de la matriz. Este segundo proceso fue utilizado para la
ponderación de los criterios (cf. Figura 4). Los dos procesos son tomados como válidos
en (Bana e Costa et al., 2008) y otros más pueden ser adoptados. De hecho, la secuencia
de las respuestas dependerá de la comodidad del evaluador, y no existe una regla
general para ello.
Consideremos un descriptor con m niveles de desempeño. La matriz MACBETH
correspondiente requeriría que se efectuasen en principio m(m-1)/2 juicios cualitativos.
Sin embargo, no es necesario efectuar todos los juicios de la matriz. Por ejemplo, la
matriz MACBETH de la Figura 3 muestra dos celdas que contienen el término "positiva",
17
lo cual significa que sólo se dispone de información ordinal entre los niveles
respectivos. También en este caso MACBETH hace posible obtener la función de valor.
De hecho, M-MACBETH es capaz de proponer una función de valor aún si se cuenta
únicamente con m-1 juicios acerca de la diferencia de atractivo entre niveles. Esto
correspondería, por ejemplo, a comparar un nivel con cada uno de los otros, lo cual
requeriría completar solamente la última columna o la primera fila de la matriz.
También podría compararse sólo los niveles consecutivos, lo cual requeriría completar
solamente la primera diagonal de la matriz. Sin embargo, la buena práctica recomienda
efectuar algunos juicios adicionales (Bana e Costa et al., 2008).
Con respecto a la interpretación de las categorías semánticas MACBETH, si bien
diferentes evaluadores pueden atribuir diferentes interpretaciones a una misma categoría
(por ejemplo, "fuerte" podría corresponder a diferentes sensaciones de diferencia de
atractivo para distintos evaluadores), lo cierto es que si la diferencia de atractivo entre
dos niveles se asigna a una categoría semántica superior respecto a la de otros dos
niveles (por ejemplo, "fuerte" y "moderada" respectivamente), entonces la función de
valor debe ser tal que v1-v2>v3-v4, donde v1, v2, v3, v4 representan los valores de los
cuatro niveles en cuestión.
A medida que el evaluador emite cada juicio y éste es introducido en la matriz,
el software M-MACBETH utiliza un algoritmo de programación matemática (cf. Bana e
Costa et al., 2005) para verificar automáticamente su consistencia con los juicios
precedentes y ofrecer sugerencias para resolver las eventuales inconsistencias
detectadas. Una vez que se ha obtenido una matriz MACBETH consistente, el software
propone una función de valor mediante la resolución de un programa lineal. La función
de valor se despliega en pantalla con el propósito de que el evaluador haga las
modificaciones que crea pertinentes en la posición relativa de los niveles. Para tal
efecto, M-MACBETH muestra gráficamente los límites dentro de los cuales el evaluador
puede variar el valor de un determinado nivel, respetando la información cualitativa que
ha sido introducida en la matriz.
FIGURA 3
Matriz MACBETH para el descriptor de Inclusión y su correspondiente función de valor
18
Volviendo al ejemplo, la Figura 3 muestra la función de valor final validada para
el criterio Inclusión. Se siguió el mismo procedimiento para construir las funciones de
valor de los restantes criterios de PRAEDAC. El proceso se desarrolló en una sola sesión
por cada tema transversal. En dicha sesión, el especialista del tema en cuestión
construyó las funciones de valor de los respectivos descriptores, guiado por el primer
autor de este artículo con soporte del software M-MACBETH (PRAEDAC 2005).
3.2. ¿Cómo evaluar globalmente un proyecto teniendo en cuenta criterios de diferente
importancia?
3.2.1. Ponderación de los criterios
Consideremos dos proyectos P1 y P2, tan atractivo uno como el otro en todos los
criterios excepto en dos; por ejemplo, los criterios Ejercicio de los Derechos Humanos
[Ejercicio] y Promoción de los Derechos Humanos [Promoción] del tema transversal
Derechos Humanos. Supongamos que el proyecto P1 tiene un desempeño
correspondiente al nivel más atractivo del descriptor de [Ejercicio] y al nivel menos
atractivo del descriptor de [Promoción]. En contraste, P2 tiene un desempeño
correspondiente al nivel menos atractivo del descriptor de [Ejercicio] y al nivel más
atractivo del descriptor [Promoción]. ¿Cuál de los dos proyectos contribuiría más a
(sería más importante para) el tema transversal Derechos Humanos? De la respuesta a
esta pregunta depende la relación entre las ponderaciones (p1 y p2) de los dos criterios.
Así, si la respuesta fuera favorable a P1, la ponderación de P1 debería ser mayor que la
ponderación de P2 y viceversa; y si la respuesta fuera que ambos proyectos implican la
misma contribución a los Derechos Humanos, las ponderaciones serían iguales.
Supongamos ahora que la respuesta es favorable a P1, esto es, P1 es globalmente más
19
atractivo que P2, luego p1>p2. No es difícil comprender que si el nivel más atractivo de
[Ejercicio] fuera significativamente más bajo en otro contexto, el proyecto más
favorable a los Derechos Humanos sería ahora P2, lo que implicaría la inversión del
orden de las ponderaciones. Esto evidencia por qué no se debe determinar pesos sin
hacer referencia a las escalas de desempeño, como cuando se pide comparar los criterios
directamente en términos de su importancia relativa. A esto Keeney (1992) llamó "el
error crítico más común".
Volviendo al ejemplo, los criterios fueron ponderados separadamente en cada
tema transversal por el especialista respectivo, siguiendo el procedimiento MACBETH de
ponderación. Para ilustrar el proceso, considérese el tema transversal Derechos
Humanos y sus cuatro criterios: Ejercicio de los Derechos Humanos, Promoción de los
Derechos Humanos, Priorización de necesidades básicas y Equidad en la asignación de
recursos. Se pidió al especialista considerar los cinco proyectos hipotéticos siguientes:
el proyecto hipotético [Menos atractivo], cuyo perfil de desempeño en Derechos
Humanos está formado por los niveles de desempeño menos atractivos en los cuatro
criterios, más cuatro proyectos hipotéticos [Ejercicio], [Promoción], [Priorización] y
[Equidad], cada uno de estos construido a partir de [Menos atractivo] cambiando el
desempeño del nivel menos atractivo al nivel más atractivo en el criterio respectivo.
Se pidió luego al especialista que ordene los proyectos hipotéticos del más
atractivo al menos atractivo en términos globales de Derechos Humanos, para
posteriormente comparar los proyectos de dos en dos, utilizando las categorías
semánticas MACBETH. Este proceso dio como resultado una escala de ponderaciones
MACBETH, de cuya discusión resultaron las ponderaciones finales de los criterios de
Derechos Humanos (Figura 4). Un proceso idéntico se utilizó para ponderar los criterios
de los otros tres temas transversales.
FIGURA 4
Ponderación MACBETH de criterios del tema transversal Derechos Humanos
20
Para completar la construcción del modelo de evaluación quedaba la ponderación de
los cuatro temas transversales entre sí, es decir, al nivel superior de la
21
Figura 2. Es importante resaltar que estas ponderaciones tienen una naturaleza
estratégica distinta a la naturaleza más técnica de las ponderaciones de los criterios al
interior de cada tema transversal. Por este motivo, las ponderaciones de los temas
transversales sobrepasaban el nivel de intervención de los especialistas, requiriendo
también y sobre todo la intervención de los responsables de los proyectos del PRAEDAC.
Por eso, la opción fue no determinar pesos precisos para los temas transversales (puesto
que se podría considerar desprovisto de sentido social) y dejarlos para una discusión
colectiva ulterior con soporte en un instrumento informático de análisis de sensibilidad,
cuya discusión escapa del alcance del presente artículo.
4. CONCLUSIONES
El modelo de evaluación así construido permitió programar un instrumento
informático, que PRAEDAC pasó a denominar "Sistema de Evaluación Rápida de
Proyectos respecto a Temas Transversales" (SER) (Sanchez-Lopez 2005). Para la
implementación del modelo en la gestión del PRAEDAC, la Unidad de Monitoreo planteó
una secuencia de trabajo con enfoque grupal y participativo orientada a la evaluación de
los proyectos y sus respectivas actividades (Gayraud, 2005):
• Paso 1: formulación técnica del proyecto y presentación a la Unidad de Monitoreo;
• Paso 2: evaluación del proyecto por parte de la Unidad de Monitoreo utilizando el SER;
• Paso 3: sesión de diagnóstico participativo entre la Unidad de Monitoreo y los
responsables técnicos del proyecto, en la que se discuten las conclusiones de la
evaluación y se definen de forma conjunta ajustes al proyecto;
• Paso 4: rediseño técnico del proyecto conforme a los ajustes requeridos;
• Paso 5: monitorización y evaluaciones in-itinere de la ejecución del proyecto
conforme a los resultados de la evaluación y los respectivos ajustes para la correcta
inclusión de los temas transversales.
El SER se implementó de esta forma a nivel de proyectos y actividades, permitiendo
que la Unidad de Monitoreo del PRAEDAC funcione como unidad de apoyo y
22
asesoramiento al personal técnico para la mejor incorporación de los temas
transversales. Según los propios técnicos de la Unidad de Monitoreo (Gayraud 2005),
la naturaleza descriptiva de las escalas de desempeño permitió dar las pautas para la
inclusión de los temas transversales en los proyectos, sin que sea necesario recurrir cada
vez a los servicios de un consultor especialista. El sistema funciona como "ayuda
memoria" que permite al responsable técnico del proyecto identificar por sí mismo
aspectos relevantes relacionados con los temas transversales. Adicionalmente, y pese a
no haber sido concebido de manera inicial con este propósito, la Unidad de Monitoreo
utilizó el SER en el diseño de los Planes Operativos Anuales y el Plan Operativo Global
del PRAEDAC. El sistema fue utilizado para identificar acciones específicas relacionadas
con los temas transversales, utilizando para ello los descriptores de los criterios
plasmados en el modelo. Las acciones fueron introducidas en la matriz de actividades de
los distintos componentes del PRAEDAC.
AGRADECIMIENTOS
Los autores agradecen la inestimable contribución de los especialistas en temas
transversales Guillermo Bazoberry Chali, Carlos Crespo Flores, Javier García Soruco y
Maria Lourdes Zabala Canedo. El presente estudio contó con el apoyo económico del
Consejo Interuniversitario Flamenco (VLIR) y de PRAEDAC.
REFERENCIAS
Bana Consulting (2005), M-MACBETH Versión 1.1: Guía del usuario, Lisboa, http://m-macbeth.com/downloads.html
BANA E COSTA, C. A. y E. Beinat (2005), "Model-structuring in public decision-aiding", Working Paper LSEOR 05.79, London School of Economics, London.
BANA E COSTA, C. A. y M. P. Chagas (2004), "A career choice problem: an example of how to use MACBETH to build a quantitative value model based on qualitative value judgments", European Journal of Operational Research 153(2): 323-331.
BANA E COSTA, C. A., J. M. de Corte y J. C. Vansnick (2003), "MACBETH", Working Paper LSEOR 03.56, London School of Economics, London.
BANA E COSTA, C. A., J. M. de Corte y J. C. Vansnick (2005), "On the mathematical foundations of MACBETH", J. Figueira, S. Greco y M. Ehrgott (eds.), Multiple Criteria Decision Analysis: State of the Art Surveys, Springer, New York: 409-442.
BANA E COSTA, C. A., T. G. Fernandes y P. C. Correia (2006), "Prioritization of public investments in social infrastructures using multicriteria value analysis and decision
23
conferencing: a case study", International Transactions on Operational Research 13(4): 279-297.
BANA E COSTA, C. A., J. C. Lourenco, M. P. Chagas y J.C. Bana e Costa (2008), "Development of reusable bid evaluation models for the Portuguese Electric Transmission Company", Decision Analysis 5(1): 22-42.
BANA E COSTA, C. A. y J. C. Vansnick (1994), "MACBETH – An interactive path towards the construction of cardinal value functions", International Transactions in Operational Research 1(4): 489-500.
BAZOBERRY CHALI, G. (2005), "La participación ciudadana en el desarrollo local", Responsabilidad social y desarrollo: análisis multicriterio para la evaluación de proyectos, PRAEDAC, Delegación de la Comisión Europea en Bolivia y Viceministerio de Desarrollo Alternativo del Gobierno de Bolivia, Cochabamba: 115-130.
BELTON, V. y T. J. Stewart (2002), Multiple Criteria Decision Analysis: an integrated approach, Kluwer Academic Publishers, Boston.
BROLIN, T. (2007), "The EU and its policies on development cooperation: a learning material", SADEV Working Papers, Swedish Agency for Development Evaluation, Karlstad.
Comisión Europea (2001), Comunicación de la Comisión al Consejo y al Parlamento Europeo: el papel de la Unión Europea en el fomento de los derechos humanos y la democratización en terceros países, COM(2001)-252-final, Comisión Europea, Bruselas.
EDWARDS, W. y F. H. Barron (1994), "SMARTS and SMARTER: improved simple methods for multiattribute utility measurement", Organizational Behavior and Human Decision Processes 60(3): 306-325.
European Commission (1997), Manual: Financial and economic analysis of development projects, Office for Official Publications of the European Communities, Luxembourg.
European Commission (2006), "The european consensus on development: the development challenge - joint statement by the Council and the representatives of the governments of Member States meeting within the council, the European Parliament and the Commission on European Union Development Policy: The European Consensus", Official Journal of the European Union 2006/C 46/01.
EVO (1997), Evaluación: una herramienta de gestión para mejorar el desempeño de los proyectos, Banco Interamericano de Desarrollo (BID), Oficina de Evalulación (EVO), Washington.
FASOLO, B. y C. A. Bana e Costa (2009), "Tailoring value elicitation to decision makers’ numeracy and fluency: expressing value judgments in numbers or words?" (enviado para publicación).
FRENCH, S. (1988), Decision theory: an introduction to the mathematics of rationality, Ellis Horwood, Chichester.
GAYRAUD, E. (2005), "Implementación del Sistema de Evaluación Rápida en el PRAEDAC", Responsabilidad social y desarrollo: análisis multicriterio para la evaluación de proyectos, PRAEDAC, Delegación de la Comisión Europea en Bolivia y Viceministerio de Desarrollo Alternativo del Gobierno de Bolivia, Cochabamba: 149-154.
GAYRAUD, E. y E. Quiroga (2005), "Promoviendo el desarrollo con responsabilidad social", Responsabilidad social y desarrollo: análisis multicriterio para la evaluación de proyectos, PRAEDAC, Delegación de la Comisión Europea en Bolivia y Viceministerio de Desarrollo Alternativo del Gobierno de Bolivia, Cochabamba: 11-21.
24
KEENEY, R. L. (1992), Value focused thinking: a path to creative decisionmaking, Harvard University Press, Cambridge.
KEENEY, R. L. y H. Raiffa (1993), Decision with multiple objectives: preferences and value tradeoffs, Cambridge University Press, Cambridge.
KIRKWOOD, C. W. (1997), Strategic decision making: multiobjective decision analysis with spreadsheets, Duxbury Press, Belmont.
KRANTZ, D. H., R. D. Luce, A. Tversky y P. Suppes (1971), Foundations of measurement, volume I: Additive and polynomial representations, Academic Press, New York.
PHILLIPS, L. D. y C. A. Bana e Costa (2007), "Transparent prioritisation, budgeting and resource allocation with multi-criteria decision analysis and decision conferencing",. Annals of Operations Research 154(1): 51-68.
PRAEDAC (2005), Responsabilidad social y desarrollo: análisis multicriterio para la evaluación de proyectos, Delegación de la Comisión Europea en Bolivia y Viceministerio de Desarrollo Alternativo del Gobierno de Bolivia, Cochabamba.
PRAEDAC (2006), 8 años en el desarrollo - Trópico de Cochabamba, Viceministerio de Desarrollo Alternativo del Gobierno de Bolivia y Delegación de la Comisión Europea en Bolivia, Cochabamba.
SANCHEZ-LOPEZ, R. (2005), "El Sistema de Evaluación Rápida de proyectos respecto a temas transversales". Responsabilidad social y desarrollo: análisis multicriterio para la evaluación de proyectos, PRAEDAC, Delegación de la Comisión Europea en Bolivia y Viceministerio de Desarrollo Alternativo del Gobierno de Bolivia, Cochabamba: 55-74.
SANCHEZ-LOPEZ, R. (2008), Evaluating development projects based on multiple intengible criteria: Theoretical framework and applications to coca producing regions of Bolivia, Ghent University, Ghent (http://biomath.ugent.be/~ramiro).
VON WINTERFELDT, D. y W. Edwards (1986), Decision analysis and behavioural research, Cambridge University Press, New York.
WATSON, S. R. y D. M. Buede (1987), Decision synthesis: the principles and practice of decision analysis, Cambridge University Press, Cambridge.