grupo de ingenierÍa lingÜÍstica instituto de...
Post on 31-Oct-2018
219 Views
Preview:
TRANSCRIPT
GRUPO DE INGENIERÍA LINGÜÍSTICAINSTITUTO DE INGENIERÍA
PLAN DE DESARROLLO DELGRUPO DE INGENIERÍA LINGÜÍSTICA
1999 2004
GERARDO SIERRA MARTÍNEZANTONIO REYES PÉREZ
CÉSAR ANTONIO AGUILARSONIA ELISA MORETT ÁLVAREZ
CARLOS FRANCISCO FONSECA ROJASITZIA EREDI BACA IBARRA
MÉXICO, D. F. NOVIEMBRE 2004
GRUPO DE INGENIERÍA LINGÜÍSTICA.......................................................................1I...............................................................................................................................................6Ingeniería Lingüística..............................................................................................................61. La ingeniería lingüística, historia, objetivos y relaciones...................................................6
1.1 Introducción..................................................................................................................71.2 Inteligencia Artificial, Procesamiento de Lenguaje Natural y LingüísticaComputacional..................................................................................................................101.3 Ingeniería lingüística: descripción y aplicaciones.......................................................12
2. Investigación.....................................................................................................................132.1 Universidades, Centros de Investigación e Institutos..................................................132.2 Ingeniería lingüística en el mundo..............................................................................132.3 Ingeniería lingüística en México.................................................................................14
2.3.1 UNAM..................................................................................................................142.3.2 IPN.......................................................................................................................152.3.3 INAOE.................................................................................................................16
3. Docencia............................................................................................................................163.1 Docencia en México....................................................................................................16
4. Desarrollos........................................................................................................................165. Eventos y difusión ............................................................................................................17II ...........................................................................................................................................18Grupo de Ingeniería Lingüística GIL....................................................................................181. Inicio.................................................................................................................................18
1.1 Conformación..............................................................................................................181.2 Objetivos....................................................................................................................181.3 Líneas de investigación...............................................................................................18
2. Proyectos...........................................................................................................................191. Corpus en ingeniería......................................................................................................192. Extracción terminológica..............................................................................................193. Extracción conceptual...................................................................................................194. Banco terminológico.....................................................................................................205. Paradigmas semánticos.................................................................................................206. Diccionario prototipo onomasiológico..........................................................................207. Diccionario integral.......................................................................................................208. Diccionario de lingüística..............................................................................................209. Proyecto ILEX...............................................................................................................2010. Diccionario de sexualidad...........................................................................................21
3. Desarrollos .......................................................................................................................213.1 DEBO..........................................................................................................................213.2 Clustering....................................................................................................................213.3 Banco terminológico...................................................................................................213.4 Página WEB................................................................................................................22
4. Publicaciones.....................................................................................................................224.1 Revistas.......................................................................................................................224.2 Libros..........................................................................................................................22
4.3 Conferencias................................................................................................................225. Integrantes.........................................................................................................................236. Estructura organizativa......................................................................................................23
6.1 Jefe de grupo...............................................................................................................246.2 Jefe de proyecto...........................................................................................................246.3 Jefe de área..................................................................................................................256.4 Coordinador de tarea...................................................................................................256.5 Derechos y obligaciones..............................................................................................25
7. Infraestructura...................................................................................................................267.2 Edificio 12...................................................................................................................267.3 Torre de ingeniería......................................................................................................267.4 Dirección postal...........................................................................................................26
8. Cómputo............................................................................................................................278.1 Hardware.....................................................................................................................278.2 Características.............................................................................................................278.3 Software .....................................................................................................................288.4 Sistema operativo y red...............................................................................................28
Plan de desarrollo..................................................................................................................291. Desarrollo futuro ..............................................................................................................29
1.1 Logística......................................................................................................................292. Difusión.............................................................................................................................30
2.1 Publicación de informes..............................................................................................302.2 Ponencias en congresos...............................................................................................302.3 Publicación de artículos..............................................................................................312.4 Conferencias de difusión.............................................................................................31
2.4.1 Facultades e Institutos en la UNAM....................................................................312.4.2 Instituciones de educación superior en el DF.......................................................322.4.3 Conferencias vía satélite.......................................................................................322.4.4 Secundarias y preparatorias..................................................................................32
2.5 Página WEB del GIL...................................................................................................322.6 Difusión en otros medios............................................................................................33
2.6.1 Boletín del Instituto de Ingeniería........................................................................332.6.2 Revistas y periódicos de difusión.........................................................................332.6.3 Radio y televisión.................................................................................................342.6.4 Conferencias a distancia.......................................................................................34
3. Capacitación y formación..................................................................................................343.1 Capacitación personal programada.............................................................................34
3.1.1 Lecturas................................................................................................................353.1.2 Exploración de técnicas y recursos de lingüística computacional.......................353.1.3 Colaboración en actividades del grupo................................................................353.1.4 Participación en proyectos...................................................................................353.1.5 Redacción de informes.........................................................................................363.1.6 Elaboración de tesis..............................................................................................363.1.7 Participación en congresos...................................................................................36
3.1.8 Redacción de artículos.........................................................................................373.2 Seminario interno........................................................................................................373.3 Cursos internos............................................................................................................373.4 Cursos externos...........................................................................................................383.5 Superación personal....................................................................................................38
3.5.1 Intercambio académico........................................................................................383.5.2 Estancias de investigación....................................................................................383.5.3 Continuación de estudios superiores....................................................................38
3.6 Capacitación encaminada a la docencia.....................................................................394. Docencia............................................................................................................................39
4.1 Cursos en la UNAM...................................................................................................394.1.1 Cursos conjuntos entre facultades........................................................................394.1.2 Integración de otras facultades a los cursos actuales...........................................394.1.3 Preparación de nuevos cursos..............................................................................404.1.4 Ingeniería lingüística como opción terminal de la licenciatura en Ingeniería enComputación.................................................................................................................40
4.2 Cursos a otras instituciones........................................................................................404.2.1 Cursos regulares a instituciones del DF...............................................................404.2.2 Cursos intensivos en provincia.............................................................................404.2.3 Cursos a la iniciativa privada...............................................................................414.2.4 Cursos a distancia.................................................................................................41
4.3 Diplomado..................................................................................................................414.3.1 Diplomado presencial ..........................................................................................414.3.2 Diplomado a distancia..........................................................................................41
5. Relaciones públicas...........................................................................................................42 5.1 Participación activa en congresos..............................................................................42 5.2 Intercambio académico..............................................................................................42 5.3 Participación en proyectos conjuntos de investigación..............................................43 5.4 Asociaciones...............................................................................................................44 5.5 Convenios...................................................................................................................44
6. Obtención de recursos.......................................................................................................45 6.1 Acervo bibliográfico..................................................................................................45
6.1.1 Compra de libros .................................................................................................466.1.2 Búsquedas de páginas WEB.................................................................................46
6.2 Recursos lingüísticos..................................................................................................466.2.1 Nuevos recursos...................................................................................................46
6.3 Financiamiento ..........................................................................................................476.3.1 Búsqueda de fuentes de financiamiento...............................................................476.3.2 Presentación de prototipos...................................................................................47
7. Crecimiento del GIL..........................................................................................................48 7.1 Búsqueda de nuevos integrantes................................................................................48
7.1.1 Servicio social......................................................................................................487.1.2 Becarios en proyectos...........................................................................................487.1.3 Tesistas.................................................................................................................49
7.1.4 Intercambio académico: profesores invitados y estudiantes de intercambio.......49 7.2 Mecanismos de promoción.........................................................................................50
7.2.1 Carteles y trípticos................................................................................................507.2.2 Página WEB.........................................................................................................50
7.3 Estímulos económicos................................................................................................507.3.1 Becas....................................................................................................................517.3.2 Honorarios............................................................................................................51
7.4 Búsqueda de mecanismos de integración...................................................................517.4.1 Codirección de tesis ............................................................................................51
7.5 Búsqueda de proyectos patrocinados.........................................................................51 7.6 Red de trabajo del GIL...............................................................................................52
7.6.1 UNAM..................................................................................................................527.6.2 Exterior.................................................................................................................52
7.7 Infraestructura............................................................................................................537.7.1 Espacio físico.......................................................................................................537.7.2 Equipo de cómputo..............................................................................................53
8. Consolidación de líneas de investigación..........................................................................53 8.1 Líneas existentes........................................................................................................54 8.2 Nuevas líneas de investigación..................................................................................54
8.2.1 Capacitación.........................................................................................................548.2.2 Búsqueda bibliográfica.........................................................................................548.2.3 Colaboración........................................................................................................55
9. Integración del GIL con el exterior...................................................................................559.1 Canalización de los miembros del GIL al mundo laboral...........................................559.2 CENTLIC....................................................................................................................56
APÉNDICE A.......................................................................................................................57 INSTANCIAS EDUCATIVAS Y DE INVESTIGACIÓN.................................................57
Instancias Educativas e Investigación...............................................................................571. América.........................................................................................................................572. Europa...........................................................................................................................653. Asia...............................................................................................................................844. África.............................................................................................................................885. Oceanía..........................................................................................................................88
APÉNDICE B.......................................................................................................................89DOCENCIA..........................................................................................................................89APÉNDICE C.......................................................................................................................90DESARROLLOS..................................................................................................................90APÉNDICE D.......................................................................................................................93ASOCIACIONES.................................................................................................................93APÉNDICE E........................................................................................................................94EVENTOS.............................................................................................................................94APÉNDICE F........................................................................................................................96PROYECTOS.......................................................................................................................96
1. Corpus en ingeniería......................................................................................................96
2. Extracción terminológica..............................................................................................983. Extracción conceptual...................................................................................................994. Banco terminológico...................................................................................................1005. Paradigmas semánticos...............................................................................................1016. Diccionario prototipo onomasiológico........................................................................1027. Diccionario integral.....................................................................................................1038. Diccionario de lingüística............................................................................................1049. Proyecto ILEX.............................................................................................................10610. Diccionario de sexualidad.........................................................................................108
APÉNDICE G.....................................................................................................................110BECARIOS ........................................................................................................................110
Técnicos Académicos......................................................................................................110Becarios en el Nivel PostDoctoral.................................................................................110Profesores invitados........................................................................................................110Becarios académicos.......................................................................................................111Becarios doctorales.........................................................................................................111Becarios de Maestría.......................................................................................................112Becarios de Licenciatura.................................................................................................113
APÉNDICE H.....................................................................................................................115GIL......................................................................................................................................115APÉNDICE I.......................................................................................................................119DIFUSIÓN..........................................................................................................................119
I
Ingeniería Lingüística
1. La ingeniería lingüística, historia, objetivos y relacionesEn las siguientes páginas se dará una descripción detallada de la disciplina que desde el año2000 se ha desarrollado en la UNAM, y en específico, en el Instituto de Ingeniería, laingeniería lingüística. De la misma forma, se ofrece al lector un panorama lo más amplioposible de este disciplina.
El trabajo está dividido en tres partes:1. Ingeniería lingüística2. Grupo de Ingeniería Lingüística (GIL)3. Plan de desarrollo del GIL
Los puntos abordados en la primera parte focalizan la integración como disciplina de laingeniería lingüística, así como el crecimiento que ha tenido, en primera instancia, a nivelinternacional, y luego, a nivel nacional. Asimismo se hace mención de los centros deinvestigación en ingeniería lingüística y en las disciplinas que la conforman, además de loscentros empresariales que han desarrollado productos que provienen de la investigación enesta rama.
También se señalan los medios de difusión, tales como revistas, libros, congresos,conferencias, etc., que a lo largo del desarrollo de la ingeniería lingüística han pugnado pordivulgar la disciplina que nos ocupa.
En la segunda parte se hace un recuento de la ingeniería lingüística como disciplinainteractiva dentro de la Universidad Nacional Autónoma de México. La creación yconformación de un grupo de profesionales que desarrollan y difunden esta disciplina através de un grupo denominado Grupo de Ingeniería Lingüística (GIL).
De este ente se destacan los objetivos, las líneas de investigación, la estructura organizativa,así como los proyectos en los que ha participado y los desarrollos y materiales que se handesprendido del trabajo del GIL a lo largo de cuatro años.
La tercera y última parte del trabajo hace énfasis en el desarrollo del GIL a futuro. Se hacemención de la infraestructura que a la fecha se ha conseguido y de las bases que sustentaránel desarrollo futuro.
Asimismo, al final del trabajo se presentan una serie de apéndices que complementan lainformación del cuerpo del trabajo.
1.1 IntroducciónSin duda, uno de los signos que caracteriza nuestro momento histórico actual, es la enormecantidad de información que se desplaza a través del lenguaje. Desde una conversaciónsimple entre dos personas hasta el uso de tecnologías como Internet, la producción, uso ycontrol de dicha información es parte de nuestras actividades cotidianas.
Dicha explosión informativa no es más que una extensión —dueña de una enormecomplejidad, por supuesto— de la función que tiene el lenguaje como un medio decomunicación e interacción. Su empleo, ya sea por medio de señas o de fórmulas ysímbolos escritos, nos permite explicar ideas y creencias. Nos ayuda a conversar, negociar,convencer y expresar nuestras necesidades a los demás. A través de él expresamos nuestrossentimientos y narramos nuestras vicisitudes diarias. Es la mejor herramienta paratransmitir nuestro conocimiento a otras generaciones. A lo largo de nuestra evolución, ellenguaje nos ha permitido alcanzar un nivel de desarrollo tal, que es difícil concebir a un serhumano impedido de cualquier capacidad o mecanismo que le permita dialogar con losdemás. No es gratuito llegar a pensar, según lo han manifestado investigadores como NoamChomsky, Jerome Bruner o Jean Aitchison, que el hombre puede ser definido como unmamífero articulado, es decir, como una criatura capaz de reconocer y organizar sonidos eimágenes como un medio de comunicación.
Esta idea en torno a la importancia que tiene el lenguaje sobre la condición humana no esnueva: Platón ya se plantea en un diálogo llamado Cratilo la posibilidad de que el lenguaje,o bien sea un invento hecho por los hombres para comunicarse entre sí, o bien es un donque los dioses les brindan, similar al que ellos emplean para interactuar entre ellos.
A partir de este tópico, a lo largo de la historia se puede rastrear una serie de reflexionesprofundas sobre el papel del lenguaje: desde las posturas nominalistas y realistas surgidasen la Edad Media; pasando luego a la elaboración de las primeras gramáticas renacentistasy modernas, las cuales se propusieron normalizar “el buen uso” de las lenguas europeas —como puede verse en los ambiciosos proyectos de intelectuales como Antonio de Nebrija,sólo por citar un caso—; hasta llegar a la fundación de una ciencia dedicada exclusivamentea su estudio, la lingüística, surgida de los aportes hechos por estudiosos del siglo XIX talescomo Humboldt, los hermanos Grimm y Hermann Paul, entre muchos otros, y finalmenteestructurada a partir de la seminal obra póstuma de Ferdinand de Saussure, Cours deLinguistique Générale.
Desde Saussure, la lingüística ha presentado por lo menos dos “cambios de paradigmas”radicales. El primero, surgido precisamente de las páginas del Cours..., es la concepción dellenguaje como un sistema de signos que siempre presenta dos caras: la lengua, es decir, lafaceta organizada que todos los individuos hablantes de un mismo idioma comparten entresí; y el habla, el rostro único por el cual estos individuos muestran sus rasgos particulares ycaracterísticos que los distinguen unos con otros. Lejos de las visiones evolucionistasdominantes a principios del siglo XX, las cuales buscaban dar con “la lengua original”madre de todos los idiomas; o de las aspiraciones normativas de las “gramáticas del buen
uso”, quizá la aportación más valiosa de Saussure a los estudios del lenguaje es haber dadolos cimientos más sólidos de su época para el nacimiento de una ciencia como lalingüística.
El segundo, situado entre las décadas de los cincuenta y los sesenta, es el que se conocecomo “la revolución chomskiana”, derivada de las propuestas formuladas por el lingüistanorteamericano Noam Chomsky, las cuales pueden seguirse a través de dos obrasfundamentales: Syntactic Structures (1957), y Aspects of the Theory of Syntax (1965). Enestos textos, Chomsky plantea la posibilidad de analizar el lenguaje como un sistemaformalizado el cual se sostiene a partir de tres elementos básicos: 1) un mecanismo mentalespecífico de carácter innato (la llamada competencia lingüística), 2) un conjunto deunidades simbólicas o caracteres que conforman expresiones (los cuales van desde sonidoshasta frases completas), y 3) un sistema de reglas finito que determina y regula lascombinaciones de dichos caracteres para producir expresiones más complejas (a lo que sedenomina gramática), dentro de los umbrales de la llamada competencia lingüística.
Si bien esto, a grandes rasgos, puede mantener cierta similitud con la propuesta queSaussure aportó en su Cours..., lo que Chomsky y sus continuadores han legado a lalingüística es el énfasis en tratar al lenguaje con una visión formalizada, paralela a losmétodos abstractos que emplea un matemático para generar y resolver un teorema. Estenivel de abstracción, hasta la fecha, ha brindado una serie de ideas valiosas sobre la funcióny uso del lenguaje en los seres humanos, e igualmente ha dado paso a lo que quizá sea eltercer paradigma dentro de las ciencias del lenguaje: la comprensión y producciónlingüística de sistemas computacionales autónomos.
En estrecha relación con la “revolución chomskiana”, dentro de las ciencias formalesempieza a surgir un área de investigación y desarrollo tecnológico que crecerá a pasosagigantados: las llamadas ciencias computacionales, integradas por una serie de campos desaber tales como la matemáticas, la lógica, las teorías de la información, la psicologíacognitiva y la propia lingüística. Al igual que los estudios sobre el lenguaje, las cienciascomputacionales tienen un origen antiguo. Entre las reflexiones que hace Descartes sobre lacapacidad del hombre de tener conciencia de sí mismo (el famoso cogito, ergo sum), estefilósofo se plantea la posible existencia de entidades vivientes carentes de un raciociniopropio, los llamados autómatas. Tales entes, si bien son incapaces de “pensar” y “actuar”de manera similar al hombre, sí pueden en algún momento “engañarnos” al imitar ciertasfunciones de éste, como por ejemplo caminar o mover un objeto.
Algunos años después, Blaise Pascal logra elaborar una máquina capaz de hacer cálculosmatemáticos, basada en un dispositivo de ruedas dentadas que mostraban caracteres del 0 al9, los cuales, al moverse, permitían hacer sumas. Es a partir de estos primeros pasos queempieza a vislumbrarse la posibilidad de crear máquinas inteligentes que puedan realizardeterminadas acciones de manera autónoma.
Si bien estas ideas eran fascinantes para el siglo XVII, no sería sino hasta casi finales delsiglo XIX cuando los británicos Charles Babbage y Augusta Ada Byron desarrollaron unmecanismo que era capaz de ejecutar cálculos matemáticos complejos, los cuales eranrepresentados en tarjetas perforadas y almacenados en una memoria que le ayudaba aalmacenar datos, así como un sistema de impresión que le permitía presentar los resultados.A pesar de que este proyecto no llegó a concretarse de forma física, los trabajos de Babbagey Byron sentaron las bases de lo que es hoy la computadora moderna.
Tras varios intentos, será a partir de la Segunda Guerra Mundial que se comienzan aproducir las primeras máquinas de cálculo electrónicas, algunas de las cuales seríanempleadas para descifrar códigos numéricos claves con información secreta. En esteperiodo, las teorías y experimentos de investigadores como Alan Turing, John Atanasoff,Clifford Berry o John von Neumann lograron consolidar el diseño de las primerascomputadoras electrónicas, tales como Colossus, UNIVAC o ENIAC. A partir de la décadade los sesenta, con el desarrollo de los circuitos integrados, se logra establecer sistemas dealmacenamiento y administración de datos más pequeños y más rápidos, lo que dará origena la creación de microprocesadores. Posteriormente, desde los setenta hasta nuestros días, eldesarrollo y uso de unidades de cómputo tendrá un crecimiento acelerado, tanto en eldiseño de elementos físicos (hardware), como también de sistemas lógicos (software).
Dentro de este último rubro, cobra una gran relevancia el hecho de implementar lenguajesde programación, es decir, los sistemas simbólicos de codificación de instrucciones queayuden a que una computadora pueda realizar una tarea específica. Si bien en un principiola escritura de programas representó un gran problema (por ejemplo, el pedir a unacomputadora que ordenara alfabéticamente una lista de nombres podría llevar varios días),hoy en día se ha avanzado enormemente en este punto, de modo que ahora se cuentan conparadigmas de lenguajes específicos para ejecutar funciones determinadas. El grado defineza con el cual se diseñan e implementan estos lenguajesmáquina, ha llevado a lasciencias de la computación a tomar y aplicar conceptos y procesos que la lingüística empleapara el análisis del lenguaje natural.
En este sentido, si bien se trata de un punto específico en el diseño y desarrollo en sistemasde cómputo, es claro ver que existe una relación estrecha —de ninguna manera gratuita —entre lingüística y computación: si partimos de la idea de concebir a una computadora (oretomando a Descartes, a un autómata) como una máquina capaz de realizar operacionescomplejas e interactuar con el hombre, es un requisito indispensable que tal máquina puedacomprender y generar un lenguaje lo más cercano posible al que emplean los humanos paracomunicarse entre sí. Este reto, difícil de suyo, es precisamente el problema del cual partenalgunas líneas de investigación, tanto en cómputo como en lingüística, junto con otrasciencias, las cuales son agrupadas bajo nombres tales como procesamiento o tratamientodel lenguaje natural, lingüística computacional o ingeniería lingüística.
1.2 Inteligencia Artificial, Procesamiento de Lenguaje Natural yLingüística Computacional
El hecho de que una computadora pueda comprender y producir un lenguaje natural, y porconsiguiente ejecutar los procesos cognitivos requeridos para realizar esta tarea—percepción, inferencia, causalidad, entre otros—, es algo que se liga a lo que en cienciascomputacionales se ha denominado como Inteligencia Artificial. La inteligencia artificial,grosso modo, puede ser definida como el área de investigación computacional que exploray desarrolla máquinas capaces de reproducir una conducta inteligente aplicada a laresolución de problemas, de modo que en algún momento pueda convertirse en un agenteautónomo. Un ejemplo de esto es quizá la imagen de una computadora como aquellafamosa Hal 9000 de Una Odisea Espacial 2001: pensemos en una máquina con losrecursos suficientes para mantener un diálogo con un ser humano, dentro de una situaciónespecífica (en el caso de la película, solicitar a dicha máquina un informe de actividades deuna nave en las últimas dos horas). Si bien esto es posible, para desarrollar un sistema querealice esta acción se tendría que en cuenta los siguientes puntos:
A. Elaborar un sistema de reconocimiento de voz, lo suficientemente preciso comopara distinguir un flujo sonoro que tenga similitud con una emisión lingüística.
B. Diseñar un sistema de procesamiento lingüístico que abarque todos los nivelesde descripción y análisis de una lengua, de modo que la máquina sea capaz dereconocer, interpretar y generar sílabas, palabras, oraciones y diálogosespecíficos.
C. Implementar una base léxica de conocimientos que le permita asignar a cadapalabra, frase o diálogo un significado específico.
D. Establecer un sistema de inferencia lógica que le ayude a mantener el hilo dedeterminado diálogo, o que le permita distinguir en qué momento se le planteaun tema, y en qué momento se cambia a otro.
E. Desarrollar un sistema de generación de voz, el cual esté estrechamente ligadocon los mecanismos anteriores, de modo que pueda, si es el caso, hacer unapregunta con una entonación precisa, que sea distinguible de la entonación quese emplea para dar una respuesta.
Estas cuestiones y su resolución no agotan el problema de lograr que una computadorapueda interactuar con una persona de forma inteligente y autónoma. La inteligenciaartificial actual se ha diversificado en diversas líneas de investigación enfocadas a aspectospuntuales sobre este proceso de interacción. Sin pretender agotar todas las líneas posiblesde investigación, se mencionan a continuación algunas de las más conocidas:
Visión: enfocada a desarrollar sistemas ópticos capaces de decodificar e interpretarimágenes o espacios propios de un medio específico.Aprendizaje: el hacer que una máquina logre desempeñar una actividad simplecomo tomar un lápiz, implica diseñar sistemas que faciliten su entrenamiento pararealizar esta labor. Tales sistemas de aprendizaje contemplan para su diseño
modelos cognitivos basados en el modo de organización del pensamiento humano,como las famosas redes neuronales, por citar un solo ejemplo.Sistemas de procesamiento y extracción de información: para que unacomputadora pueda tener conocimiento de un objeto o un hecho, necesita primeroadquirir datos sobre esto, para luego procesarlos y posteriormente contar con unainformación que sea útil para adquirir dicho conocimiento. Esto implica desarrollarsistemas que puedan ejecutar estos procesos de análisis e inferencia de maneraóptima.Sistemas expertos y de control: la intención en este rubro es generar sistemas quepermitan a una computadora administrar de manera eficiente una determinadaactividad (por ejemplo, controlar un conjunto de soldadoras dentro de una cadena deensamble para automóviles), por lo que se deben codificar una serie de reglas ymecanismos lógicos que le permitan ejecutar dicha tarea.Procesamiento del lenguaje natural: este último rubro se dirige a la elaboración yaplicación de modelos teóricos y herramientas computacionales capaces de analizar,comprender, reproducir y manipular lenguaje humano, es decir, lenguaje natural.
Dentro del campo que abarca el PLN, se ubican por lo menos dos grandes objetivos deanálisis, a veces difíciles de diferenciar del todo:
A. Por una parte, al considerar que una computadora puede ser en potencia una entidadcapaz de generar y comprender lenguaje natural, se puede deducir que para realizaresta labor es necesario pensar en una teoría lo suficientemente fuerte que permitamodelar (esto es, dar una descripción formal adecuada un fenómeno) dicho lenguajede manera clara y precisa. Así, se puede plantear la existencia de una ramaparticular del PLN dedicada a lograr este objetivo, denominada lingüísticacomputacional (LC). En síntesis, de acuerdo con James Allen (1995), la lingüísticacomputacional tiene por meta desarrollar una teoría computacional del lenguaje,empleando formulismos tales como algoritmos y estructuras de datos similares a losde una ciencia computacional.
B. Por otra parte, si bien es cierto que la concepción de modelos teóricoscomputacionales que aborden el estudio del lenguaje es importante, no lo es menosel hecho de desarrollar aplicaciones específicas que, basadas en dichos modelos,resuelvan necesidades específicas en un plano de implementación tecnológica. Deesta manera, el PLN requiere de otra rama enfocada precisamente a la evaluación eimplementación de dichos modelos en herramientas computacionales determinadasque ayuden al análisis, generación y comprensión de una lengua. A esta línea detrabajo se le conoce con el nombre de ingeniería lingüística (IL).
Ambas ramas, lingüística computacional e ingeniería lingüística, son dos caras de unamisma moneda. No es fácil poner límites entre una y otra, más que nada porque las dostienen como problema en común estudiar el lenguaje humano desde todas sus facetas
posibles, con el fin de lograr que una computadora sea capaz de interactuar usando dicholenguaje con seres humanos. Sin embargo, conviene sobre todo por cuestionesmetodológicas fijar una frontera en los modos y los fines inmediatos que dichas ramasbuscan: en el caso de la lingüística computacional, concebir y fundamentar modelosteóricos razonables que den cuenta computacionalmente de la naturaleza y funcionamientode un idioma; en el caso de la ingeniería lingüística, diseñar, probar e implementar sistemasde cómputo robustos que puedan generar y comprender una lengua de forma lo más similarposible al modo en como lo hacen las personas.
1.3 Ingeniería lingüística: descripción y aplicacionesRespecto a la IL, su desarrollo ha sido vertiginoso en los últimos años. Haciendo una brevereseña de su historia, se puede observar que el problema que dio origen a esta rama deinvestigación fue el hecho de crear aplicaciones que ayudasen a la traducción de textos deforma inmediata. Tal problema fue abordado inicialmente en Estados Unidos a partir de ladécada de los treinta, en paralelo con el diseño de sistemas de codificación y decodificaciónde claves militares secretas. A lo largo de la Segunda Guerra Mundial, y parte de la GuerraFría, el énfasis que puso el gobierno norteamericano en crear y lograr un funcionamientoeficiente de dichos sistemas de traducción fue sin duda notable, prueba de ello son lasmáquinas elaboradas por SmirnovTroyanskii en 1933, Weaver y Booth en 1946, así comoel demo fabricado por IBM en 1954, denominado Toy System.
2. InvestigaciónLa información, datos textuales y orales, modifican de manera sustancial nuestro mundo yla interacción que tenemos con éste. Actualmente, nos encontramos frente a un cambio quepodríamos llamar revolucionario, por su esencia radical, en el cual las tecnologías de baseinformática ofrecen a las personas un acceso instantáneo a la información en todo elmundo. Por tanto, en este cambio que se está generando, la función del lenguaje estámodificándose de forma más profunda que nunca y como consecuencia de esto surge lanecesidad de modelar este lenguaje para crear sistemas informáticos que dan la facilidad deexplotarlo.
Así, la ingeniería lingüística se ha convertido en un foco de atención en el contexto de lainformática y las comunicaciones al transformarse en el vínculo de comunicación entre losseres humanos y las máquinas. Todo esto con el propósito de hacer más amigable lainteracción del hombre con la tecnología.
En general, los objetivos de los proyectos de investigación en ingeniería lingüística semueven a través de la evaluación de la relaciones entre las nuevas tecnologías y servicios dela sociedad de la información, y de una manera muy especial, a aquellas que reúnen a laingeniería lingüística en tres dimensiones básicas: manipular y procesar información,
mejorar la comunicación hombremáquina y superar los problemas que representan lainteracción de lenguas en contacto.
2.1 Universidades, Centros de Investigación e InstitutosEn la actualidad en México, hay diversos centros que han impulsado la ingenieríalingüística, entre estos centros se encuentran el IPN, el INAOE, BUAP, y la UniversidadNacional Autónoma de México, en específico el Instituto de Ingeniería, organizandoconferencias, congresos y otras actividades profesionales y académicas para dar a conocer,difundir e impulsar la ingeniería lingüística. En el apartado 2.3 se da una breve descripciónde estos centros a nivel nacional.
2.2 Ingeniería lingüística en el mundoLa enorme necesidad de explotar la información existente en el mundo, principalmente enformato textual, hace de la investigación en ingeniería lingüística un asunto de sumaimportancia en los centros de investigación de varios países. Un claro ejemplo de esto es laUnión Europea, en donde se destina una buena parte de recursos económicos a lainvestigación en las industrias de la lengua.
Países como Estados Unidos y Canadá dedican esfuerzos para explotar la riqueza de laslenguas y crear recursos que satisfagan las nuevas y crecientes necesidades que representala era de la información.
La investigación en ingeniería lingüística no es sólo un asunto en boga, sino una necesidadde replantearse modelos de lengua que logren interactuar, a través del uso de lascomputadoras, con el hombre.
2.3 Ingeniería lingüística en MéxicoLas investigaciones en la aplicación de las computadoras a las tareas lingüísticas iniciaronen México en los años setentas, cuando el Dr. Luis Fernando Lara del Colegio de Méxicoaplicó las técnicas estadísticas para el análisis automático de un corpus de españolmexicano, con el fin de desarrollo de un diccionario de las palabras usadas en México.
En la misma institución hay investigadores que dedican sus esfuerzos y estudios a distintasáreas que se relacionan con la ingeniería lingüística; tal es el caso de Raúl Ávila que hatrabajado construyendo un corpus oral para una empresa televisiva; María Pozzi, quien hatrabajado en distintos proyectos desarrollando y explotando la disciplina terminológica;ente otros,
Además, diversos investigadores trabajan en diferentes instituciones en los temasrelacionados al Procesamiento de Lenguaje Natural –por ejemplo, el Dr. Héctor Jiménez
Salazar de la BUAP, Puebla; el M. en C. Everardo García Menier de la Universidad deJalapa, Ver., entre otros.
Para coordinar los esfuerzos de los grupos mexicanos que trabajan en el Procesamiento deLenguaje Natural, se está formando la Asociación Mexicana para el Procesamiento deLenguaje Natural (AMPLN).
En México existen varios grupos que activamente trabajan en las tecnologías de lenguaje,tanto en los aspectos prácticos como teóricos. Estos grupos ofrecen los estudios de Maestríay Doctorado, así como las oportunidades de colaboración en los proyectos aplicados. Parala difusión de los resultados y los problemas actuales de la investigación, anualmente seorganiza en México un congreso internacional de alto nivel.
A continuación se describen algunos centros a nivel nacional que desarrollan la ingenieríalingüística en distintos niveles.
2.3.1 UNAMEn 1989, se crea el Laboratorio de Sistemas Inteligentes de la UNAM en lo que hoy día esel CCADET por el Doctor Nicolás Kemper. Entre otros productos, este Laboratorio halogrado establecer una metodología de trabajo para el desarrollo de Sistemas Expertos yTutores Inteligentes. Además, cuenta con las herramientas necesarias de hardware ysoftware para desarrollarlos. Los Sistemas Inteligentes representan una disciplinatecnológica que permite resolver de manera eficiente muchos de los problemas quepresentan diversas áreas. Algunos de estos problemas tienen que ver con el diagnóstico,diseño, control, automatización y planeación presentes en procesos industriales, médicos,financieros, administrativos, etcétera. Por este motivo, el grupo que conforma esteLaboratorio orienta todo su esfuerzo hacia la investigación relacionada con la aplicación dela Inteligencia Artificial.
Aproximadamente en 1998, en el IIMAS de la UNAM se formó un grupo de investigaciónen lingüística computacional liderado por el Dr. Luis Pineda Cortés. El grupo haceinvestigación fuerte en los diálogos multimodales (los que emplean, adicionalmente allenguaje, también gestos, imágenes, etc.), así como en los formalismos gramaticalesmodernos, como HPSG. También ofrece los estudios de maestría y doctorado.
Dentro de la misma institución, sólo que bajo el seno del Instituto de Ingeniería se crea enseptiembre de 1999, liderado por el Dr. Gerardo Sierra, el Grupo de Ingeniería Lingüística(GIL), que representa un grupo de investigación en la que dos áreas, al parecer alejadas,retoman el sentido de unidad e interdependencia para formar un sólo núcleo. Estas áreasson la lingüística y la ingeniería.
2.3.2 IPNEn el 1996, en el CICIPN fue fundado el Laboratorio de Lenguaje Natural yProcesamiento de Texto.
En su historia de 8 años, el Laboratorio ha desarrollado varios proyectos científicos ytecnológicos y ha publicado en áreas como el análisis sintáctico y semántico, aprendizajeautomático de los recursos léxicos y compilación de diccionarios, minería de textos yresolución de anáfora. El Laboratorio ofrece los estudios de maestría y doctorado. Finalmente, como una parte de la infraestructura de la investigación en la lingüísticacomputacional en México, el Laboratorio de Lenguaje Natural del CICIPN, bajo lacoordinación del Dr. Alexander Gelbukh, anualmente (en febrero de cada año) organiza elCongreso Internacional de Lingüística Computacional y Procesamiento Inteligente deTexto. El congreso reúne a los más conocidos especialistas en esta rama de la ciencia paradar a los estudiantes mexicanos una oportunidad de escuchar a los mejores expertos delmundo. Las memorias del Congreso se publican por la casa editorial más prestigiosa,SpringerVerlag de Alemania, en la serie Lecture Notes in Computer Science.
2.3.3 INAOEEn 2002, un grupo muy prometedor –el laboratorio de tecnologías de lenguaje – se formóen el INAOE, Puebla. Está orientado a los proyectos prácticos. Entre sus intereses seencuentra la recuperación de información, la minería de textos, el procesamiento de habla.Parte de este grupo forma Manuel Montes, uno de los primeros doctores en lingüísticacomputacional formados en México, egresado del Laboratorio de Lenguaje Natural delCICIPN. El grupo también ofrece los estudios de maestría y doctorado.
3. DocenciaUna forma en la que el GIL ha manifestado su interés por dar a conocer la ingenieríalingüística en las nuevas generaciones ha sido mediante la impartición de clases,seminarios, cursos, etc. Este esfuerzo se ha visto reflejado en la integración del personalhumano del grupo, y en el creciente interés de gente por el área.
3.1 Docencia en MéxicoDesde la creación del GIL se ha hecho hincapié en la necesidad de fomentar el interés delos alumnos de distintas áreas en la ingeniería lingüística; la principal forma en que se haestablecido esta comunicación ha sido a través del diálogo y la interacción que se da alinterior de los salones de clase. En este sentido, un punto de suma importancia en eldesarrollo del GIL, y por consiguiente, de la ingeniería lingüística, está en la docencia.
La principal instancia en donde se ha difundido esta área dentro de la UNAM, es el II, através de la facultad de ingeniería y la facultad de filosofía y letras, así como en el CELE ylos posgrados en lingüística hispánica y aplicada y el posgrado en ciencias de lacomputación. Fuera de la UNAM instituciones como el CIC, el INAOE, la BUAP, laUDLA, y algunas otras, se han encargado de promover y difundir el área por medio decursos, talleres, conferencias, etc.
En el Apéndice B se detallan los cursos que, de forma directa e indirecta, se relacionan conla ingeniería lingüística y que se los miembros del GIL han impartido en distintas instanciaseducativas.
4. DesarrollosGran parte de los esfuerzos que se han hecho en la investigación realizada en ingenieríalingüística ha dado bastantes frutos, muestra de ello es la creciente demanda que losproductos que surgen de estas investigaciones tienen, sea en ámbito educativo, deinvestigación, empresarial o de uso doméstico.
Desde correctores ortográficos, pasando por interfaces de diálogo entre hombre ycomputadora, hasta los sistemas que generan conocimiento a partir de la información, sehan originado una gama bastante amplia de recursos y desarrollos que involucran laingeniería lingüística. En el Apéndice C se muestran algunos de los desarrollos que diversasinstancias educativas y empresas han creado.
5. Eventos y difusión La difusión de los avances en las investigaciones o la presentación de resultados sonprincipios fundamentales para el desarrollo y crecimiento de cualquier área, en este sentido,los eventos para difundir la ingeniería lingüística y los medios impresos que detallan lostrabajos de la gente involucrada en esta área son numerosos y aumentan en importancia conla participación de más gente que desde distintos ángulos aborda las problemáticas querepresenta la aplicación de la lengua a los sistemas informáticos.
En el Apéndice E se da una lista de los eventos más importantes relacionados con laingeniería lingüística, así como, los eventos próximos que se llevarán a cabo en forosnacionales e internacionales.
II
Grupo de Ingeniería Lingüística GIL
1. InicioEl Grupo de Ingeniería Lingüística (GIL) surge formalmente en el mes de agosto del año1999. Su fundador, el doctor Gerardo Sierra Martínez es invitado por la secretaríaacadémica del Instituto de Ingeniería de la UNAM a reintegrarse al grupo de profesionalesdedicados a la investigación dentro de esta casa de estudios, con el propósito deimplementar y, posteriormente, desarrollar el área de la ingeniería lingüística.
1.1 ConformaciónLa conformación del área dentro de la UNAM despertó el interés de jóvenes estudiantes dedisciplinas tanto científicas como de humanidades que empezaron a integrarse comoservidores sociales, becarios, tesistas, etc., a esta nueva área interdisciplinaria.
En la actualidad el grupo humano de trabajo del GIL se conforma de un par deinvestigadores, un técnico académico, estudiantes de licenciatura, maestría y doctorado,además de profesores e investigadores invitados.
1.2 ObjetivosEl objetivo principal del cual parte el desarrollo y la plataforma de investigación del grupoes el de implantar el área de ingeniería lingüística en un centro de investigación nacionalpara darla a conocer, difundirla y formar profesionales dedicados al estudio de lasdisciplinas que integran el área de ingeniería lingüística.
1.3 Líneas de investigaciónLas líneas que guían los proyectos de investigación del GIL parten del proyecto central delGIL, que consiste en desarrollar la plataforma computacional y la estructura lingüística paracrear un diccionario onomasiológico.
De entre las áreas más explotadas por el GIL se encuentran:• terminología y terminótica• bancos terminológicos• lingüística de corpus• lexicología y lexicografía
• análisis morfológico, sintáctico y semántico.• interfaces hombre – computadora, etc.
2. ProyectosA continuación se describen algunos de los proyectos en los que el GIL ha tenidoparticipación. Cabe destacar que sólo se da una breve descripción de cada proyecto endonde no se profundiza sobre los alcances de los mismos, ni sobre las líneas deinvestigación que se han desprendido de cada uno de ellos y que se han retomado pormiembros del GIL.
1. Corpus en ingenieríaEn este proyecto se elaborará un corpus sobre las diferentes áreas de la ingeniería, sebuscará abarcar todas sus ramas: eléctrica, electrónica, civil, mecánica, etc. El corpus seráelaborado a partir de una colección de textos especializados en las diferentes áreas deingeniería. Información específica del corpus estará disponible para su consulta, de modoque pueda ser utilizado con fines de investigación para extraer información lingüística en elárea de ingeniería.
2. Extracción terminológicaElaboración de un diccionario electrónico para la búsqueda de términos a partir delconcepto en el campo de la física a nivel bachillerato: etapa de captura de datos. En esteetapa se diseñará 1) la base de datos terminológica que permita tanto capturar ágilmente lainformación de los diccionarios electrónicos, como vaciar los datos para integrar la base deconocimientos léxica del diccionario onomasiológico; 2) se buscarán los términoscorrespondientes mediante una análisis de frecuencias de las palabras en textos de física anivel bachillerato.
3. Extracción conceptualSentar las bases lingüísticas necesarias para el desarrollo de una herramienta capaz deextraer automáticamente contextos definitorios a partir de la estructura, más o menosrecurrente, de las definiciones en donde se localizan tanto términos como el marcodefinitorio de éstos.
4. Banco terminológicoDiseñar un banco terminológico a partir de bases de datos de textos de especialidad. Coneste banco se pretende ofrecer una herramienta disponible a través de la Web sobre distintasáreas terminológicas con el fin de realizar investigación a distintos niveles.
5. Paradigmas semánticosMejorar y adaptar para el español el algoritmo de clustering para generar, de formaautomática, paradigmas semánticos a partir del alineamiento de definiciones.
6. Diccionario prototipo onomasiológicoElaborar las bases para la búsqueda onomasiológica de términos en las que se contemplatambién la posibilidad de búsquedas semasiológicas.
7. Diccionario integralReunir la investigación desarrollada en los proyectos del GIL, además de aprovechar losrecursos creados en cada investigación, para crear un diccionario potente que permitabúsquedas inteligentes, a partir de la integración de los sistemas onomasiológicos ysemasiológicos.
8. Diccionario de lingüísticaEl objetivo general del proyecto es la elaboración de un diccionario integral del área delingüística que permita encontrar tanto los conceptos que se utilizan para los diferentestérminos (diccionario semasiológico), como los términos que existen para describir losconceptos (diccionario onomasiológico). Este proyecto se trabaja en forma conjunta con elInsitito de Investigaciones Filológicas de la UNAM.
9. Proyecto ILEXEl objetivo general del proyecto es la construcción de una interfaz confiable, amigable,ergonómica y robusta para el manejo de información lexicográfica con buscadoresinteligentes que le permitan al usuario múltiples tipos de consulta (por hipertextos,semasiológica, onomasiológica, ideológica, etc.), a la vez que contenga valores agregadosque hagan atractivo el uso del diccionario (juegos de palabras, aprovechamiento demultimedios, etc.).
10. Diccionario de sexualidadSe propone la construcción de varios diccionarios dirigidos a diferentes públicos. Cadaproducto se hará disponible al público en CD y en línea, a través de Internet. El objetivogeneral que se persigue con este producto es “promover una cultura de la sexualidadapoyada en información amplia y objetiva”.
Además de los proyectos que arriba se señalan, el GIL trabaja en la búsqueda de nuevosproyectos patrocinados a través de los cuales se obtengan recursos de interés y aplicación anivel investigación, docencia, consumo, etc.
3. Desarrollos En esta sección se dará una breve descripción de los sistemas desarrollados por miembrosdel GIL, y que han servido como plataformas de investigación aplicada en los distintosproyectos en los que el GIL ha participado.
3.1 DEBOSe elaboró el diseño general del diccionario y se realizó un sistema prototipo, denominadoDEBO1, por sus siglas de Diccionario Electrónico de Búsqueda Onomasiológica. Estesistema permite la búsqueda de 33 términos relativos al área de fenómenos destructivos; elproceso se realiza mediante la introducción del concepto en lenguaje natural.
3.2 ClusteringEste sistema2 permite generar, por medio del alineamiento de definiciones, grupos depalabras que posiblemente puedan funcionar como sinónimos sin que léxicamente lo sean.El sistema corre sobre bases terminológicas de distintas áreas, tanto para inglés como paraespañol y se ejecuta desde cualquier página Web.
3.3 Banco terminológicoCon este desarrollo3 se ofrecen herramientas de análisis lingüístico sobre distintas áreasterminológicas, así como la consulta de información especializada en áreas como la física,la lingüística, la sexualidad, etc.
3.4 Página WEBEs el portal4 del GIL para dar a conocer las investigaciones y trabajos que realiza, losresultados obtenidos, los desarrollos a que tienen acceso personas externas al GIL, así comolas publicaciones y eventos del grupo; además, a través de este medio se mantieneinformada y actualizada a la comunidad interesada en las diversas áreas de la ingenieríalingüística.
1 Para ejecutar esta aplicación siga la siguiente liga:http://tabasco.torreingenieria.unam.mx/Debo/Diccionario.html2 Para ejecutar esta aplicación siga la siguiente liga:http://tabasco.torreingenieria.unam.mx/scripts/clusters.exe/home3 Para consultar el banco terminológico siga la siguiente liga:http://iling.torreingenieria.unam.mx/diccionarios/4 Para consultar esta página siga la siguiente liga: http://iling.torreingenieria.unam.mx/
4. PublicacionesA continuación se citan algunos de los foros de difusión e investigación que han permitidodifundir los trabajos del GIL tanto a nivel nacional como internacional.
4.1 Revistas• Lecture Notes in Computer Science.• Computational Linguistics and Intelligent Text Processing.• International Journal of Lexicography.• Terminology.• Journal of Quantitative Linguistics.• Estudios de Lingüística Aplicada.• IITF Journal, Terminology Science & Research.
4.2 Libros• Practical Applications in Language and Computers PALC 2003. Peter Lang,
Alemania, 2004.• Proc. VIII Simposio Iberoamericano de Terminología (ISBN 9583340227).
Iberoamericana de Terminología RITerm, Cartagena, Colombia, 2002.• Computational Linguistics and Intelligent Text Processing. Colección en Ciencias
de la Computación, Alexander Gelbukh (ed.), Springer, Berlin, 2002• Computational Linguistics and Intelligent Text Processing. Fondo de Cultura
Económica, México, 2002.
4.3 Conferencias• V Coloquio de Lingüística en la Escuela Nacional de Antropología e Historia.• 1° Encuentro de Estudiantes de Literatura y Lingüística de la Universidad Nacional
Autónoma de México.• VII Congreso Nacional de Lingüística (AMLA).• Panel on Lexical Markers of Common Grounds. 8th International Pragmatics
Conference.• VII Encuentro Internacional de Lingüística en el Noroeste.• The Fourth North American Symposium on Corpus Linguistics.• VIII Simposio Iberoamericano de Terminología.• II Taller Internacional de Procesamiento Computacional del Español y Tecnologías
del Lenguaje.• IX Congreso Internacional EURALEX 2000.• XVIII Congreso Internacional Coling2000.
5. IntegrantesEl desarrollo y crecimiento del GIL ha traído consigo un aumento en el número de personalhumano interesado y dedicado al área. Del año 2000 en el que sólo trabajaban en el áreacuatro personas, incluido su fundador, a las más de veinticinco que en la actualidad estánregistradas como parte del GIL, se desprende el auge que ha tenido el área y el interés quedespierta en los estudiantes por incursionar en áreas interdisciplinarias que no encasillan lainvestigación de sus disciplinas, ya sea humanísticas o científicas, en los tradicionalesderroteros.
La interdisciplinariedad que la ingeniería lingüística representa y los niveles deaplicabilidad de la investigación que se desprenden de ésta, son puntos importantes deseñalar como fuente de atención para las nuevas generaciones de jóvenes investigadores delpaís. Toda la información referente a antecedentes, publicaciones, intereses, etc., del grupohumano de trabajo del GIL puede consultarse en el Apéndice H e I.
6. Estructura organizativaLa reorganización del GIL obedece al crecimiento sustantivo en el número de losintegrantes del grupo y de las actividades en desarrollo y a futuro, a la vez que es posiblegracias a la maduración e intereses personales de los participantes. Se toman como base lospuntos señalados en el apartado 1.2, con lo que se cumplen los objetivos fundamentales delGIL: formar investigadores y realizar investigación básica y aplicada en el área deingeniería lingüística.
La estructura está encabezada por el denominado “jefe del GIL”, quien es responsablegeneral de la coordinación del grupo, lo representa y busca el desarrollo y crecimientointegral del grupo. Las actividades del GIL se centran en dos rubros generales: desarrollodel GIL y desarrollo de proyectos. Para el desarrollo del GIL, el jefe del GIL se apoya enlos “coordinadores de tareas”, quienes son los responsables por el cumplimiento de lasactividades de apoyo a las funciones del GIL. En cuanto a los proyectos de investigación,estos son coordinados por los “jefes de proyecto”, quienes son responsables ante elpatrocinador, administran el presupuesto y coordinan el proyecto.
Para lograr el desarrollo de los diferentes proyectos bajo la responsabilidad de los jefes deproyecto, se cuenta con el apoyo de los jefes de área, a quienes se les delega la coordinaciónespecífica de parte de los proyectos y se les otorga plena confianza para que desarrollen lasinvestigaciones necesarias de manera responsable y comprometida. A su vez, cada uno delos coordinadores de tarea y jefes de área cumplen con sus responsabilidades a través de lasactividades realizadas por los “estudiantes”, a quienes se encargarán de guiar y por quienesserán responsables del cumplimiento satisfactorio de sus actividades.
6.1 Jefe de grupoLas tareas del jefe del GIL son:
• ser el responsable general de la dirección del GIL;• definir las estrategias generales;• administrar los recursos obtenidos para el grupo;• ser el coordinador general de los diferentes proyectos;• aprobar a los jefes de proyecto y las propuestas de los proyectos, congruentes con
los objetivos del GIL.
6.2 Jefe de proyectoLas tareas del jefe de proyecto son:
• ser el responsable ante el patrocinador por el proyecto;• definir la propuesta de proyecto de acuerdo con los intereses del GIL, sujeta a la
aprobación del jefe del GIL;• avalar y responsabilizarse de inicio a fin por el desarrollo del proyecto (desde la
propuesta hasta la entrega de los informes y resultados finales);• hacer los ajustes necesarios al desarrollo del proyecto, suprimiendo o definiendo
nuevas actividades;• manejar el presupuesto del proyecto;• tener el crédito meritorio del proyecto en las publicaciones, desarrollos de sistemas
y todos los productos resultantes;• designar, en caso necesario, previo acuerdo con el jefe del GIL, un nuevo jefe de
proyecto sustituto, ya sea de duración temporal o permanente;• coordinar la totalidad del proyecto;• tener la visión general del proyecto; • definir, designar y cambiar a los jefes de área para su(s) proyecto(s);• dar lineamientos a los jefes de área sobre las actividades específicas a realizarse; • intervenir directamente con los estudiantes, en caso necesario, para asesorarlos y
reorientarlos.
6.3 Jefe de áreaEl jefe de área tendrá que:
• ser responsables de los proyectos específicos a su cargo;• documentarse sobre su trabajo para cumplirlo con el alto nivel esperado para el buen
logro del proyecto;• diseñar, bajo la aprobación y en coordinación del jefe de proyecto, sus estrategias y
designar, a su vez, a los responsables por llevar a cabo las actividades específicas;• reportar periódicamente al jefe de proyecto del avance de sus actividades;• recibir los créditos correspondientes, adjunto al jefe de proyecto;• ser responsables de los estudiantes asignados para la realización de las tareas;
• definir actividades específicas que sean realizables por los estudiantes;• supervisar el trabajo de los estudiantes orientándolos en los problemas que tengan.
6.4 Coordinador de tareaLas tareas del coordinador de tarea son:
• apoyar las funciones del GIL;• actuar en nombre del grupo y representar al jefe del GIL en las tareas
encomendadas.
6.5 Derechos y obligacionesCada miembro del GIL tiene los siguientes derechos y obligaciones:De los estudiantes:
• realizar las actividades encomendadas por un superior (jefe del GIL, jefe deproyecto, coordinador de tarea o jefe de área):
• tener a su cargo un número pequeño de actividades sustanciales que realizarán demanera cotidiana para el bien del GIL o de los proyectos;
• cumplir con las tareas urgentes encomendadas de corta duración, dadas porcualquier superior;
• reportar a su superior de las actividades encomendadas; y,• obtendrán créditos de su trabajo cotidiano en los sistemas que desarrollen o en las
publicaciones en las que participen.
De los profesores invitados y colaboradores externos• participar en los proyectos conjuntos con el GIL;• tener las mismas funciones y atribuciones que los jefes de proyecto, en el caso de
una estancia permanente durante el periodo del proyecto; y,• tendrán beneficios económicos por su participación en las actividades del GIL;• tendrán los créditos correspondientes por su participación en los proyectos.
De todos los integrantes del GIL• realizar las actividades necesarias en beneficio del GIL;• tener a su cargo un número pequeño de actividades sustanciales que realizarán de
manera cotidiana para el bien del GIL o de los proyectos; y,• podrán utilizar los recursos del GIL para su labor en el grupo y su desarrollo
profesional, previa autorización del jefe del GIL;• podrán realizar su tesis a partir de los resultados obtenidos de su trabajo en el GIL;• podrán impartir clases;• podrán ser reconocidos por su participación en el GIL;• tendrán los créditos correspondientes en la página WEB, publicaciones y
desarrollos;
• podrán dar la referencia a su trabajo en el GIL por el tiempo que participen.• recibirán remuneración económica cuando se acuerde y existan las posibilidades.
7. InfraestructuraEl espacio físico de trabajo con que cuenta el GIL se encuentra bajo la jurisdicción delInstituto de Ingeniería (II) de la UNAM. A continuación se enumeran los centros deinvestigación en donde se han desarrollado los trabajos del GIL.
7.2 Edificio 12El primer centro de investigación en donde se empezó a desarrollar la ingeniería lingüísticaestá ubicado en el Edificio 12 del II, Bernardo Quintana. El área fue adscrita a lacoordinación de sistemas, coordinación a la cual pertenece en la actualidad.
Este espacio fue utilizado desde el segundo semestre de 1999 hasta la fecha.
7.3 Torre de ingenieríaEn la actualidad el espacio físico en el que labora el grupo humano del GIL se encuentraubicado en el basamento de la Torre de Ingeniería (TI), cubículo 3. El motivo base por elcual se trasladaron las instalaciones del GIL a este edificioa radica en el hecho de organizary participar en proyectos que tengan un patrocinio externo a la UNAM y al CONACYT,convirtiéndose en un grupo que genere recursos humanos, materiales y económicos al II, ala UNAM, y a México.
7.4 Dirección postalLa siguiente es la dirección postal del GIL:
Basamento, Torre de Ingeniería. Cubículo 3.Ciudad Universitaria, Apartado Postal 70472Coyoacán, México, D.F. Código postal 04510 Teléfono 52 (55) 56 23 35 00 ext 1008 y 1009Fax 52 (55) 56 22 81 37
8. CómputoEl equipo de cómputo con que cuenta el GIL ha ido en constante crecimiento yactualización gracias a la participación en diversos proyectos que generan los recursoseconómicos para adquirir los equipos.
A continuación se describen las características más importantes del equipo de cómputo delgrupo.
8.1 HardwareEl número total de equipos del GIL es:
• diez computadoras de escritorio, • dos scanners,• una estación de trabajo
Además de cuatro equipos portátiles, que no son parte del hardware propio del GIL sino demiembros que pertenecen al grupo.
En meses próximos está pendiente la entrega de dos computadoras de escritorio, unaportátil y un scanner.
8.2 CaracterísticasLas características de cada equipo del GIL se describen en las siguientes tablas:
Procesadores Velocidad DiscosDuros
Mem.RAM
2 procesadores UltraSPARCII 250, 300 o 400MHz 4 de XX Gb
Tabla 1: Características de la estación de trabajo
Procesador Velocidad Cap. Disco 1 Cap. Disco 2 Mem. RAMPentium 3 550 Mhz 10 Gb 20 Gb 256 mbPentium 3 866 Mhz 30 Gb 512 mbPentium 3 996 Mhz 30 Gb 384mbPentium 4 2.4 Ghz 40 Gb 40 Gb 256mbPentium 3 996 Mhz 30Gb 512 MbPentium 4 2.4 Ghz 40 Gb 40 Gb 512 MbPentium 4 2.4 Ghz 40Gb 40 Gb 512 Mb
Tabla 2: Características de las PC's de escritorio del GIL
8.3 Software El software con que cuenta el GIL se describe en la siguiente tabla:
Dirección IP OFFICE ACROBAT MESSENGER JSDK VISUALBASIC
SECURESHELL
OMNIPAGE
132.248.231.56
132.248.231.36 XP (2002)vers. 10.5
6.0 6,1 1.4.2 6.0 3,2
132.248.231.40 XP (2002)vers. 10.5
6.0 6,1
3,2 12
132.248.231.38 XP (2002)vers. 10.5
6.0 6,1 1.4.1 3,2
132.248.231.37 XP (2002)vers. 10.5
6.0 6,1 1.4.2 6.0 3,2
132.248.231.41 XP (2002)vers. 10.5
6.0 6,1 1.4.2 3,2
132.248.231.60 XP (2002)vers. 10.5
6.0 6,1 1.4.2 3,2
132.248.53.59 XP (2002)vers. 10.5
6.0 6,1
3,2
132.248.156.167 XP (2002)vers. 10.5
6.0 6,1
3,2
132.248.156.164 XP (2002)vers. 10.5
6.0 6,1
Tabla 1: Software del GIL
Recursos lingüísticos Recursos computacionalesEuroWordnet NLTK
DRAE PitónDiccionario Clave Perl
Diccionario de María Moliner Edit PlusDiccionario Vox XML Writer
Diccionario Larousse MySQLDiccionario Longman JavaDiccionario Collins PHP
Fonetizador para el español
Tabla 2: Software especializado para el desarrollo de la investigación del GIL
8.4 Sistema operativo y redA continuación se describe en la tabla 4, los sistemas operativos de los equipos y surespectiva IP:
Dirección IP Nombre SistemaOperativo
Version S.O.Secundario
Version
132.248.53.41 ayax.iingen.unam.mx Solaris 8.0
Tabla 3: Sistema operativo e IP de estación de trabajo
Dirección IP SistemaOperativo
Version S.O.Secundario
Version
132.248.231.56 Suse 132.248.231.36 Win 2000 5.0 132.248.231.40 Win XP Pro 5,1 Pendiente Pendiente132.248.231.38 Win XP Pro 5,1 SUSE 9.1132.248.231.37 Win XP Pro 5,1 SUSE 9,1132.248.231.41 Win XP Pro 5,1 SUSE 9,1132.248.231.60 Win XP Pro 5,1 SUSE 9,1
132.248.53.59 Win XP Pro 5,1 SUSE 9,1 132.248.156.167 Windows XP 5,1 SUSE 9.1132.248.156.164 Windows XP 5,1 SUSE 9.1
Tabla 4: Sistemas operativos e IP de PC's.
III
Plan de desarrollo
1. Desarrollo futuro Para lograr el objetivo de crecer es indispensable contar con bases firmes y sólidas quepermitan partir de ellas; si contamos con estas bases es mucho más justificada la proyecciónfutura. En el GIL se ha trabajado arduamente a lo largo de cinco años para crear las basesque nos permitan proyectar un desarrollo sustentado en el trabajo de estos años, que a la veznos hace pensar en proyectos más grandes y en un próspero futuro.
En esta tercera parte señalaremos cómo vislumbramos este desarrollo a futuro, a partir delas bases y trabajo que a la fecha hemos realizado. Nos enfocamos a las estrategias dedifusión, captación y crecimiento que se ha planteado el grupo para volverse un ente mássólido y más preparado en el ámbito de la investigación; y bosquejamos los nuevosproyectos y objetivos que pretendemos realizar en un futuro cercano.
1.1 LogísticaCon el fin de cumplir de la mejor forma el desarrollo a futuro del GIL, éste tiene, comoparte de su logística, una infraestructura humana y de equipo capaz de realizar las tareascolectivas y específicas que requiere este desarrollo. Entre los principales avances que sehan dado para este desarrollo, está la reestructuración del grupo que se menciona en elapartado 6 (Estructura organizativa) de la parte 2. Cuenta además con un acervobibliográfico lo suficientemente extenso y especializado para sustentar el desarrollo de lasinvestigaciones, así como el equipo de cómputo y los recursos lingüísticos ycomputacionales convenientes para lograr este objetivo.
Además de lo anterior, el GIL cuenta con el recurso más importante que cualquier entenecesita para crecer, un grupo humano de trabajo bastante amplio y extendidocomprometido con el grupo y con el área. Sin duda, éste es el mayor recurso del GIL, susmiembros.
2. DifusiónGran parte del trabajo del GIL desde su conformación ha consistido en difundir el área deingeniería lingüística en espacios universitarios y externos a la UNAM. Este trabajo harepresentado un impulso y motivación para continuar con el trabajo que se desarrolla en elGIL dado que ha habido un eco muy importante, tanto a nivel estudiantes como a nivelentidades, de gente interesada en integrarse y trabajar o participar en el área.
Buena parte de este trabajo se ha realizado a través de medios de difusión escritos, ya sea enrevistas, boletines, carteles, etc., y otra parte se ha realizado en foros de discusiónespecializados y no especializados, tales como congresos, seminarios, talleres, etc., tanto anivel nacional como internacional.
En seguida destacamos las principales estrategias por las cuales el GIL hace y seguiráhaciendo una labor de difusión de la investigación básica y aplicada que sus miembrosrealizan.
2.1 Publicación de informesComo parte de la capacitación y desarrollo de todos los integrantes del grupo, el GILpromueve la redacción de materiales en donde se reporten los problemas y dificultades,tanto como los avances, resultados, bibliografía y demás puntos que puedan parecerimportantes de cada parte del proyecto. Este trabajo, además de servir como estrategia paraque los integrantes se vean más involucrados en la redacción de sus investigaciones, resultaun material bastante útil para que tanto nuevos como viejos integrantes del GIL, tengan unmaterial básico para empaparse de la investigación que se hace en el grupo.
2.2 Ponencias en congresosDe la misma forma en que es importante tener material de consulta impreso o en formatoelectrónico, es igual de necesario estar presente en foros que discutan las nuevas tendencias,los problemas, los avances y demás, de la investigación que se hace fuera del GIL. En estesentido, todos los miembros del grupo tienen el incentivo de mostrar su trabajo en forosnacionales e internacionales; los eventos principales se concentran en los congresosespecializados, en donde el GIL ha tenido una fuerte y constante participación, no obstante,no descuidamos la participación en talleres y seminarios que también han representadovaliosas participaciones para el grupo.
En el futuro tenemos considerado continuar con este tipo de participaciones en distintosforos, incluyendo a la nueva gente que se ha incorporado al grupo y que viene realizandomás investigación.
2.3 Publicación de artículosOtra estrategia de difusión del trabajo del GIL, y por supuesto, de incentivo para susmiembros, es la publicación en medios especializados, nacionales e internacionales, deltrabajo que realizan. A la fecha, es interesante la producción de artículos incluidos en variosmedios arbitrados y especializados, esto demuestra el valor y calidad de la investigaciónque viene desarrollando el GIL.
La lista completa de congresos, artículos y material desprendido de la investigaciónrealizada por los miembros del GIL puede consultarse en el rubro Publicaciones de lasiguiente liga: http://iling.torreingenieria.unam.mx/
2.4 Conferencias de difusiónUn medio más de difusión que el grupo ha explotado es el de la docencia como medio dedifusión e información, así como las conferencias, pláticas y reuniones entre estudiantes einvestigadores.
A continuación se desglosa cómo se ha trabajado en este rubro.
2.4.1 Facultades e Institutos en la UNAMActualmente el GIL imparte cursos regulares a nivel licenciatura en la facultad deingeniería y en la facultad de filosofía y letras, así como cursos a nivel posgrado en losprogramas de posgrado de lingüística y de ciencias de la computación.
La meta del GIL es poder extender este tipo de cursos a otras entidades dentro de la mismaUNAM y en campus internos y externos a CU. Para lograrlo contamos con una base depersonal que se ha ido capacitando en las distintas ramas de la ingeniería lingüística y queya cuenta con experiencia impartiendo clases bajo este disciplina en la UNAM y fuera deella.
2.4.2 Instituciones de educación superior en el DFHasta el momento el trabajo de difusión que se ha realizado ha llegado a algunasinstituciones fuera de la UNAM, tal es el caso de la Escuela Nacional de Antropología eHistoria (ENAH) en donde se imparte la materia de lingüística computacional, y el InstitutoFrancés de América Latina (IFAL) en donde se da una orientación a la disciplina dematerias como semiótica, además de la Universidad Iberoamericana, en donde se hanimpartido cursos de traducción asistida por computadora.
En un futuro se tiene le intención de llegar a otras instituciones de educación superior,como el Tecnológico de Monterrey o la Universidad de la Américas, para ofrecer cursossobre la ingeniería lingüística.
2.4.3 Conferencias vía satéliteEn el grupo nos hemos dado cuenta de que en un gran número de ocasiones resultaimposible estar en lugar en donde se imparten cursos o conferencias de interés; hemostenido la experiencia de gente que necesita una introducción, y luego, una capacitación en
ingeniería lingüística, y que por motivos de distancia, y en consecuencia, económicos y detiempo, no pueden trasladarse a los eventos que les son necesarios.
En este sentido, en el grupo se ha planteado la posibilidad de aprovechar la infraestructuracon que cuenta la UNAM para llevar a más lugares el trabajo que desarrollamos. Lasconferencias vía satélite son un buen comienzo para esta tarea que pretendemos llevar acabo en un futuro cercano.
2.4.4 Secundarias y preparatoriasOtro medio al que pensamos poner atención para el futuro de la ingeniería lingüística lorepresentan los jóvenes. Tanto secundarias como preparatorias son un objetivo al cualpretendemos llegar por medio de pláticas sencillas e introductorias a la disciplina. Con esto,pretendemos crear el interés de los jóvenes por involucrarse, a futuro, en la disciplina quedesarrollamos en el instituto de ingeniería.
2.5 Página WEB del GILEl Internet es quizá hoy en día el medio más rápido y eficaz para comunicarnos y saber quépasa en el mundo y en lo que a nosotros nos interesa. En el GIL este aspecto siempre se hatenido muy presente, muestra de ello es la página del grupo que está en línea en la direcciónhttp://iling.torreingenieria.unam.mx/.
En este sitio los navegantes pueden encontrar información básica y especializada sobre laingeniería lingüística, además del trabajo que se ha desarrollado en el GIL en estos cincoaños de vida. Sin embargo, pretendemos no sólo contar con un sitio interesante que déinformación sobre el GIL y sobre la ingeniería lingüista; en el grupo buscamos crear unportal que sea el medio que represente y contenga la información básica y más recientesobre la ingeniería lingüística en México y en el extranjero, de la misma forma queconstituya el medio de consulta idóneo y el foro de discusión más sólido para la comunidadinteresada en la disciplina. También buscamos con este portal, ofrecer nuestros productos einvestigación a las entidades gubernamentales tanto como a la iniciativa privada.
Actualmente se está trabajando en este portal, el cual estará pronto en línea. Algunospuntos, además de los que se mencionaron más arriba, que se están puliendo para ofreceruna mejor consulta del portal son:
DiseñoLook and FillActualizaciónProgramas disponiblesLinks, etc.
2.6 Difusión en otros mediosAdemás de los ya mencionados, por la naturaleza de nuestro trabajo y las características delpúblico al que pretendemos acceder son medios importantes de difusión los existentes ennuestra universidad. Asimismo, pretendemos ir acercándonos a los medios masivos.
2.6.1 Boletín del Instituto de IngenieríaEl Instituto de Ingeniería cuenta con un boletín interno que nos ha abierto el espacio parapublicar información de diferente tipo, conforme a sus propias secciones. En él existe laposibilidad de hacer invitaciones a los eventos organizados por el GIL, así como depublicar reseñas una vez efectuados éstos. También tiene secciones que dan cuenta de losalumnos graduados y de los profesores visitantes, además se pueden enviar pequeñosartículos sobre los proyectos en los que se trabaja dentro del instituto.
2.6.2 Revistas y periódicos de difusiónA partir de la experiencia de la publicación sistemática de la invitación a las actividadesrelacionadas con el 2º Seminario de Ingeniería Lingüística, organizado por el GIL; en laGaceta UNAM, vemos que debemos acceder a más revistas, si no especializadas enmaterias afines, sí dirigidas a cierto público potencialmente interesado en las actividadesque se promueven.
Un espacio reciente que surge con el fin de difundir todo lo relacionado con la ingenirríalingüística y sus ramas es la revista (por ahora electrónica) de la Asociación Mexicana deProcesamiento de Lenguaje Natural (AMPLN), de la que el GIL es miembro fundador.
Los casos de promoción en periódicos han sido mínimos, pero son importantes y debenprocurarse.
Por otra parte, hemos encontrado eco en servidores de correo electrónico masivos y deavisos como el de la Asociación Mexicana de Lingüística Aplicada y de la UNAM,respectivamente.
2.6.3 Radio y televisiónEl radio y la televisión constituyen actualmente los medios masivos de comunicación másextendidos y con un público más heterogéneo, por lo que se considera importante poderacceder a ellos, en primera instancia a los universitarios.
El propósito de este tipo de difusión es diferente al que se tiene con las presentaciones enlos medios anteriormente mencionados. Su carácter sería informar a la comunidad de losresultados más relevantes del trabajo del grupo de manera concisa, con un lenguaje sencilloy accesible para cualquier persona.
2.6.4 Conferencias a distanciaHasta el momento no hemos impartido este tipo de conferencias, pero las proyectamos en elfuturo inmediato debido a que existe una demanda de capacitación fuera del grupo que sepodría satisfacer de este modo para economizar recursos. Tal es el caso del reciente vínculocon el Instituto Tecnológico Superior de Misantla, Veracruz, después de una visita deestudiantes al Instituto de Ingeniería, su instituto nos ha solicitado algunos cursos.
Consideramos viable esto debido a que la UNAM cuenta con la infraestructura necesariapara ésta y otras actividades de difusión masiva de información con la utilización derecursos multimedia, como el laboratorio IXTLI.
3. Capacitación y formaciónUn aspecto muy importante para la consolidación de la ingeniería lingüista dentro y fuerade la UNAM es que haya gente capaz de investigar, difundir y trabajar en el área. Paralograrlo, en el GIL se han diseñado una serie de estrategias que solventen la tarea degenerar material humano capacitado y comprometido con el área.
3.1 Capacitación personal programadaEste tipo de capacitación se realiza bajo esquemas previamente estructurados ycalendarizados de manera periódica. El objetivo principal es dar a conocer las actividadesrealizadas por cada uno de los integrantes del grupo con sus compañeros de trabajo, asícomo establecer lazos de cooperación con otros grupos de trabajo e incluso con otrasinstituciones de investigación.
3.1.1 LecturasSon lecturas recopiladas desde antes de la fundación oficial del GIL, el principal objetivode su difusión es establecer un marco teórico dentro del cual se desarrolla dicho grupo, deesta manera se pretende que cada uno de los integrantes que participan en los diferentesproyectos, tengan al menos una idea general y panorámica del área.
Estas lecturas sirven como material de apoyo escrito para las clases impartidas tanto en laslicenciaturas como en posgrado, y además de cumplir las expectativas antes mencionadas,cada vez que una persona pretende integrarse al grupo de trabajo, se busca que estosmateriales presenten de manera formal el o las áreas que el interesado pretenda conocer mása fondo.
3.1.2 Exploración de técnicas y recursos de lingüísticacomputacional
El desarrollo de capacitación del GIL se divide en dos: (1) un conjunto amplio de técnicas y(2) de recursos computacionales; dicho conjunto es una fase complementaria entre la teoríay la práctica para la capacitación de los miembros del grupo. De manera tal que si unalectura provee un conjunto teórico de elementos, las técnicas y recursos ofrecen elconocimiento práctico de lo que espera un usuario obtener de un sistema generado eningeniería lingüística.5
3.1.3 Colaboración en actividades del grupoTodos los miembros del GIL tienen la obligación de realizar aportaciones académicas acada uno de los proyectos para los que está trabajando, y además, colaborar en actividadesde difusión, organización y ejecución de dichas actividades.
El objetivo de estas actividades es difundir, ya sea dentro del Instituto de Ingeniería y enotras dependencias de la UNAM, así como en otros recintos académicos los trabajos einquietudes del grupo, creando con esto, espacios de diálogo, intercambio de ideas y lasosde cooperación entre diferentes grupos de trabajo.
3.1.4 Participación en proyectosLos proyectos en los que está trabajando el GIL no buscan hacer herramientas de trabajo deíndole computacional para un lingüista, ni tampoco hacer desarrollos de cómputo enfocadosal área de lingüística; por el contrario, se busca una retroalimentación bilateral entre las dosáreas que comienza con el desarrollo académico propio enfocado hacia dicharetroalimentación, de manera que ambas partes no sólo conozcan los problemas específicosdel otro, si no que además se enfoque hacia la búsqueda de soluciones conjuntas.
Es por tal motivo que el GIL participa dentro de un área muy amplia de proyectos deinvestigación que buscan dar respuestas y soluciones a las problemáticas que se plantea ladisciplina.
3.1.5 Redacción de informesLa utilización de técnicas eficientes de redacción aplicadas al desarrollo de informes deactividades en materia científica, son de suma importancia para cualquier área deinvestigación. Los cursos de redacción que tanto en el GIL como en el exterior han tomadolos miembros, pretenden lo anterior, y en casos más sencillos simplemente se buscahomogenizar la estructura general de redacción de un documento.
5 Para una exploración más detallada de las técnicas y de los recursos de la ingeniería lingüística, consultar elsiguiente link: http://iling.torreingenieria.unam.mx/curso/default.htm
Lo anterior es parte importante para la formación de los miembros del GIL ya que lespermite ganar experiencia y conocimientos para realizar los informes que cada uno de ellospresenta a su superior, y posteriormente, para la elaboración de sus tesis.
3.1.6 Elaboración de tesisDe la misma manera que debemos adquirir la habilidad de redacción técnica bienestructurada, es de suma importancia tener conocimientos concisos sobre el desarrollo dedocumentos informativos y explicativos de procesos de investigación realizados en unproyecto científico, esto con la mira de obtener un grado académico: el caso específico, latesis de grado.
Este otro tipo de habilidad nos servirá también para que las tesis de los graduados,pertenecientes al grupo, sirvan de base de conocimiento y consulta para que lasgeneraciones futuras tengan más material de consulta.
El GIL ha realizado cursos especializados en este rubro y en un futuro se llevarán a cabo demanera periódica.
3.1.7 Participación en congresosEl GIL se desarrolla en un área de investigación multidisciplinaria, por lo que es unaexigencia el dar a conocer su trabajo y retroalimentarse de otros trabajos. Para ello, cadamiembro del GIL está conciente de que su trabajo tiene un valor muy importante para elgrupo y merece ser dado a conocer.
El principal medio para dar a conocer este trabajo es la presentación en congresosnacionales e internacionales. En la actualidad, la gran mayoría de los miembros del grupohan tenido una experiencia en congresos de distinta índole relacionados con las áreas de laingeniería lingüística, por lo cual se pretende seguir con la participación activa en estosforos para enriquecer el trabajo que el grupo realiza.
3.1.8 Redacción de artículosSi bien es cierto que es importante presentar el trabajo de los miembros en congresos, estambién necesario que este trabajo tenga eco con la publicación del trabajo en mediosespecializados de difusión. Con este trabajo garantizamos que la investigación del GILpueda ser conocida en otros lugares fuera de los foros que permiten los congresos.
3.2 Seminario internoDurante los dos últimos años, se han realizado de manera anual, los Seminarios deIngeniería Lingüística, cuyo objetivo principal, es (1) mantener una comunicación estrecha
ente los integrantes del grupo, y (2) dar a conocer a personas ajenas al GIL las actividadesrealizadas por el grupo.
El Seminario está dirigido a todo el público interesado en el tema. Con lo anterior se hanestrechado lazos de cooperación entre instituciones de algunas partes de la repúblicamexicana y de la misma UNAM.
A la fecha se han realizado dos seminarios por parte del grupo. El material del primerseminario puede consultarse en la siguiente liga: http://iling.torreingenieria.unam.mx/. Elsegundo seminario está por concluir con una respuesta mucho mayor de la que se habíaesperado.
En el futuro está considerado seguir con esta clase de eventos que han redituado buenosfrutos.
3.3 Cursos internosIndependiente de los cursos de preparación encaminados a realizar un mejor trabajo dedifusión, los miembros del GIL tienen el derecho, y al mismo tiempo, la obligación detomar una serie de cursos internos de preparación; estos cursos pretenden un fincomplementario a la formación multidisciplinaria, por ejemplo, del alumno de cómputo seespera que asista a cursos de lingüística básica, sobre todo en aquellos temas sobre loscuales se desarrollan algunos de los proyectos; mientras que del alumno de lingüística, seespera tome los cursos básicos de cómputo para que desarrolle el área de mejor forma y seprepare de manera integral.
3.4 Cursos externosSon actividades académicas a las cuales los miembros del GIL están invitados a participar.Se trata de cursos completamente especializados y enfocados en tareas específicas queperfeccionan por un lado, la formación del interesado, y al mismo tiempo, busca emplearlas técnicas aprendidas en los proyectos en los que esté trabajando. Cabe mencionar quealgunos cursos se han tomado en la modalidad de estancias académicas en universidades deotros países.
3.5 Superación personalEl GIL se interesa porque todos sus integrantes tengan un desarrollo personal en todos lossentidos, se busca que éste sea integral, de manera que no sólo se tengan las habilidades yel conocimiento teórico para desarrollar investigación en ingeniería lingüística, sino queademás se logre obtener un desarrollo profesional integral, capaz de cumplir con lasexpectativas a futuro de cada uno.
Existen varias formas en las que el Grupo cumple con lo mencionado, entre las que seencuentran las de los apartados siguientes.
3.5.1 Intercambio académicoEste rubro es una de las ofertas académicas más atractivas que ofrece el GIL, ya que alhacer posible que el estudiante tenga acceso a un conjunto de universidades enprácticamente todo el mundo, se obtiene una ganancia académica amplia; por un lado, elestudiante se nutre de conocimiento cuyo origen encierra otro enfoque, y por otro, el GILno se cierra a seguir una metodología estática, sino por el contrario, lleva ya por definición,una dinámica constante de cambio.
3.5.2 Estancias de investigaciónOtro rubro igualmente atractivo, se le dedica a las estancias de investigación, mismas que,al igual que en el punto anterior, se pueden realizar tanto a nivel nacional comointernacional, teniendo como objetivo principal, realizar una serie de intercambios enmateria de recursos, técnicas y procedimientos de investigación, con otros grupos detrabajo.
3.5.3 Continuación de estudios superioresEl GIL forma parte del IIUNAM, por lo que sigue puntualmente los objetivos de esteúltimo, el cual es capacitar ampliamente a sus becarios de manera que puedan seguir susestudios teniendo siempre en cuenta las aptitudes, habilidades y expectativas futuras, por loque siempre se pretende que cumplan de manera específica con sus compromisosacadémicos, lo anterior enriquece de amplia manera el trabajo de investigación del Grupo,dado que mientras más y mejor estén preparados sus integrantes, el futuro del GIL sevislumbrará excepcionalmente.
En este sentido, el GIL es un medio muy atractivo para que los estudiantes realicen estudiosde posgrado, desde maestría hasta estudios de posdoctorado.
3.6 Capacitación encaminada a la docenciaOtra de las habilidades por las que el GIL se preocupa desarrollar sobre sus integrantes, sonlas de docencia, por lo que, mediante la participación de los Seminarios de IngenieríaLingüística, la participación en forma de exposiciones o el desarrollo de temas específicosen las clases, se busca cumplir con este objetivo.
A continuación se aborda de manera más amplia y de tallada el por qué y cómo es que sepretende realizar actividades encaminadas a este rubro académico.
4. DocenciaLa importancia de explotar este rubro radica en introducir y preparar gente que se intereseen el área y, si se da el caso, pueda integrarse como parte del GIL.
4.1 Cursos en la UNAMDentro de la UNAM se realizan actividades catedráticas tanto en la facultad de Filosofía yLetras, como en la de Ingeniería. Estos cursos son impartidos tanto a nivel licenciaturacomo en los posgrados de lingüística y de ciencias de la computación.
4.1.1 Cursos conjuntos entre facultadesAl impartir cátedra sobre materias en las que se requiere tanto el conocimiento de unadisciplina como de otra, es de esperarse que los alumnos de ambas facultades se integren entrabajos conjuntos para acreditar las materias.
Es por eso que se pretende seguir como hasta ahora con relación a cursos de diferentescarreras y en diferentes facultades, pero que convergen en esta área de investigación.
4.1.2 Integración de otras facultades a los cursos actualesDe igual modo se pretende en un futuro integrar a algunas facultades dentro de lasactividades de cátedra del GIL, para difundir más el área y estrechar o en su caso, crear,lazos de cooperación entre facultades.
4.1.3 Preparación de nuevos cursosConforme se ha avanzado en el desarrollo de conocimiento se tienen actualmente una seriede cursos en los cuales se introduce al alumno a lo que es el área, además de que se leproporciona el material básico y panorámico de ingeniería lingüística. Sin embargo, dada lacreciente investigación y los nuevos resultados que se generan en diversos lugares, esimprescindible actualizarse. En este sentido, en el GIL se planean nuevos cursos que seanmás específicos y aborden temas particulares de ingeniería lingüística, de esta forma, seasegura al alumno nueva información y desarrollo actualizado dentro del área.
Un ejemplo de esto se señala en el siguiente apartado.
4.1.4 Ingeniería lingüística como opción terminal de la licenciaturaen Ingeniería en Computación
A diferencia de otras carreras, incluso del mismo ramo, Ingeniería en Computación carecede una oferta de opciones de especialización para el estudiante terminal que necesita
desarrollarse laboralmente; por el contrario, existen una serie de materias de orden optativoque aunque son interesantes, constituyen una gama amplia de diversidad de tópicos, y nofuncionan como módulo sólido. Entre las innovaciones de GIL al plan de estudios de lacarrera en ingeniería en computación está la de crear el módulo de opción terminalingeniería lingüística. Con esta opción terminal el estudiante se preparará de forma másintensiva para desarrollarse en el área.
4.2 Cursos a otras institucionesEl conjunto de lazos académicos construidos por el GIL ha dado varios frutos, de maneraque la ingeniería lingüística se he extendido hacia otras instituciones, en algunos casos sehan dado cursos, en otros se están dando, y en otros existen enormes posibilidades de darlosen un futuro.
4.2.1 Cursos regulares a instituciones del DFLa ENAH, y el IFAL han recibido una serie de cursos en la modalidad de materias de temasespecíficos y diplomados respectivamente, donde se ha logrado el reconocimiento del GILy de la disciplina, y por lo tanto, la incorporación de algunos miembros del GIL a laplantilla laboral de estas instituciones. En un futuro se pretende abrir los cursos hacia unagama amplia de instituciones para crear una red académica de cooperación.
4.2.2 Cursos intensivos en provinciaGracias a la extensa difusión de las actividades del grupo, se ha logrado llegar ainstituciones académicas en el interior del país en donde se ha logrado armar una serie decursos especializados para los estudiantes de dichas instituciones, tal es el caso del InstitutoTecnológico Superior de Misantla, en Veracruz, a los cuales se les dará un curso sobre unaplataforma computacional en el área de Procesamiento de Lenguaje Natural: Python y elNLTK.
4.2.3 Cursos a la iniciativa privadaLa iniciativa privada no está fuera de los planes a futuro del GIL por lo que en institucionescomo Telmex, se han abierto las puertas para dar cursos aplicados y puntuales sobreaplicación y recursos que necesitan para mejorar el desempeño de la empresa o, alcanzarnuevos mercados. De estos cursos, además de representar una fuente de ingresos parasustentar las actividades de investigación, se requiere que sirvan como relaciones decooperación futura, y si es el caso, como metas laborales.
4.2.4 Cursos a distanciaPuesto que el trabajo que desarrolla el GIL pertenece a un área de investigación en la cualse desarrolla tecnología, pretendemos que esta misma sea aprovechada para realizar cursos
a distancia, con los cuales, una gama amplia de gente interesada en el área pueda accedersin ningún tipo de barrera espacial.
Para realizar lo anterior el GIL se apoya de la infraestructura humana, física y tecnológicacon que cuenta la UNAM para ofrecer cursos a centros que estén alejados de la ciudad deMéxico.
4.3 DiplomadoEl proyecto de un diplomado es esencial para el GIL puesto que se busca una relación coninstituciones y personas interesadas en la ingeniería lingüística. Este proyecto tiene comobases las cátedras que tanto a nivel licenciatura como posgrado se han impartido endistintos recintos educativos.
4.3.1 Diplomado presencial El diplomado presencial busca capacitar de forma más concisa y personalizada a todo aquelque esté interesado en la ingeniería lingüística. La idea es realizar este diplomado comoparte de los sistemas de ecuación continúa que ofrece la UNAM.
Otro proyecto más ambicioso que parte del diplomado, es el de sentar las bases humanas yde conocimiento para proponer una maestría en ingeniería lingüística.
4.3.2 Diplomado a distanciaEste rubro entra como parte de las actividades de preparación en materia de educación adistancia, por lo que si la institución o persona que así lo solicite requiere de este tipo deinstrucción, el GIL está en toda la disposición y cuenta con los recursos para cubrir conesos requerimientos.
5. Relaciones públicasParte fundamental de todo ente social son las relaciones para intercambiar ideas, lograrfinanciamientos, vender productos, y sobre todo, mejorar el desempeño a nivel social,cultural y económico de tal ente; en este sentido, el GIL tiene contemplado un compendiode estrategias para difundir el trabajo que realiza, así como para atraer la integración denuevos miembros. En seguida se detallan estas estrategias.
5.1 Participación activa en congresosA lo largo del desarrollo que ha tenido el GIL como grupo de investigación se ha hechoénfasis en la necesidad de asistir regularmente a congresos para (1) dar a conocer el trabajode investigación que realiza, (2) retroalimentarse de las investigaciones que se realizan enotros puntos del país y del mundo, (3) participar en foros de discusión especializada para
enriquecer los conocimientos de los miembros del grupo, lo cual redunda en beneficio delGIL, (4) captar la atención de gente interesada en el área para generar foros de participaciónconjunta e intercambio.
De entre los congresos nacionales e internacionales a los cuales han asistido los miembrosdel GIL, destacan:
The North American Symposium on Corpus LinguisticsConferencia Internacional CICLingTaller Internacional de Procesamiento Computacional del Español y Tecnologíasdel LenguajeJornadas Iberoamericanas de TerminologíaCongreso Internacional EURALEX Congreso Internacional ColingEntre otros6.
5.2 Intercambio académicoComo se ha mencionado a lo largo de este trabajo, dentro del GIL existe una preocupaciónmuy fuerte por estar actualizados en las ramas afines a la ingeniería lingüística, y de lamisma forma, actualizar a otras personas fuera del GIL. Una estrategia que el GIL hacontemplado desde su formación es el intercambio académico de estudiantes, profesores einvestigadores con el fin de conocer y dar a conocer los trabajos de investigación ydesarrollos, así como la capacitación entre especialistas y gente interesada en el área.
En la actualidad el GIL ha establecido convenios de intercambio académico con distintasinstituciones de educación superior a nivel nacional e internacional. Del mismo modo, haacogido a profesores y estudiantes de posgrado, y ha enviado a un par de miembros delgrupo a universidades extranjeras.
En la siguiente tabla se mencionan algunos de los participantes nacionales y extranjeros quehan gozado de este beneficio.
Nombre País deprocedencia
País dellegada
Categoría
Marie Hayet Inglaterra México Profesor invitadoCarlos Rodríguez Penagos España México Profesor invitado
Joaquim Llisterri España México Profesor invitadoJock McNaught Inglaterra México Profesor invitado
Claudia Vázquez México, Puebla México Estudiante delicenciatura
6 Para consultar la lista completa de los congresos a los que han asistido los miembros del GIL, consultar elApéndice E.
Gabriel Garduño México España Estudiante delicenciatura
Marlene Moreno del Pilar México España Estudiante delicenciatura
Tabla 5: Personas que han estado en intercambio académico
5.3 Participación en proyectos conjuntos de investigaciónLa canalización de esfuerzos en pro de un fin común es una meta que el GIL ha tomado encuenta desde su inicio. Un ejemplo de este esfuerzo es la participación conjunta con otrasinstituciones en proyectos de investigación. Instituciones de la UNAM como el Instituto deInvestigaciones Filológicas, el CCADET, el CELE son una muestra de cómo se ha idoconformando una red de trabajo a través de la participación en distintos proyectos deinvestigación, como el Diccionario de Lingüística y el Diccionario de Física.
Fuera de la UNAM ha habido eco en esta estrategia del GIL; el proyecto Geo Varilex setrabaja de forma conjunta con el COLMEX, con lo cual se espera la captación de nuevosrecursos y el intercambio y mejoramiento de ideas.
En un futuro se tiene considerado abrir nuevas propuestas de investigación conjunta, ysobre todo, continuar con esta línea que ha enriquecido en distintos aspectos a los miembrosdel GIL.
5.4 AsociacionesLa difusión y retroalimentación de ideas es una meta que en el GIL siempre se ha pensado,una de las estrategias que ha explotado para cumplir tal meta es la participación en grupos,redes y asociaciones especializadas en ingeniería lingüística y las ramas que la conforman.
En este momento algunos miembros del GIL están afiliados a asociaciones dedicadas ainvestigar y difundir conocimiento, tal es el caso de:
Red Iberoamericana de Terminología, RITERMAsociación Mexicana de Lingüística Aplicada, AMLAAsociación de Lingüística y Filología de América Latina, ALFAL
Un gran problema que se ha encontrado con este grupo asociaciones es el carácter tanespecífico que priva en cada una de ellas, no por esto deja de ser interesante y motivador elparticipar en ellas; sin embargo, dado que la ingeniería lingüística es una rama bastanteamplia de disciplinas que se conjuntan para dar forma a ésta, se ha vuelto una necesidad elcontar con una asociación dedicada exclusivamente a esta área y subáreas que laconforman. A lo largo del año 2003 y lo que va del presente, se ha concretizado unproyecto muy ambicioso entre los distintos grupos dedicados a esta área.
La Asociación Mexicana para el Procesamiento de Lenguaje Natural (AMPLN) tiene comoprincipal meta el dar a conocer las investigaciones que dentro de estas áreas se estánllevando a cabo, así como el de propiciar un foro óptimo de discusión y de representar a lacomunidad mexicana que está trabajando duramente. Hoy día, este proyecto ya tiene unfruto, la versión electrónica de la revista de la AMPLN está en línea en el siguiente vínculo:http://www.cicling.org/ampln/info.htm. De esta forma, se ha logrado dar un paso muyimportante para la consolidación y fortalecimiento de esta disciplina en el ámbito nacional.
5.5 ConveniosComo se mencionó en el apartado 5.2, el GIL se ha preocupado por mantener en constanteactualización a todos sus miembros, prueba de ello son los convenios que ha realizado coninstituciones educativas y laborales tanto a nivel nacional como internacional. LaUniversidad Pompeu Fabra (UPF) en Barcelona y la University of Manchester Institute ofScience and Technology (UMIST) en Inglaterra son algunas de las instituciones que tienenconvenio con el GIL para intercambio académico, estancias de investigación, realización deestudios de posgrado, etc.
En Francia, gracias a la participación en el Eleventh EURALEX International Congresscelebrado en Lorient se logró concretar un convenio de trabajo con la empresa parisinaIDM que está encargada del desarrollo de recursos léxicos para la creación de diccionarios.Del mismo modo, en México se han logrado establecer pautas para convenios e invitacionesa laborar en departamentos gubernamentales, tal es el caso de la Procuraduría General deJusticia del DF y el Tribunal Electoral, que se han interesado vivamente en la investigacióny desarrollo que se desarrollan en el GIL.
Los resultados son alentadores, no obstante, las metas aún no están completas a nuestraentera satisfacción, de forma que en el GIL se trabaja diariamente en la consecución de lasmetas y objetivos que se ha propuesto; las estrategias de relaciones públicas son un paso deentre varios encaminados a cumplir estos fines.
6. Obtención de recursosUna parte vital dentro del GIL es la infraestructura de recursos que ha ido conformando, yno sólo aquellos económicos, sino también los referentes al conocimiento en distintosformatos con que a la fecha cuenta. En los apartados siguientes se señalan algunos de losrecursos con que cuenta y las fuentes que a la fecha y a futuro proporcionarán los recursosnecesarios para el crecimiento del GIL.
6.1 Acervo bibliográficoHasta el momento el acervo bibliográfico con que cuenta el GIL es digno de considerar;manuales, memorias, artículos y libros especializados en formato electrónico y en papel son
parte de los recursos que ha ido constituyendo el grupo. En la tabla 2 se señalan algunas delas áreas temáticas en que está organizado el banco bibliográfico del grupo.
Cómputo Lingüística OtrosInteligencia artificial Lingüística computacional Diccionarios
Redes neuronales Procesamiento de voz ManualesRecuperación de información Procesamiento de lenguaje natural
Extracción de información TraducciónRepresentación del conocimiento Lingüística de corpus
Algoritmos LexicografíaEstadística Terminología
Lógica Gramáticas
Tabla 6: Áreas temáticas del acervo bibliográfico del GIL
Estos recursos son parte vital para la formación de los miembros del GIL y de las nuevasgeneraciones de gente interesada en el área; con este banco de conocimiento la entrada de lagente del GIL a la disciplina está garantizada; sin embargo, aún estamos lejos de contar contoda la bibliografía que el área ha generado, por ello, este acervo está en constanteactualización. A continuación se detallan algunas vías por las cuales se actualiza.
6.1.1 Compra de libros Con los fondos destinados de cada proyecto para la compra de material bibliográfico, laUnidad de Servicios de Información (USI) se encarga de adquirir todo aquel material que esde interés para el área, de esta manera, el acervo de libros del grupo se incrementa de formapaulatina.
Otra estrategia para acrecentar nuestro acervo bibliográfico consiste en el fotocopiado dematerial existente en otras bibliotecas dentro y fuera de la UNAM.
6.1.2 Búsquedas de páginas WEBDe la misma forma en que es importante contar con material impreso, en el grupo es igualde importante tener material en formato electrónico, así como documentos e informaciónque puedan ser consultados en la computadora y, dado el caso, en línea.
Todo este material se concentra en los Favoritos de los miembros; el objetivo que seplantea a corto plazo es la de organizar todo este material, a semejanza del materialimpreso, en un banco de datos que pueda ser consultado por personal interno y externo delGIL, con una estructura que eficiente las consultas, de modo que toda esta información seaen verdad un recurso aprovechable por cualquier persona.
6.2 Recursos lingüísticosOtra fuente de conocimiento con que se cuenta en el grupo son los recursos lingüísticos enformato electrónico. Este material, así como el bibliográfico, es parte integral yfundamental de los procesos de investigación a los que se avoca el GIL.
De entre la gama de recursos lingüísticos con que cuenta el GIL se pueden destacar losdiccionarios electrónicos, tanto en español como en inglés, tesauros, ontologías, bancosterminológicos, etiquetadores automáticos, parsers, etc. El objetivo es aumentar esta basede recursos lingüísticos en beneficio de la investigación en ingeniería lingüística y ramasafines.
6.2.1 Nuevos recursosAunque los recursos que hasta ahora tiene el GIL son importantes, no podemos dejar deseñalar que no son suficientes; el objetivo que a la fecha se tiene consiste en obtener másrecursos que permitan a los integrantes del grupo profundizar y acelerar susinvestigaciones, para de este modo, agilizar los proyectos y conseguir nuevos.
Además de actualizar los recursos existentes, buscamos conseguir y crear recursos talescomo:
Analizadores morfológicosAnalizadores sintácticosDiccionarios electrónicosEtiquetadores morfosintácticosEtiquetadores semánticos y pragmáticosSistemas de representación del conocimiento
6.3 Financiamiento Un punto por demás importante para consolidar el área de ingeniería lingüística en México,y por consiguiente, al GIL, es la búsqueda y obtención de recursos financieros. Hasta elmomento este tipo de recursos se han obtenido de instituciones como el CONACyT ydependencias de la UNAM; sin embargo, los niveles a los que se pretende llegar no paranúnicamente en este tipo de financiamiento, sino que abarcan los patrocinios de institucionesgubernamentales y de empresas privadas que aporten mayores recursos que permitan unmejor y más rápido desarrollo de investigación, y en consecuencia, de resultados.
6.3.1 Búsqueda de fuentes de financiamientoLa economía es un recurso esencial para la estabilidad y funcionamiento de cualquier entesocial, en nuestro caso, este es un tema prioritario en primer lugar porque es a partir delfinanciamiento de proyectos como ha logrado continuar la labor de investigación ydesarrollo del GIL, y en segundo, porque con recursos económicos se promueve la
captación de recursos humanos garantizándoles un sustento económico mientraspermanecen trabajando en el grupo.
Es por estos motivos que en GIL existe una preocupación muy fuerte por captar fuentes definanciamiento diversas que aseguren la continuidad del grupo. Como meta principal sepretende obtener recursos económicos de entidades federativas y de la iniciativa privada,esto, sin dejar de considerar el patrocinio de proyectos CONACyT y UNAM.
De esta forma, además de conseguir recursos económicos se garantiza la continuidad de lainvestigación y del fortalecimiento de esta disciplina mediante la creación de desarrolloscon un sustento analítico y de investigación.
6.3.2 Presentación de prototiposOtro aspecto importante para la obtención de recursos financieros consiste en presentar a lasdependencias interesadas, prototipos de desarrollos que muestren las capacidades ypotencialidades que tienen los desarrollos y recursos que se han producido en el GIL. Coneste tipo de presentaciones pretendemos describir, ofrecer y mejorar productos queresuelvan las necesidades de usuarios y de empresas, atrayendo su atención mediante elempleo de sistemas previos que simulen y solucionen las exigencias particulares de cadauno de ellos.
7. Crecimiento del GILDesde su creación, el GIL ha visto un crecimiento de dimensiones exponenciales. En cincoaños hemos pasado de cuatro a más de 30 integrantes (entre investigadores, becarios,estudiantes, prestadores de servicio social y colaboradores externos). Más allá de este dato,la consolidación de la ingeniería lingüística como área de investigación dentro de nuestropaís (consideración autónoma en publicaciones, congresos y seminarios, demanda dedocentes especializados) obedece en gran medida al trabajo sistemático del grupo; al mismotiempo, para satisfacer la demanda creciente de aplicaciones desarrolladas desde laingeniería lingüística, se requiere de una planta de profesionales capacitados en este campo.
7.1 Búsqueda de nuevos integrantesPor los motivos arriba expuestos, es importante mantener una política de apertura hacia losjóvenes con estudios afines que muestren interés por desarrollarse profesionalmente en elárea.
7.1.1 Servicio socialEl servicio social es de suma importancia, especialmente si consideramos que el área esrelativamente nueva y los estudiantes tienen poca información sobre las ramas que abarca.
Mediante el cumplimiento del servicio social, el estudiante de licenciatura cubre unrequisito encaminado a la titulación, pero, al mismo tiempo, perfila sus interesesprofesionales. De este modo, actúa como un filtro: el estudiante tiene la opción de mantenerrelación con el grupo una vez concluido este servicio e incorporarse a proyectos conforme alas posibilidades del momento. Es deseable que quienes manifiestan simpatía por el árearealicen un trabajo de este tipo y así tomar la decisión de continuar o no por este camino demanera fundamentada; para el desarrollo del grupo esto es muy importante pues losproyectos se nutren de participantes entusiastas con las actividades que realizan, lo quegarantiza un mejor rendimiento del proyecto y el crecimiento y consolidación del área.
7.1.2 Becarios en proyectosGracias al apoyo del Instituto de Ingeniería y con el patrocinio del CONACYT y de lapropia UNAM, el GIL ha venido realizando proyectos de investigación aplicada.
El grupo, como parte del Instituto de Ingeniería, se sabe con una responsabilidad dentro dela Universidad y la sociedad, que es la de coadyuvar en la formación de los futurosinvestigadores. Es por ello que procura que sus investigaciones no sólo sean realizadas porinvestigadores con experiencia, sino que vinculen a estudiantes con diferente formación yciclos académicos. Participar en proyectos de investigación desde las primeras etapas de losestudios superiores es una experiencia de aprendizaje intensivo que complementa laformación escolar de los alumnos.
El trabajo que desarrollan los becarios es fundamental para la formación individual de cadauno de ellos, pero también es benéfica y necesaria para la consecución de nuestrosobjetivos. Ellos realizan tareas necesarias para las investigaciones que por limitaciones detiempo los responsables de los proyectos no podrían llevar a cabo sin descuidar otras paralas que se requiere una mayor experiencia. Y más importante aún, aportan opiniones einiciativas desde una perspectiva diferente de los mecanismos y las ideas arraigadas dequienes concibieron los proyectos.
7.1.3 TesistasEn cinco años el grupo ha producido una cantidad considerable de publicaciones queconstituyen un registro del proceso y los mecanismos de los trabajos desarrollados hastaeste momento.
Entre estas publicaciones destacan las tesis de licenciatura, maestría y doctorado que losmiembros del grupo han desarrollado a partir de investigaciones personales insertas en losproyectos del grupo. La existencia de estos trabajos serios que, a su vez, sonsistemáticamente documentadas ha impulsado un crecimiento efectivo del área. Por las implicaciones positivas del desarrollo de esta actividad, seguiremos impulsando quemás estudiantes en cómputo, lingüística, bibliotecología, comunicación y disciplinas afines
con inquietudes en nuestra área desarrollen sus investigaciones dentro del grupo. Parte delos recursos en infraestructura y presupuesto de que dispongamos se destinarán a este rubro.
7.1.4 Intercambio académico: profesores invitados y estudiantes deintercambio
Tal como se mencionó en el punto 5 de este trabajo, el GIL cuenta con algunas experienciasen este sentido, tanto de participantes de nuestro grupo que han tenido estancias temporalesen otras instituciones como de estudiantes y profesores visitantes que hemos recibido.
Estos antecedentes nos permiten evaluar que, si bien gracias a Internet podemos tenerconocimiento de lo que actualmente se realiza en materias relacionadas a la ingenieríalingüística en otras partes del mundo, así como comunicación e intercambio constante conlos investigadores, las estancias de investigación son necesarias para la actualización ycapacitación de nuestro grupo.
Para expandir las investigaciones que se realizan en nuestro país a todas las ramas de laingeniería lingüística necesitamos conocer otras experiencias y qué mejor que contar conasistencia específicamente proyectada para los conocimientos y necesidades del GIL.
Por otra parte, las estancias de miembros de nuestro grupo en otras universidades y centrosde investigación servirán también para entablar convenios y estrechar los lazos decolaboración con las instituciones correspondientes.
7.2 Mecanismos de promociónCon miras a crecer en integrantes y, consecuentemente, en investigaciones y aplicaciones,necesitamos poner en práctica ciertos mecanismos de promoción. Hemos optado poralgunos que resultan novedosos y por otros que tradicionalmente se emplean para diversosfines, precisamente porque son exitosos.
Los cursos que se imparten en diferentes instituciones de educación superior cubren unprograma y propósitos bien definidos, y sirven además para dar a conocer entre losestudiantes la existencia de un grupo de investigación dentro de la UNAM dedicadoexclusivamente a la ingeniería lingüística. Los seminarios y nuestra participación encongresos coadyuvan a este propósito. Sin embargo, lo anterior no garantiza llegar a todoslos espacios y personas, además de que esos eventos requieren de su propia promoción.
7.2.1 Carteles y trípticosEs por esto que consideramos difundir mediante carteles las diversas actividades, así comoel uso de trípticos que permiten dar una información general pero concisa, tanto de qué es elGIL como de las actividades específicas que vayan surgiendo.
7.2.2 Página WEBComo se ha mencionado en el punto 2 de esta III parte, el GIL cuenta con una nueva páginaen Internet. Se trata de hacer un diseño atractivo y de fácil acceso para los usuarios de laWEB, dado que es un medio de difusión cuyo impacto crece aceleradamente y del cualpretendemos hacer el mayor uso posible para difundir el área, además de que sirva comoforo para la gente que esté interesada en la ingeniería lingüística o alguna de sus ramas.
7.3 Estímulos económicosPara el GIL es una prioridad contar con los recursos para ofrecer estímulos económicos aquienes participan en los proyectos. En la medida en que haya una base de personasdedicadas exclusivamente al trabajo vinculado con los proyectos y las actividades quellevamos a cabo, éstos asegurarán continuidad y las condiciones propicias para obtener losresultados deseados: los integrantes del grupo tendrán la facilidad y el tiempo parainvolucrarse a las diferentes tareas de acuerdo con sus intereses cuando vean atenuadaspreocupaciones de otra naturaleza.
7.3.1 BecasHasta ahora las becas se han obtenido a partir de los proyectos patrocinados. Consideramospara este año las de CONACYT y DGAPAUNAM, pero no se descartan las que pudieransurgir de nuevos convenios y proyectos con otras instituciones.
7.3.2 HonorariosHasta el momento los estímulos se han otorgado mediante becas. No obstante, se ha visto lanecesidad de incorporar estímulos económicos de otro tipo, debido a que identificamos queexisten personas fuera del grupo que podrían aportar mucho al progreso de nuestro trabajo,y otras que perteneciendo al GIL no cuentan actualmente con beca.
Se ha considerado este tipo de estímulos al momento de solicitar el patrocinio deCONACYT y de otras entidades. El monto de estos estímulos se ajustaría a los tabuladoresde la UNAM y representaría un incentivo extra para quien esté interesado en el área.
7.4 Búsqueda de mecanismos de integraciónEs importante señalar que el GIL no es una entidad aislada, al contrario, a lo largo de suhistoria se ha demostrado la necesidad de trabajar de forma conjunta no sólo con la genteinvolucrada en el área, sino con áreas que pueden nutrirnos y áreas a las que podemosofrecer productos. De aquí la exigencia de continuar con este tipo de trabajo
interdisciplinario con las instituciones con las que ahora participamos, del mismo modo,que atraer la atención de otras nuevas para seguir con el desarrollo y expansión del área.
7.4.1 Codirección de tesis Actualmente, además de las tesis desarrolladas por los integrantes del grupo y encaminadashacia proyectos específicos, se está comenzando a apoyar con asesoría y recursos, comoherramientas informáticas y material bibliográfico, a estudiantes que sin participar en elGIL, elaboran tesis de temas relativos al área.
Estos mecanismos repercutirán en un acercamiento con otras entidades a partir de lacodirección de tesis, por ejemplo, en donde quedará de manifiesto la interdisciplinariedaddel área y los niveles de expansión que puede llegar a tener.
7.5 Búsqueda de proyectos patrocinadosEn este 2004 concluyen los apoyos económicos asociados a trabajos de investigación conlos que actualmente contamos, por lo que hemos sometido a concurso en CONACYT unproyecto vinculado a un área de la que nos hemos ocupado. Además, se busca ampliar lasinvestigaciones hacia otras líneas que de la ingeniería lingüística que hasta ahora no hemosabordado, para lo cual necesitamos asegurar que los actuales becarios se mantendrántrabajando en esta área y, al mismo tiempo, definir una estrategia para que otros estudiantescomiencen a vincularse.
Los proyectos financiados son indispensables para el crecimiento de los trabajos deingeniería lingüística en nuestro país porque redundan en mejores condiciones para lainvestigación en todos los sentidos: Permiten proveernos de herramientas propicias paranuestro trabajo; asistir a eventos de intercambio académico, a programas de capacitación;acceder a becas, etc., por tal motivo, uno de los objetivos que a corto plazo tienen mayorprioridad es la de buscar y obtener este tipo de patrocinio.
7.6 Red de trabajo del GILProblemas referentes al espacio físico y al equipo de cómputo por un lado, y de desarrollaruna gama diversa de líneas investigación, por otro, son una muestra que pone de manifiestola necesidad de trabajar a partir de redes. Con una estructura de trabajo basada en lacooperación y dispersión de los integrantes se pueden aprovechar de mejor forma losrecursos disponibles y abarcar nuevos problemas de investigación, por tal motivo, en elGIL, esta forma de trabajo tiene gran importancia y se pretende seguir bajo este rubrocolaborativo.
Como ejemplo, la estructura actual del GIL agrupa a miembros que desempeñanactividades de base, esto es, los que laboran físicamente dentro del Instituto de Ingeniería,
así como a miembros que colaboran en proyectos específicos desempeñando sus labores enotras instituciones dentro y fuera de la UNAM.
7.6.1 UNAMComo ya se ha mencionado anteriormente, el GIL depende de la UNAM y físicamente selocaliza dentro de Ciudad Universitaria, lo que facilita su proyección dentro de la misma yque, consecuentemente, se nutra con sus estudiantes.
Lo anterior ha permitido tener vínculos de trabajo con investigadores del IIFIL, el CELE, elCCADET, el IIMAS, la FES Acatlán, entre otras dependencias universitarias; sin embargo,pretendemos involucrar a otras dependencias que se interesen en esta disciplina y puedanaportar nuevas ideas con lo cual nutrir la investigación que desarrollamos.
7.6.2 ExteriorFuera de la UNAM, se cuenta con redes de colaboración con dependencias, investigadores,profesores o prestadores sociales de otros centros de investigación nacional, tal es el casodel IPN, el COLMEX, el INAOE y la ENAH.
En el extranjero existen mayores posibilidades de ampliar esta red a nivel de intercambioprecisamente porque existen más centros de investigación vinculados con el trabajo delGIL, algunas instituciones con las que actualmente colaboramos son el InstitutoUniversitario de Lingüística Aplicada, de la UPF en Barcelona, y el Centro Nacional deMinería de Textos, en Manchester.
No obstante los vínculos de colaboración e intercambio que a la fecha tiene el GIL, esimportante seguir con esta estrategia para llegar a otros puntos nacionales y extranjeros.
7.7 InfraestructuraUna necesidad inmediata que experimenta el GIL es la de ampliar su infraestructura debidoa que de la que se dispone actualmente es insuficiente para cubrir las necesidades del propiogrupo.
7.7.1 Espacio físicoEl espacio físico del que se dispone dentro del Instituto de Ingeniería no es nadadespreciable, pero plantea considerables dificultades. La primera es que este espacio estárepartido en cuatro puntos diferentes dentro de tres edificios, lo que no es práctico ydificulta la comunicación entre los miembros del grupo; por otra parte, no se cuenta con lacapacidad de albergar a los posibles nuevos integrantes.
7.7.2 Equipo de cómputoDentro de la solicitud de patrocinio que se ha presentado para los próximos tres años,destaca una partida que permita contar con nuevos recursos de cómputo, más adecuados alas necesidades específicas derivadas de las actividades que se realizan; esto no significaque el equipo con el que contamos sea despreciable, sino que muestra la necesidad deactualización y de ofrecer mayores recursos a los integrantes del grupo para realizar sustrabajos de mejor forma.
8. Consolidación de líneas de investigaciónUna tarea importante en el crecimiento del GIL es la de profundizar y extender loshorizontes de investigación del grupo. No basta con el desarrollo de un único rubro paradestacar en el ámbito de investigación, pero tampoco es posible abarcar todas las líneas deuna disciplina, en el GIL se ha privilegiado el desarrollo de investigación básica y aplicadaen la esfera textual de la ingeniería lingüística, pero esto no significa que se desdeñen otraslíneas que no tengan que ver con ésta o algunas otras nuevas.
En los apartados siguientes se hablará a grandes rasgos de las líneas existentes que hadesarrollado el grupo, la consolidación de éstas, y el ingreso paulatino hacia nuevas líneas.
8.1 Líneas existentesA la fecha las líneas de investigación que el GIL ha desarrollado están en función deinformación textual básicamente; investigaciones en terminología, terminótica,lexicografía, bancos terminológicos, entre otras, han rendido bastante fruto y hanrepresentado ante la comunidad nacional e internacional el desarrollo que el grupo hatenido; sin embargo, aún restan diversos rubros referentes a la información textual porinvestigar, que a lo largo del desarrollo de los proyectos han aparecido, pero que por elmomento no ha sido posible abordar.
Cabe destacar que todas las líneas de investigación que se han trabajado en el GIL partendel desarrollo del proyecto central de investigación del grupo, dicho proyecto se refiere a laconstrucción de un diccionario electrónico integral de búsquedas semasiológicas yonomasiológicas. A partir de este proyecto se han generado y diversificado las líneas deinvestigación del grupo hacia distintos ámbitos tanto a nivel lingüístico comocomputacional.
Ahora bien, la meta que como grupo perseguimos no es sólo probar y diversificar en líneasde investigación, sino explotar y profundizar lo más posible en las que ahora desarrollamos,para a la par y posteriormente, incursionar en otras nuevas que tengan el sustento de trabajode las anteriores.
8.2 Nuevas líneas de investigaciónAsí como es importante afianzar y seguir con las líneas actuales de investigación, esnecesario incursionar en otras para expandir los horizontes de la investigación en ingenieríalingüística en México. Algunas líneas se han contemplado desde hace tiempo en el GILpero, dada la cantidad de trabajo, ha sido casi imposible acercarnos mayormente a ellas;algunas otras han ido descubriéndose a partir de la investigación y trabajo quedesarrollamos con las actuales.
8.2.1 CapacitaciónPara poder incursionar a nuevas líneas de investigación, primero es necesario capacitarse.En este sentido, el GIL cuenta con los recursos necesarios y los convenios indicados paraque sus miembros puedan capacitarse en los centros especializados en donde se realiza talinvestigación.
8.2.2 Búsqueda bibliográficaDe igual manera, es imprescindible documentarse para tener referentes básicos y sólidossobre las nuevas líneas, por tal motivo, la búsqueda de material bibliográfico es unprerrequisito para acceder e estas nuevas líneas.
Con el apoyo de la Dirección General de Bibliotecas (DGB), a partir de la Unidad deServicios de Información (USI) del Instituto de Ingeniería se garantiza la obtención de estosrecursos.
8.2.3 ColaboraciónOtro punto importante es la colaboración entre especialistas y el GIL para asegurar, primerola capacitación, y luego, el desarrollo de la investigación por caminos fundamentados.
9. Integración del GIL con el exteriorUna de las preocupaciones más importantes al interior del GIL es el futuro de losintegrantes del grupo. Una vez que los miembros hayan adquirido los conocimientos yexperiencia necesaria para desarrollarse por su cuenta o paralelo al GIL, cuál es el caminoque les ofrece esta disciplina.
9.1 Canalización de los miembros del GIL al mundo laboralLa principal rama laboral a la que los integrantes del GIL acceden es la docencia. En laactualidad son nueve miembros del grupo los que participan de forma activa en actividadesdocentes relacionadas con la ingeniería lingüística o alguna de las ramas que la constituyen,
en instituciones de educación superior y de posgrado, tanto en la UNAM como fuera deella7.
Sin embargo, no sólo la docencia constituye el único vínculo entre el GIL y el mundolaboral. Actualmente, y gracias a la participación en diferentes foros de difusión nacionalese internacionales, así como a asociaciones, institutos y demás medios de relacionespúblicas, se han concretado algunos convenios para que los integrantes del GIL que deseeny estén capacitados, puedan realizar estancias de investigación en universidades extranjeras,por ejemplo, el Institut Universitari de Lingüística Aplicada de la Universidad PompeuFabra en Barcelona.
De igual forma, a nivel nacional hay un panorama laboral bastante amplio en la iniciativaprivada y en las entidades gubernamentales. En el primer rubro, empresas dedicadas aldiseño de sistemas inteligentes y de procesamiento de lenguaje natural requieren depersonal preparado para el desarrollo de sus sistemas, tal es el caso de TELMEX. Por ellado gubernamental, entidades como la Procuraduría General de Justicia del DF estáninteresadas en profesionales que puedan desarrollar los sistemas de acústica forense, o elTribunal Electoral del Poder Judicial de la Federación, en donde se precisa de gente quedesarrolle buscadores con bases lingüísticas y computacionales.
No obstante que la ingeniería lingüística es un área de reciente creación en México, lasnecesidades que plantea el mundo actual hacen que se requiera cada vez más deprofesionales en el área que puedan investigar, capacitar y desarrollar sistemas queredunden en beneficio de la sociedad. La ingeniería lingüística como área interdisciplinariaofrece profesionales preparados y con una visión complementaria de las ciencias y de lashumanidades al mundo laboral.
9.2 CENTLICEl rápido crecimiento de los alcances de la ingeniería lingüística y de esta misma como áreainterdisciplinaria ha dado lugar a la inquietud de varios investigadores y estudiantes de estaárea en México, a expandir los alcances de investigación, desarrollo y aplicación a través deun centro que logre englobar lo más posible las diferentes ramas que nutren la ingenieríalingüística.
El Centro de las Tecnologías del Lenguaje, la Información y el Conocimiento (CENTLIC)es un nuevo proyecto, comandado por el GIL, con la participación de centros universitariostales como el CUIB, el IIMAS, el CCADET, el II, la facultad de filosofía y letras, lafacultad de ingeniería y el CELE, y de centros externos como el COLMEX, el INAOE, elCIC, la BUAP, entre otros; que pretende reunir a la mayoría de expertos y estudiosos en lasramas que conforman la ingeniería lingüística con el fin de crear una entidad que pueda darel soporte necesario y suficiente a las necesidades sociales y de investigación relacionadas
7 Para consultar los cursos que han impartido los miembros del GIL, consulte el Apéndice B.
con el procesamiento de lenguaje natural, el procesamiento de textos y de información y lageneración de conocimiento.
Con este centro se pretende involucrar a todos los que están trabajando de formaindependiente en cuestiones relativas a las arriba mencionadas y conjuntar una base deprofesionales que trabajen para un fin común y bajo una sólo entidad.
El CENTILC es el objetivo más ambicioso, a la vez que sustentado por el trabajo que se hevenido desarrollando en la UNAM y fuera de ella, de la comunidad mexicana dedicada ycomprometida con esta área. El logro del objetivo depende del esfuerzo y dedicación quetodos los involucrados realizan día con día y el de tener presente que se trabaja en pro de lainvestigación mexicana de calidad.
APÉNDICE A
INSTANCIAS EDUCATIVAS Y DE INVESTIGACIÓN
A continuación se mencionarán de manera más amplia algunos lugares e instituciones en elmundo, los cuales dedican de gran manera sus esfuerzos al desarrollo e investigación deesta industria, así como las respectivas ligas para profundizar o contactar con la institución.
Instancias Educativas e Investigación
1. América
• Canada
o Alberta
University of Calgary: Dept. of Linguistics
o British Columbia
Simon Fraser University, Burnaby: Natural Language Laboratory
o Manitoba
University of Manitoba: Dept. of Linguistics
o Ontario
University of Ottawa: Knowledge Acquisition and MachineLearning (KAML) Group, Department of Computer Science
University of Toronto Department of Computer Science
o Quebec
CEVEIL (Information on Language Engineering in Quebec)
Concordia University , Montreal, Center for Pattern Recognitionand Machine Intelligence
• USA
o Arizona
Tucson: University of Arizona, Department of Linguistics
o California
Stanford University, Center for the Study of Language and Information and the CSLI HPSG Project
University of California at San Diego
Center for Research in Language
University of California at Santa Barbara , Dept. of Linguistics
University of California at Berkeley
ICSI (International Computer Science Institute)
Computer Science Division
Linguistic Department at UCLA
Menlo Park: SRI International, Artificial Intelligence Center withtheir Natural Language Program
Marina del Rey: Natural Language Processing at theInformational Science Institute, University of Southern California(ISI)
UC Davis: Linguistics Program at .
o Connecticut
Linguistics Department of Yale University
Delaware University of Delaware : Applied Science andEngineering Laboratories with their
Speech Group ,
Natural Language Interfaces Group
o and a description of their Language Representation Database
o District of Columbia
Georgetown University: Computational Linguistics
o Florida
Florida International University Linguistics Course Descriptions
o Georgia Atlanta:
Georgia Tech Cognitive Science program
Georgia Tech Natural Language and Reasoning research group
o Illinois
Southern Illinois University at Carbondale: Department ofLinguistics
University of Chicago
Dept. of Linguistics (graduate program)
Northwestern University , Department of Linguisitics
o Indiana
Bloomington: Indiana University, Department of CognitiveScience,
o Iowa
Linguistics Department at The University of Iowa
o Kansas
The Linguistics Department, University of Kansas
o Maryland
Baltimore: Department of Cognitive Science of Johns HopkinsUniversity
o Massachusetts
University of Massachusetts , Amherst, Center for IntelligentInformation Retrieval (CIIR)
MITRE , Bedford, Intelligent Information Processing
Massachusetts Institute of Technology (MIT), Cambridge,Department of Linguistics and Philosophy
Brandeis University , Waltham, Department of Computer Science,Research Lab for Linguistics and Computation (RLLC)
o New Mexico
Las Cruces: New Mexico State University
Computing Research Lab
Department of Languages and Linguistics
o New York
Ithaca: Cornell University
Noyes Lodge Language Learning Center , Department of ModernLanguages and Linguistics
Natural Language Processing group , Departments of Science,Linguistics, and Psychology
University of New York at Stony Brook: Semantics Lab at theDepartment of Linguistics. (also available: Language, Journal ofthe Linguistic Society of America)
New York: New York University
Linguistics Department
CS Department, Proteus Project and their Technical Reports
University of Rochester: Linguistics Department
o Ohio
Columbus: Ohio State University, Department of LinguisticsThere is also an HPSGServer
o Oregon
Portland: The Oregon Graduate Institute of Science andTechnology, Center for Spoken Language Understanding
Department of Linguistics , University of Oregon. Also availableare
The Yamada Language Center WWW language guides and
their languagerelated font archives (Includes several phonetic fonts).
o Pennsylvania
o Pittsburgh: Carnegie Mellon University
Center for Machine Translation
Languages and Linguistics
Computational Linguistics Program
o Philadelphia: University of Pennsylvania
Linguistics Department
Computer & Information Sciences
Linguistic Data Consortium (LDC)
o Rhode Island
Brown University, Department of Cognitive and Linguistic Sciences, Providence, RI.
o Texas
University of Texas at Austin: Department of Linguistics
Houston: Rice University, Center for the Study of Languages
Dallas: Summer Institute of Linguistics (SIL)
Linguistics Department at Brigham Young University
o Washington
Western Washington University , Bellingham, Computer ScienceDepartment
o University of Washington, Seattle: Chinese dialect society (The YuenRen Society) and the journal The Treasury
• Brazil
Universidade Federal de Santa Catarina , Florianópolis, Núcleo dePesquisas em Informática, Lingüística e Literatura (NUPILL)
Universidade de São Paulo
Laboratório de Inteligência Computacional
Núcleo Interinstitucional de Lingüística Computacional (NILC)
2. Europa
• Austria
Universität Innsbruck , Institut für Sprachwissenschaft
University of Vienna , Austrian Research Institute for ArtificialIntelligence (OFAI)
• Bélgica
Katholieke Universiteit Leuven , Centre for ComputationalLinguistics
Université catholique de Louvain , Centre for English CorpusLinguistics (CECL)
University of Liège , Department of English Language andLinguistics
• Bulgaria
Bulgarian Academy of Sciences, Sofia, Linguistic ModellingLaboratory
University of Plovdiv , Faculty of Mathematics and InformationTechnologies, Computer Science Department
• Croacia
University of Zagreb, Faculty of Philosophy, Institute ofLinguistics
• República Checa
Masaryk University , Brno, Faculty of Informatics, Department ofInformation Technology
Institute of the Czech National Corpus
Charles University Prague , Linguistic Data Lab
• Dinamarca
University of Aarhus , Institut for Linguistik
University of Copenhagen , Faculty of Humanities
Centre for Language Technology (CST)
Department of General and Applied Linguistics (IAAS)
Odense University , Maersk McKinney Moller Institute forProduction Technology, Natural Interactive Systems Group
• Estland
University of Tartu , Research Group of ComputationalLinguistics
• Finlandia
University of Helsinki Department of General Linguistics
• Francia
Université de Provence , AixenProvence, Laboratoire Parole etLangage
Universite d' Avignon , Laboratoire d'Informatique
University of Caen , Groupe de Recherches En Informatique,Image, Instrumentation de Caen (GREYC), Artificial Intelligence
Ecole Nationale Superieure de Fontenay/SaintCloud , Analyse deCorpus Linguistiques, Usages et Traitements
o Grenoble
Université Joseph Fourier, Communication Langagieres etInteraction Personne Systeme (CLIPS)
ICP, European Speech Communication Association (ESCA)
Université Stendhal, Institut National Polytechnique/Institut de laCommunication Parlée
Universitié de Marnela Vallée . Centre d'Études et de Recherchesen Informatique Linguistique (CERIL)
Université de Nantes , Faculté des Sciences et Des TechniquesInstitut de Recherche en Informatique de Nantes, Équipe LangageNaturel (LN)
o Paris
Université Paris 7
Laboratoire d'Automatique Documentaire et Linguistique (LADL)
CampusJussieu , Linguistics Department, TraitementAutomatique du Langage Naturel (TALANA)
• Alemania:
o Berlin
HumboldtUniversität , Philosophische Fakultät II, Institutfür deutsche Sprache und Linguistik
Lehrstuhl für Computerlinguistik
Projektgruppe Strukturelle Grammatik
Technische Universität Berlin , Fachbereich Informatik,Projektgruppe KIT
Geisteswissenschaftliche Zentren Berlin e.V. (GWZ) ,Zentrum für Allgemeine Sprachwissenschaft, Typologieund Universalienforschung (ZAS)
Universität Bielefeld , Fakultät für Linguistik undLiteraturwissenschaft, Arbeitsgruppe Computerlinguistikund Texttechnologie
RuhrUniversität Bochum , SprachwissenschaftlichesInstitut
Rheinische FriedrichWilhelmsUniversität Bonn , Institutfür Kommunikationsforschung und Phonetik
Universität Duisburg , Computerlinguistik
o Erlangen
FriedrichAlexander Universität ErlangenNürnberg
Artificial Intelligence
Computational Linguistics
FORWISS Erlangen
Universität Gesamthochschule Essen , ArbeitsbereichLinguistik
AlbertLudwigsUniversität Freiburg , ArbeitsgruppeComputerlinguistik
GeorgAugustUniversität Göttingen , PhilosophischeFakultät, Seminar fuer Allgemeine und IndogermanischeSprachwissenschaft
FernUniversität Hagen , Applied Computer Science VII
University of Hamburg
Department of Computer Science
Natural Language Systems Division (NatS)
Knowledge and Language Processing (WSV)
University of Heidelberg , Chair for Computional Linguistics
University of Koblenz , Institute for Computational Linguistics
University of Cologne ( Köln ) , Department of Linguistic DataProcessing
OttovonGuerickeUniversität Magdeburg , Institut fürWissens und Sprachverarbeitung, ArbeitsgruppeAngewandte Informatik Wissensbasierte Systeme undDokumentverarbeitung
Institut für Deutsche Sprache , Mannheim
o München
GoetheInstitut , Head Office, München
LudwigMaximiliansUniversität München
Centrum für Informations und Sprachverarbeitung (CIS)
Institute of Phonetics and Speech Communication (IPSK)
Westfälische WilhelmsUniversität Münster , ArbeitsbereichLinguistik
Universität Osnabrück, Institut für SemantischeInformationsverarbeitung
University of Passau , Lehrstuhl für Allgemeine Linguistik
Universität Potsdam
Institut für Germanistik , Abteilung Sprachwissenschaft
Institut für Linguistik
Universität Regensburg , Institut für Informationswissenschaft
Saarbrücken
German Research Center for Artificial Intelligence (DFKI), Saarbrücken, Language Technology Lab
Universität des Saarlandes
Computerlinguistik
Institut für Angewandte Informationsforschung (IAI)
Universität Stuttgart
Institut für Informatik, Abteilung Intelligente Systeme
Institut für Linguistik/Germanistik
Institut für Linguistik/Romanistik
Institut für maschinelle Sprachverarbeitung (IMS)
Universität Trier , LinguistischeDatenverarbeitung/Computerlinguistik
Universität Tübingen
Deutsches Seminar
Seminar für Sprachwissenschaft
• Gran Bretaña
University of Birmingham
Corpus Linguistics Group, School of English
Cognitive Science Research Centre
University of Brighton , Information Technology ResearchInstitute
University of Cambridge
Department of Engineering, Speech, Vision and Robotics (SVR) Group
Natural Language Processing Group
University of Durham (LOLITA Project)
University of Edinburgh :
Centre for Cognitive Science and the Human Communication Research Centre
The Centre for Cognitive Science (CCS)
The Human Communication Research Centre (HCRC)
The European Network in Language and Speech (ELSNET)
The Association for Computational Phonology
Language Technology Group (see also LTG's HelpdeskFAQ
Language Technology Group, NLPSoftware Enquiry Service
The Centre for Neural Systems (CNS)
Department of Artificial Intelligence
Department of Linguistics
University of Essex
CL/MT Research Group
Department of Language and Linguistics
Lexical Functional Grammar (LFG) server
Linguistics Association of Great Britain
Lancaster University
University Centre For Computer Corpus Research on Language (UCREL) (good Index there!)
Department of Linguistics and Modern English
University of Leeds
Speech Lab
Computer Based Learning Unit
School of Computer Studies , Centre for ComputerAnalysis of Language and Speech
University of Liverpool , Research and Development Unit forEnglish Studies
University of London
Birkbeck College , Department of Applied Linguistics
City University , School of Informatics, InformationScience
Imperial College , Department of Computing
King's College , Department of Philosophy,Computational Linguistics and Formal Grammar
School of Oriental and African Studies (SOAS),Department of Linguistics
University College London , Department of Phonetics andLinguistics
University of Manchester Institute of Science and Technology (UMIST) (not part of U Manchester),Department of Language Engineering
Reading University , Department of Linguistic Science, SpeechResearch Laboratory
University of Sheffield , , Department of Computer Science, NLPResearch Group
University of Sussex , School of Cognitive and ComputingSciences, Computational Linguistics Group
University of Sunderland , School of Computing and InformationSystems
University of Wolverhampton at Dudley , School of Languagesand European Studies
• Hungría
Lajos Kossuth University , Center for Applied Linguistics
Hungarian Academy of Sciences, , Budapest , Research Institute for Linguistics
• Irlanda:
o Dublin
Dublin City University, School of Computer Applications
University of Dublin, Trinity College, Computer ScienceDepartment
University of Limerick : NLP in Ireland
• Italia:
European Academy Bolzano
Consiglio Nazionale delle Ricerche (C.N.R.) , Pisa
Istituto di Linguistica Computazionale
Istituto di Elaborazione dell'Informazione
University of Rome
"La Sapienza"
University of Rome "Tor Vergata" , Computer ScienceLaboratory, Gruppo per l'Elaborazione del Linguaggio Naturale(GELN)
Istituto per la Ricerca Scientifica e Tecnologica (IRST) , Trento
Divisione tecnologie cognitive e della comunicazione
Sistemi per il Ragionamento Automatico
Tuscan Word Centre , Pescia
Universita' Ca' Foscari di Venezia , Laboratorio di LinguisticaComputazionale
• Latvia
University of Latvia, Riga, Institute of Mathematics andComputer Science
• Lituania
Vytautas Magnus University, Kaunas, Center of ComputationalLinguistics
• Malta
University of Malta , Institute of Linguistics
• The Netherlands
University of Amsterdam
Institute of Phonetic Sciences
Institute for Logic, Language and Computation
Centrum voor Wiskunde en Informatica (CWI)
Institute of Phonetic Sciences (IFA)
University of Groningen
BCN Linguistics & Cognitive Sciences
Vakgroep Alfainformatica
University of Nijmegen
AGFL (Affix Grammars over a Finite Lattice) Project
Department of Language and Speech
TOSCA corpus linguistics research
Twente University in Enschede, Computer Science Department
Utrecht University, Utrecht institute of Linguistics (OTS)
• Norway
University of Bergen, Norwegian Computing Centre for theHumanities (NCCH)
University of Oslo , Department of Linguistics, The TextLaboratory
• Polonia
University of Wroclaw , Institute of English Philology
CLIP Computational linguistics in Poland (link collection) at IPIPAN Instytut Podstaw Informatyki Polskiej Akademii Nauk(Institute of Computer Science of the Polish Academy ofSciences)
• Portugal
Universidade Técnica de Lisboa , Instituto Superior Técnico,Centro de Automática, Laboratório de Engenharia da Linguagem(LabEL)
• Rumania
Romanian Academy, Section of Information Science andTechnology, Bucharest, Center for Advanced Research inMachine Learning, Natural Language Processing and ConceptualModelling
University "A.I.Cuza" Iasi, Faculty of Computer Science, NaturalLanguage Processing Group
• Rusia
Russian Academy of Sciences, Moscow:
Laboratory of Computational Linguistics
Institute of Linguistics
• Eslovenia
Jozef Stefan Institute , Ljubljana, Department of IntelligentSystems
• España:
Barcelona:
Universitat Politècnica de Catalunya , Departament deLlenguatges i Sistemes Informàtics
Universitat Pompeu Fabra , Institut Universitari de LingüísticaAplicada
University of Corunna , Deptartment of Computer Science,Compilers and Languages
• Madrid
Universidad Autonoma de Madrid , Laboratorio de LingüísticaInformática
Universidad Europea de Madrid , Escuela Superior deInformatica, Departamento de Inteligencia Artificial
Royal Spanish Academy
Universidad de Málaga , Departamento de Lenguajes y Cienciasde la Computación
Rovira I Virgili University , Tarragona, Research Group onMathematical Linguistics and Language Engineering (GRLMC)
Universidad de Las Palmas de Gran Canaria, Depto. de Informática y Sistemas , Las Palmas de Gran Canaria
• Sweden:
Göteborg University :
Faculty of Arts & Humanities
Computational Linguistics Joint Programme
Linguistics Dept.
Swedish Institute for CS (SICS), Kista , Human ComputerInteraction and Language Engineering (HUMLE)
o Stockholm
Stockholm University , Department of Linguistics
Royal Institute of Technology (KTH), Stockholm :
Centre for Speech Technology (CTT)
Department of Speech, Music and Hearing (TMH)
Umeå University , Department of Linguistics
Lund University
Department of Linguistics
Cognitive Science Department
Uppsala University
Department of Linguistics
Language Engineering Programme
• Switzerland
University of Geneva
ISSCO (Institut Dalle Molle pour les Etudes Semantiques etCognitives)
LATL (Laboratoire d'Analyse et de Technologie du Langage)
Université de Lausanne , Linguistics Department
University of Zürich , Computational Linguistics Group
• Turquía
Bilkent University, Computer Science Department, TurkishNatural Language Processing Project
Middle East Technical University , ODTÜ (METU) LcsL,Laboratory for the Computational Studies of Language
• Ucrania
o Severodonetsk Institute of Technology
3. Asia
• China
Hong Kong University of Science and Technology , Department ofComputer Science, Human Language Technology Center
• India
Indian Statistical Institute , Calcutta
National Center for Software Technology (NCST), KnowledgeBased Computer Systems, Natural Language Processing andInformation Retrieval Group
University of Hyderabad , Department of Computer/InformationSciences
• Israel
Tel Aviv University, Department of Hebrew and Semitic Languages
BarIlan University , Department of Mathematics and ComputerScience, Institute for Information Retrieval and ComputationalLinguistics
Weizmann Institute of Science , Rehovot, Faculty of MathematicalSciences
• Japón:
Communications Research Laboratory (CRL)
Japan Electronic Dictionary Research Institute (EDR)
Japan Advanced Institute of Science and Technology (JAIST),Hokuriku, Ishikawa prefecture
Kyushu Institute of Technology, Department of ArtificialIntelligence, Iizuka, Fukuoka
ATR Interpreting Telecommunications Research Laboratories , Kyotoprefecture
Kyoto University , Language Media Laboratory
Nara Institute of Science and Technology (NAIST), ComputationalLinguistics Laboratory, Nara prefecture
• Tokyo
National Institute of Informatics ( NII ) (formerly NACSIS )
Tokyo Institute of Technology
University of Tokyo, Department of Information Science, Natural Language Processing
Electrotechnical Laboratory, Tsukuba
• Korea
Electronics and Telecommunications Research Institute , Computerand Software Technology
Korean Advanced Institute of Science and Technology , Center forArtificial Intelligence Research
Korea University , Natural Language Processing Lab.
• Seoul
Yonsei University , Center for Linguistic Informatics Research
• Malasia
University Sains Malaysia, Penang, Computer Aided TranslationUnit (UTMK)
• Singapur
Kent Ridge Digital Labs , Knowledge Lab
• Tailandia
Southeast Asian Software Research Center , Bangkok
4. África
• Sudáfrica
University of Natal, Durban , Department of Linguistics
5. Oceanía
University of Queensland , Brisbane, Centre for Language Teaching andResearch (CLTR)
Monash University , Clayton, Department of Linguistics
University of Melbourne , Department of Linguistics & AppliedLinguistics
University of Western Australia , Perth, Hellenistic Greek Linguistics
• Sydney
Macquarie University in Sydney, Department of Computing
University of Sydney
Department of Linguistics
University Language Technology Research laboratorY (SULTRY)
APÉNDICE B
DOCENCIA
A continuación se anotan los distintos cursos relacionados con el estudio y la difusión de laingeniería lingüística dentro de instituciones de educación superior, impartidas por algunosmiembros del GIL.
Curso “Aplicaciones de Ingeniería Lingüística”, Posgrado en Lingüística Hispánica,UNAM.Curso “Métodos cuantitativos”, Posgrado en Lingüística Hispánica, UNAM.Curso “Minería de textos”, Posgrado en Ciencias de la Computación, UNAM.Curso “Procesamiento de Lenguaje Natural en Python”, Posgrado en Ciencias de laComputación, UNAM.Curso “Temas especiales de computación”, Facultad de Ingeniería, UNAM.Curso “Estructuras discretas”, Facultad de Ingeniería, UNAM.Curso “Introducción a la ingeniería lingüística”, Facultad de Filosofía y Letras, UNAM.Curso “Optativa de Lingüística”, Facultad de Filosofía y Letras, UNAM.Curso “Bases de datos”, Facultad de Contaduría y Administración, UNAM. Curso “Desarrollo de aplicaciones en RDBMS”, Facultad de Contaduría yAdministración, UNAM.Curso” Programación de interfaces”, Facultad de Contaduría y Administración, UNAM.Curso “Sistemas operativos”, Facultad de Contaduría y Administración, UNAM.Curso “Administración de recursos informáticos”, Facultad de Contaduría yAdministración, UNAM.Curso “Bases de datos postrelacionales”, Facultad de Contaduría y Administración,UNAM.Curso “Taller de Visual Basic 6.0”, Facultad de Contaduría y Administración, UNAM.Curso “Métodos cuantitativos”, Escuela Nacional de Antropología e Historia, ENAH.Curso “Lingüística computacional”, Escuela Nacional de Antropología e Historia,ENAH.Curso “Semiótica”, Instituto Francés para América Latina, IFAL.Curso “Procesamiento digital de imágenes”, Escuela Nacional de EstudiosProfesionales, Aragón.
APÉNDICE C
DESARROLLOS
En esta sección se enumeran algunos de los desarrollos, sistemas y productos que han sidoproducidos por distintas compañías y/o instituciones de investigación.
Lingüística Empresa ProductoComputational Linguistics andLanguage Technology
DFKI L LTCOLLATE:
Deep Linguistic Analysis inVerbmobil
DFKI L LTVMDEEP:
Distributed European LinguisticResource Repository
DFKI L LT RELATOR:
Finite relation expressionnetwork
Lexical FreeNet
Formalisms Working Group EAGLESGerman Text Exploitation DFKI L LT GETESS:Grammar Checker DFKI L LT FLAG:Grammatifix Lingsoft Grammatifix SPG UB The Babel system. An HPSGbased parser for
German
Tabla 7: Desarrollos en lingüística general
Fonética y Fonología Empresa ProductoComputational phonology SIGPHON (SIGPHON) Analyse phonetic data SIL FindPhoneANLD UCCL Alvey Natural Language Tools Automatic speech based service Telia Promotor Självbetjäning Intelligent dialog DFKI L LT INTERPRICE:Multilingual voice Lingsoft Parrot Phonetic Training Tools PTTSpeech recognition Scansoft Dragon NaturallySpeaking
Tabla 8: Desarrollos en fonética y fonología
Morfología Empresa ProductoComputational Morphology andphonology
SIL Computational Morphology and Phonology (SIL)
Morphological analyser CLUE Amalgam Malaga. Morphological parser SIL AMPLE Processor for twolevelphonology and morphology
SIL PCKIMMO
Spell and grammar checker. Euroling Granska
Tagger Connexor Oy Connexor Machinese Phrase Tagger Tagger CLUZ A rulebased partofspeech taggerStatistical PartofSpeechTagging
US The TnT Tagger (for DE and EN)
Tabla 9: Desarrollos en el nivel morfológico
Sintaxis Empresa ProductoConnexor Machinese Syntax Connexor Oy Connexor Machinese Syntax Constraint Grammar Tools Lingsoft AB CGDT English parsing software Ergo Linguistic TechnologiesMachinese Phrase Tagger Connexor FDG lite parserMachinese Syntax Connexor FDG lite parserParser UA A constraintbased syllable parser Parser DCSNYU Apple Pie ParserSyntactic parser SIL PCPATR
Tabla 10: Desarrollos en el nivel sintáctico
Semántica Empresa ProductoMachinese Semantics. Connexor FDG lite parserMultilingual ConceptHierarchies
DFKI L LT MUCHMORE:
Tabla 11: Desarrollos en el nivel semántico
Léxico Empresa ProductoLexical platform for the Spanishlanguage
UPM – UAM ARIES Natural Language Tools
Managing lexicon SIL MacLex Online lexical reference system PU WordNet
Tabla 12: Desarrollos en el nivel léxico
Herramientas Empresa ProductoAutomatic text summarization Euroling SweSum Diagnostic and Evaluation toolsfor Natural LanguageApplications
DFKI L LT DiET:
Dialog system DISCODictate rapports, email andother documents by talking tothe computer.
Voxit Voice Xpress
Disclosure and dissemination ofdocuments
DFKI L LT TWENTYONE:
Integrated translationenvironment
Atril Déja Vù
Multilingual InformationExtraction
DFKI L LT MIETTA:
Multilingual SummarisationTool
DFKI L LT MUSI:
QuestionAnswering System DFKI L LT QUETAL:Tool for developing and testing models ofregular historical sound change
Phono version 4.1
Tool for sound visualization andmanipulation.
Centrum förtalteknologi
WaveSurfer
Tools for annotating linguisticsignals
Annotation Graph Toolkit
Tabla 13: Herramientas
APÉNDICE D
ASOCIACIONES
A continuación se enumeran algunos grupos y asociaciones dedicadas el estudio, lainvestigación y la difusión de la ingeniería lingüística.
Nombre Categoría Área de Investigación LugarComputational Linguistics &Phonetics Dep.
Departamento Semántica formal Saarlandes, Alemania
Teoría sintáctica http://www.coli.unisb.de/Interfaz sintaxissemánticaModelos cognitivosProcesamiento de textoFonéticafonologíaTecnologìas del hablaExtracción de informaciónCorpus Lingüísticos
HPSG Tübingen Grupo Gramática formal (HPSG) Tübingen, AlemaniaCorpus lingüísticos http://www.sfs.uni
tuebingen.de/hpsg/TalanaLattice Laboratorio Generación de textos Paris, Francia
Interacción sintaxissemántica http://talana.linguist.jussieu.fr/Modelos sintácticosModelos semánticos
AssticcotIRITToulouse Laboratorio Recursos terminológicos Toulouse, FranciaLingüística de corpus http://www.irit.fr/ASSTICCOT/Extracción de informaciónIngeniería del conocimiento
Laboratoire de LinguistiqueFormelle
Laboratorio Morfología y fonología Paris, Francia
Sintaxis y semántica formales http://www.llf.cnrs.fr/Entonación, pragmática y discurso
Instituto Universitario deLingüística Aplicada
Instituto Terminología Barcelona, España
Lexicografía http://www.iula.upf.es/Corpus especializadosRecursos terminoloógicosExtracción de informaciónLingüística computacional
Tabla 14: Centros de investigación en Europa
Nombre Categoría Área de Investigación LugarHPSG Stanford Group Grupo Recursos electrónicos para el inglés Stanford, USA
esu Gramática formal (HPSG) http://hpsg.stanford.edu/
Bases léxicas de conocimientos
LexicalFunctional GrammarGroup
Grupo Gramática léxicofuncional Stanford, USA
Teoría de la optimalidad http://wwwlfg.stanford.edu/lfg/
Lógica linear e inferencia semántica
Computational Semantics Lab Laboratorio Mapeo de información Stanford, USA
Interfaces conversacionales http://wwwcsli.stanford.edu/semlab/
Interacción en lenguaje natural
Laboratory of Linguistics andComputation
Laboratorio Lexicón generativo Brandeis, USA
Resolución de anáforas y correferencia http://www.cs.brandeis.edu/~llc/
AIRG Harvard Laboratorio Lingüística computacional Harvard, USA
Modelos estadísticos para PLN http://www.eecs.harvard.edu/ai/
Discurso
Artificial Intelligence and NLP Grup Sistemas de diálogo Rochester, USA
Modelos del lenguaje http://www.cs.rochester.edu/dept/ainlkr/
Traductores automáticos
Interacción multimodal
Parsing automático
Semántica del lenguaje natural
Spoken Language Systems Laboratorio Sistemas conversacionales MIT, Cambridge, USA
Procesamiento de voz http://www.sls.csail.mit.edu/sls/research/
Reconocimiento del habla
Generación del lenguaje
Natural Language QuestionAnswering
Laboratorio Inteligencia artificial MIT, Cambridge, USA
Lingüística computacional http://www.ai.mit.edu/projects/infolab/
Interfaces hombremáquina
Language and ComputationLab
Laboratorio TreeAdjoining Grammar Pensilvania, USA
Modelos estadísticos http://www.cis.upenn.edu/~linc/home.html
Herramientas de análisis lingüístico
Parsing automático
Desambigüación de palabras
Aprendizaje máquina
Extracción de información
Tabla 15: Grupos de investigación en E.U.A.
APÉNDICE E
EVENTOS
A continuación se listan algunos eventos (congresos, simposios, coloquios, seminarios)relacionados con la ingeniería lingüística, tanto a nivel nacional como internacional. Deigual forma se da una lista de los eventos que tendrán lugar este año.
Simposio Iberoamericano de TerminologíaInternational Workshop on Computational TerminologyACL Coloquio de Lingüística en la Escuela Nacional de Antropología e HistoriaSemana de la informáticaEncuentro de Estudiantes de Literatura y Lingüística de la Universidad NacionalAutónoma de MéxicoSemana de Lingüística (UAM – I)Congreso Nacional de Lingüística (AMLA)Panel on Lexical Markers of Common Grounds 8th International PragmaticsConferenceTaller regional de Recuperación de Información y Procesamiento de LenguajeNaturalSimposio Internacional de Comunicación SocialEncuentro Internacional de Lingüística en el NoroesteCongreso Latinoamericano de Multimedieros Universitarios The North American Symposium on Corpus LinguisticsConferencia Internacional CICLingCiclo de Conferencias Redes e InternetEncuentro Nacional de TerminologíaTaller Internacional de Procesamiento Computacional del Español y Tecnologíasdel LenguajeSimposio Internacional de Comunicación SocialJornadas Iberoamericanas de TerminologíaCongreso Internacional EURALEX Congreso Internacional ColingSituación actual y futuro de la ingeniería lingüística en MéxicoConferencia Internacional LRECSecond UK Special Interest Group for Computational LinguisticsAcademic MiniConferenceINTERCOCTA Workshop
Las próximas reuniones que se llevarán a cabo este año son:
Nombre del evento Lugar WEB PageTAG+7 Vancouver, Canadá http://www.cs.rutgers.edu/TAG+7/
Intex/Nooj 2004 Tours, Francia http://tln.li.univtours.fr/JIntex2004/modele.html
NLDB2004 Salford, Manchester, Inglaterra http://www.nldb.org/
InSTIL/ICALL Symposium 2004 Venecia, Italia http://sisley.cgm.unive.it/ICALL2004/index.htmINLG04 New Forest, Inglaterra http://www.itri.brighton.ac.uk/inlg04/cfp.htm
CATALOG04 Barcelona, España http://www.upf.edu/dtf/personal/enricvallduvi/catalog04/LFG 2004 Christchurch, Nueva Zelanda http://wwwlfg.stanford.edu/lfg/lfg2004/
ACL 2004 Barcelona, España http://www.acl2004.org/MCLI Colloquium Bloomintong, Indiana http://jones.ling.indiana.edu/~mclc/EMNLP 2004 Barcelona, España http://www.cs.ualberta.ca/~lindek/emnlp04/IR for QA Sheffield, EnglandCOLING 2004 Ginebra, Suiza http://www.issco.unige.ch/coling2004/ESSLLI 2004 Nancy, Francia http://esslli2004.loria.fr/givepage.php?1"Cognitive Modeling in Linguistics04" Varna, Bulgaria http://www.cml.misis.ru/index.html?navi=mainAISC 2004 Hagenberg, Austria http://www.risc.unilinz.ac.at/conferences/aisc2004/NCPW 2004 Plymonth, England http://www.tech.plym.ac.uk/socce/ncpw9/IWHLT 2004 HongKong http://web.hku.hk/~hlt2004/IMCI 2004 Penn State University, Pensilvania http://www.icmiplace.org/ICGI 2004 Atenas, Grecia http://www.iit.demokritos.gr/icgi04/EKAW 2004 Northamptonshire, Gran Bretaña http://kmi.open.ac.uk/people/victoria/ekaw/EsTAL 2004 Alicante, España http://gplsi.dlsi.ua.es/congresos/estal04/WORM 2004 Lacarna, Chipre http://www.starlab.vub.ac.be/staff/mustafa/WORM_2004.htmICDM 2004 Brigthon, Gran Bretaña http://icdm04.cs.unidortmund.de/VIII EILN 2004 Hermosillo, Sonora, México http://www.8encuentro.uson.mx/default1.htmFOIS 2004 Torino, Italia http://fois2004.di.unito.it/index.html
Tabla 16: Eventos relacionados con la ingeniería lingüística a realizarse en el año 2004
APÉNDICE F
PROYECTOS
A continuación se enumeran los índices de los proyectos en los que el GIL ha participado,además, se da una liga a los documentos completos de cada proyecto para que se tenga unavisión global de cada uno de ellos.
1. Corpus en ingeniería1.1 Constitución del corpus
1.1.1 Obtención de textos1.1.2 Delimitación de las áreas de ingeniería1.1.3 Identificación de fuentes1.1.4 Registro de información1.1.5 Solicitud de autorías1.1.6 Cartas de presentación1.1.7 Búsqueda de textos
1.2 Digitalización1.2.1 Escaneado en PDF imagen1.2.2 Escaneado en formato OmniPage1.2.3 Escaneado en formato texto1.2.4 Análisis de limpieza óptima del texto1.2.5 Limpieza del texto1.2.6 Salvado del archivo en texto
1.3 Etiquetado1.3.1 Estudio de etiquetado
1.3.1.1 Normalización de etiquetado (EAGLES, TEI)1.3.2 Lenguaje XML1.3.3 Análisis de etiquetas de corpus internacionales (UPF, BNC)
1.4 Definición de etiquetas para documentos1.4.1 Análisis bibliográfico de los textos1.4.2 Definición de elementos bibliográficos de los textos1.4.3 Identificación de etiquetas
1.5 Definición de etiquetas para el contenido1.5.1 Análisis de textos1.5.2 Consulta de requerimientos para el GIL1.5.3 Identificación de etiquetas
1.6 Elaborar un editor de textos para etiquetado 1.6.1 Buscar un editor1.6.2 Adaptar el editor
1.7 Etiquetado de los textos1.7.1 Marcaje semiautomático1.7.2 Marcaje automático
1.7.3 Parsing para revisión1.7.4 Cabecera del documento
1.8 Almacenamiento de textos en el corpus1.9 Administración
1.9.1 Registro de información sobre contactos, fuentes, áreas, textos, controlde préstamos1.9.2 Seguimiento de textos obtenidos y búsqueda de faltantes1.9.3 Registro de avance en digitalización de textos1.9.4 Creación de la página WEB del corpus1.9.5 Registro de textos ya etiquetados y difusión1.10 Herramientas de análisis1.10.1 Conteo de tokens y de palabras1.10.2 Índice de palabras alfabético y por frecuencias1.10.3 Concordancias
2. Extracción terminológica2.1 Estudio de métodos de extracción
2.1.1 Búsqueda de bibliografía2.1.2 Búsqueda en Internet
2.2 Búsqueda de extractores (UPF)2.3 Obtención, análisis y selección de extractores2.4 Extracción de términos
2.4.1 Obtención del corpus2.4.2 Extracción manual2.4.3 Extracción automática2.4.4 Evaluación
3. Extracción conceptual3.1 Banco de contextos definitorios
3.1.1 Base de datos de contextos definitorios3.1.2 Captura de contextos definitorios3.1.3 Marcaje de elementos de los contextos definitorios
3.2 Estudio de contextos definitorios3.2.1 Predicaciones pragmáticas (definición de patrones de formación)3.2.3 Predicaciones verbales (definición de patrones sintácticos y semánticos)3.2.4 Definiciones (estudio de las estructuras sintácticas)3.2.5 Relación entre los elementos de los contextos definitorios
3.2.5.1 Relaciones entre predicaciones verbales y tipos de definición3.2.5.2 Relaciones anafóricas entre términos y definiciones
3.2.6 Búsqueda de bibliografía relacionada3.3 Expansión del paradigma de los elementos constitutivos
3.3.1 Expansión del paradigma verbal3.3.2 Expansión del paradigma pragmático
3.4 Etiquetado de las partes de la oración3.5 Etiquetado de las estructuras sintácticas3.6 Etiquetado tipográfico3.7 Motor de búsqueda
3.7.1 Definir modelos de búsqueda3.7.2 Diseño del motor de búsqueda
3.8 Extracción de contextos definitorios3.8.1 Definir reglas y restricciones3.8.2 Realizar búsquedas 3.8.3 Obtención de resultados3.8.4 Evaluación (Precision & Recall)3.8.5 Redefinición de reglas y restricciones
4. Banco terminológico4.1 Diseño del banco
4.1.1 Compatibilidad con otros bancos en el mundo4.1.2 Información del banco
4.1.2.1 Presentación del banco4.1.2.2 Créditos4.1.2.3 Estadísticas de usuarios4.1.2.4 Estadísticas de volumen de información
4.2 Normalización de etiquetado (EAGLES, TEI)4.2.1 Lenguaje XML4.2.2 Análisis de etiquetas de corpus internacionales (UPF, BNC)
4.3 Funcionalidad del banco4.3.1 Interfaz del usuario4.3.2 Asignación de cuentas4.3.3 Ayuda
4.4 Captura de información4.4.1 Captura de datos terminológicos4.4.2 Revisión terminológica de las bases de datos
4.5 Transferencia de datos a otras bases y aplicaciones del GIL4.5.1 Base de datos de contextos definitorios4.5.2 Determinación de paradigmas semánticos4.5.3 Determinación de palabras clave4.5.4 Formulaciones (queries) específicas
4.6 Control de usuarios4.6.1 Control de cuentas4.6.2 Control de captura por usuario
4.7 Respaldo del banco4.8 Transferencia de datos con otros bancos mundiales
4.8.1 GDTOLF, Québec4.8.2 IULA, Barcelona4.8.3 RITerm
5. Paradigmas semánticos5.1 Estructura externa de conceptos
5.1.1 Estudio de estructura externa de conceptos 5.1.1.1 Consideraciones terminológicas5.1.1.2 Ontologías y tesauros5.1.1.3 WordNet
5.2 Obtención de la estructura conceptual de terminologías5.2.1 Obtención a partir de definiciones léxicas5.2.2 Obtención a partir de WordNet
5.3 Determinación de campos semánticos5.3.1 Integración de una terminología5.3.2 Diferenciación por campos
5.4 Estructura interna de conceptos5.4.1 Estudio de estructura interna de conceptos 5.4.2 Identificación de rasgos distintivos por campos semánticos5.4.3 Comparación entre definiciones del mismo término5.4.4 Comparación entre términos del campo5.4.5 Comparación con otros campos
5.5 Obtención de palabras clave5.5.1 Extracción de las definiciones5.5.2 Asignación intuitiva5.5.3 Extracción de diccionarios de sinónimos
5.6 Agrupación de palabras clave en paradigmas semánticos5.7 Algoritmo de paradigmas mediante alineamiento de definiciones
5.7.1 Mejoras al algoritmo5.7.1.1 Experimentación de variantes del algoritmo
5.7.2 Implementación del algoritmo SierraMcNaughtCastillo5.7.2.1 Revisión al programa de McNaught
5.8 Base de paradigmas semánticos5.8.1 Determinación automática de pares semánticos5.8.2 Integración de base de conocimientos de paradigmas semánticos
6. Diccionario prototipo onomasiológico6.1 Motor de búsqueda6.2 Bases de datos
6.2.1 Palabras claveID palabras clave6.2.2 ID palabras claveID paradigmas6.2.3 ParadigmasID paradigmas6.2.4 ID paradigmasID términos6.2.5 ID términosTérminosDefinición
6.3 Interfaz6.4 Pruebas de retroalimentación6.5 Diccionario semasiológico
6.5.1 Corrector ortográfico6.5.2 Interfaz6.5.3 Pruebas de retroalimentación
7. Diccionario integral7.1 Integración de ambos diccionarios7.2 Inclusión de nuevos tipos de búsqueda7.3 Interfaz7.4 Pruebas de retroalimentación
8. Diccionario de lingüística8.1 Utilizar la terminología recopilada en el área de lingüística y presentarla comoun diccionario semasiológico electrónico, en donde se incluyan, por cada término: elárea, la definición, ejemplos, la tipología, etc.
8.1.1 Capturar las fichas documentales en forma electrónica.8.1.2 Codificar el artículo lexicográfico conforme a cada uno de los campos quelo integran.8.1.3 Diseñar el diccionario semasiológico electrónico e integrar la informacióncodificada.8.1.4 Elaborar el programa de hipertextos.
8.2 Buscar la agilización de la recopilación de términos y definiciones mediante laidentificación de operadores metalingüísticos explícitos en los textos especializados.
8.2.1 Encontrar un patrón aceptable de operadores metalingüísticos explícitosque puedan ser utilizados para la identificación de términos y definiciones entextos especializados, tales como páginas de Internet y documentos electrónicos.8.2.2 Hacer un fichero terminológico que incluya el contexto de donde sonextraídos los términos y definiciones, y que identifique los operadoresmetalingüísticos que permitan inferir el concepto.
8.3 Determinar la estructura externa de los conceptos, es decir, la red ontológica ointerrelación entre los conceptos, que permita organizar los resultados de salida anteuna búsqueda onomasiológica.
8.3.1 Analizar los textos especializados en lingüística con el fin de encontrar laestructura externa conceptual de la terminología.8.3.2 Considerar que la descripción de los conceptos incluya la estructuraconceptual, esto es, su relación con los otros conceptos.
8.4 Definir la estructura interna con base en los conceptos redefinidos que incluyanla interrelación con otros conceptos. La estructura interna es la determinación de losparadigmas semánticos que conforman cada concepto y permite expandirautomáticamente la formulación inicial del usuario.
8.4.1 Modificar el algoritmo para determinar paradigmas semánticos en español.En el proyecto doctoral, el algoritmo fue aplicado a una terminología en inglés,con programas existentes adecuados a dicho idioma, lo que hace necesario quese tenga que desarrollar o verificar para el español.8.4.2 Validar el algoritmo mediante su aplicación a una terminología diferente,con un mayor número de términos, ya que en el proyecto doctoral se aplicó a unreducido número de términos y en un campo más específico.8.4.3 Evaluar los paradigmas con base en la distancia conceptual en EuroWordNet para español.
8.5 Elaborar el sistema integral de consulta semasiológica y onomasiológica detérminos de lingüística.
8.5.1 Revisar la arquitectura existente del sistema de consulta onomasiológicaen donde se incluye la interfaz del terminólogo y la del usuario, así como la baseléxica de conocimientos conformada por los paradigmas semánticos.8.5.2 Diseñar y elaborar el programa para identificar automáticamente losparadigmas que corresponden a cada concepto, mediante la lectura de laspalabras clave que contienen.8.5.3 Programar el sistema de búsqueda onomasiológica, mediante laformulación en lenguaje natural, es decir, enunciados completos más quepalabras clave.8.5.4 Analizar los resultados de salida y ordenarlos jerárquicamente a través dela estructura externa conceptual.
9. Proyecto ILEXPrimer año:
9.1 Investigar tanto las características típicas de multimedia e ingeniería desoftware, así como las herramientas tecnológicas de procesamiento de lenguajenatural y de recuperación de información.9.2 Revisar y evaluar las ventajas y desventajas de los diccionarios electrónicosdisponibles en el mundo.9.3 Determinar los recursos computacionales que mejor servirán como vehículopara realizar búsquedas inteligentes, tanto semasiológicas como onomasiológicas.9.4 Identificar los métodos para presentar de la mejor manera los materiales queconstituyen el diccionario. 9.5 Seleccionar las mejores características y herramientas encontradas como basepara el diseño del diccionario electrónico, a partir de la información obtenida.
Segundo año:9.6 Diseñar la interfaz del diccionario electrónico que satisfaga las necesidades yrequerimientos de los usuarios y cumpliendo con los criterios de amigabilidad,accesibilidad y economía.9.7 Desarrollar la interfaz con la ayuda del algún lenguaje de programación queproporcione portabilidad, compatibilidad y migración entre diferentes sistemasoperativos.9.8 Construir motores inteligentes de búsqueda con PLN.9.9 Incorporar los aspectos de multimedios que harán más atractivo al diccionarioelectrónico.9.10 Diseñar una estructura modular del ILEX que permita el crecimiento deldiccionario sin la necesidad de modificar la interfaz.9.11 Alimentar al diccionario electrónico con las fichas terminológicas(especialmente términos y definiciones) de alguno de los varios diccionarios quetenemos a disposición.
Tercer año:9.12 Diseñar plan de pruebas para detectar errores.9.13 Ejecutar plan de pruebas.9.14 Analizar los resultados de las pruebas.9.15 Corregir errores y ajustar interfaz.9.16 Diseñar plan de mantenimiento.
10. Diccionario de sexualidad10.1 Sistematizar la terminología en torno a la sexualidad.
10.1.1 Construir un corpus de sexualidad.10.1.2 Construir un sistema conceptual.10.1.3 Identificar los términos y sus sinónimos que se incluirán en eldiccionario.10.1.4 Construir base de datos.10.1.5 Redactar definiciones entendibles por la población en general /terminólogos y sexólogos / ilustrar los términos.10.1.6 Validar el diccionario ante expertos y con grupos focales.
10.2 Hacer accesible la información sobre sexualidad.10.2.1 Estructurar didácticamente los conceptos e ilustraciones adecuado alpúblico.10.2.2 Validar con grupos focales el diccionario.10.2.3 Diseñar y elaborar un diccionario electrónico con interfaz inteligente.10.2.4 Promover el diseño y la elaboración de un diccionario de sexualidad enlínea.10.2.5 Promover la edición en papel del diccionario de sexualidad.10.2.6 Promocionar el diccionario de sexualidad entre:
a) Expertos en sexualidad,b) Comunicadores,c) Tomadores de decisiones, d) Público meta.
10.2.7 Elaborar estrategia de distribución.
10.3 Construir el vehículo computacional de sustento para el diccionario.10.3.1Construir el corpus.10.3.2 Construir el banco terminológico.10.3.3 Adquirir el software de extracción terminológica.10.3.4 Desarrollar el diccionario.10.3.5 Realizar pruebas al diccionario.
10.4 Fortalecer un equipo multidisciplinario para la elaboración de un diccionariode sexualidad. El equipo de trabajo estará conformado por profesionistas en diseñográfico, ilustradores, pedagogos, sexólogos, terminólogos, computólogos.
10.4.1 Establecer acuerdos formales de participación entre las institucionesimpulsoras del proyecto.10.4.2 Conformar equipo de informáticos, diseñadores, terminólogos, sexólogose ilustradores.10.4.3 Sensibilizar en sexualidad y en terminología.10.4.4 Generar un sistema de incentivos.
10.4.5 Promover reuniones de intercambio y convivencia. (grupos de discusión)
10.5 Movilizar recursos.10.5.1 Elaborar propuesta ganadora.10.5.2 Buscar patrocinios blandos.10.5.3 Conseguir patrocinadores internacionales y nacionales.10.5.4 Promover que el proyecto sea autosustentable.
APÉNDICE G
BECARIOS
A continuación se presenta una relación, así como una pequeña descripción de lasactividades de los integrantes del GIL, que actualmente disfrutan de una beca oremuneración económica.
• Técnicos Académicos
Gabriel Castillo Hernández. Maestro en Ingeniería y Ciencias de la Computación de laUNAM (2002). Técnico Académico del Instituto, quien apoya al GIL desde el 2000,actualmente mantiene este apoyo en la coordinación de alumnos de cómputo. Asimismo,imparte cursos en la Facultad de Ingeniería de la UNAM.
• Becarios en el Nivel PostDoctoral
Alfonso Medina Urrea. Doctor en Lingüística por parte de El Colegio de México en 2003.Fue incorporado al GIL como becario doctoral y posdoctoral desde 2002 y el 1º de junio de2003 como Investigador Posdoctoral por dos años. Está dirigiendo una parte del proyectode CONACYT (recopilación de documentos, organización y análisis del CorpusLingüístico de Ingeniería), a la vez que está desarrollando sus propias líneas deinvestigación, especialmente en el área de morfología computacional. Para ello, supervisalas actividades de algunos alumnos. Ha impartido cursos en la UNAM en la Facultad deIngeniería, así como en el Posgrado de Lingüística. Como becario Postdoctoral, tuvo unaestancia de investigación de diez días en el Centro de Lingüística Aplicada, Santiago deCuba, para conocer un analizador sintáctico probabilístico y su posible uso en los proyectosdel GIL. Su estancia fue patrocinada por el proyecto CONACYT. Igualmente, hapresentado trabajos en distintos foros nacionales e internacionales sobre corpus lingüístico,morfología de lenguas indígenas, así como diseño de un diccionario electrónico desexualidad.
• Profesores invitados
Carlos Rodríguez Penagos. Estudiante al nivel Doctoral de la Universidad Pompeu Fabra.Se incorporó al GIL como profesor invitado desde agosto del 2003 a diciembre de 2004. Haimpartido un curso de programación para lenguaje natural (véase
http://iling.torreingenieria.unam.mx/cursoPLN/default.htm), de interés general para el GIL.Trabaja en un proyecto conjunto de extracción de información conceptual. Actualmenteestá encargado de la búsqueda de nuevos proyectos. En este año, presentará avances de suinvestigación y colaboración con el GIL en foros de Estados Unidos y Europa sobrelingüística computacional y terminología.
• Becarios académicos
Carlos Méndez Cruz. Becario académico con Licenciatura en informática y estudiando losprerrequisitos para la maestría en Lingüística Hispánicas. Imparte cursos de diseño yadministración de bases de datos en la Facultad de Contaduría y Administración de laUNAM. Se encuentra a cargo del mantenimiento de la red de cómputo del GIL, así comodel diseño de la página WEB, a través de cinco estudiantes de licenciatura en informática,que realizan su servicio social.
• Becarios doctorales
César Antonio Aguilar. Maestro en Lingüística por parte del Posgrado en Lingüística en2003. Incorporado al GIL desde febrero del 2002, ha desempeñado labores para laorganización y administración de becarios de este Grupo, así como colaboraciones en elanálisis lingüístico en contextos definitorios. A partir de esta colaboración, presentó unproyecto de investigación al nivel Doctoral en el Posgrado de Lingüística de la UNAM, elcual fue aceptado en agosto del 2003. Tal proyecto va dirigido a hacer una descripción depatrones sintácticos, semánticos y discursivos localizados en definiciones dentro de textosde especialidad. Tal investigación ha contado con las colaboraciones de Rodrigo Alarcón, yde Carlos Rodríguez Penagos. Fruto de dicha colaboración será la presentación de algunostrabajos en foros de lingüística y terminología nacionales y extranjeros durante este año.
Rodrigo Alarcón Martínez. Licenciado en Letras Hispánicas por parte de la Facultad deFilosofía y Letras de la UNAM, integrado al GIL desde el 2000. Elaboró una tesis sobre elanálisis de patrones lingüísticos localizados en contextos definitorios en español, la cual hafundado una línea de investigación de suma importancia para el GIL: el reconocimiento yanálisis de contextos definitorios en español. La documentación de este estudio estáplasmada en varias presentaciones en Congresos nacionales e internacionales, así como enartículos publicados en revistas especializadas. En agosto del 2003 fue aceptada sucandidatura para cursar el Doctorado en Lingüística Aplicada en el Instituto de LingüísticaAplicada de la Universitat Pompeu Fabra (Barcelona, España). Hoy en día, mantiene unacolaboración constante con el GIL, específicamente en el análisis lingüístico de contextosdefinitorios y representación de conceptos en textos de especialidad.
• Becarios de Maestría
Marlene Moreno del Pilar. Licenciada en Ingeniería de la Computación por parte de laUNAM, integrada al GIL desde 2002. Ha hecho trabajos de diseño de interfaces, así comola instalación y administración de servidor UNIX para el Corpus Lingüístico de Ingeniería.Realizó su tesis de licenciatura con la asesoría de Gabriel Castillo, obteniendo el título en2003. Durante este periodo, con Gabriel Garduño realizaron una estancia de IntercambioAcadémico de tres meses en el Instituto Universitario de Lingüística Aplicada de laUniversidad Pompeu Fabra (UPF), donde tomaron tres cursos a nivel de doctorado, seintegraron al Proyecto del Corpus de la UPF y desarrollaron una herramienta para elpreprocesamiento de los textos del mismo proyecto. Dicha estancia tuvo patrocinio delProyecto CONACYT, de la DGEP y de la UPF. En la actualidad, cursa el 3er semestre de laMaestría en Ingeniería y Ciencias de la Computación del IIMAS, con miras a realizar unainvestigación para el diseño de los diccionarios electrónicos del GIL. Por ello, se encuentraa cargo del área de desarrollo de Diccionarios Electrónicos, para lo cual coordina a variosestudiantes de licenciatura en cómputo y lingüística. Igualmente, imparte un curso en laFacultad de Ingeniería de la UNAM.
Gabriel Garduño Torres. Licenciado en Ingeniería en Computación, cursa actualmente el3er semestre de la Maestría en Ingeniería y Ciencias de la Computación del IIMASUNAM.Inició sus labores dentro del GIL como Servidor Social en 2001, posteriormente realizó untrabajo en el diseño y administración del Banco Terminológico (véase la página WEB:http://iling.torreingenieria.unam.mx/diccionarios/), con el cual obtuvo su grado deLicenciado en Ingeniería en Cómputo en el 2003. Su labor dentro del Grupo se haconcentrado en el diseño y administración del Banco Terminológico, así como en laplaneación de interfaces para diccionarios electrónicos en Lingüística y Sexualidad. Juntocon Marlene Moreno realizó una estancia de Intercambio Académico de tres meses en elInstituto Universitario de Lingüística Aplicada (IULA) de la Universidad Pompeu Fabra,participando en tres cursos a nivel de doctorado, e integrándose también al Proyecto delCorpus de la UPF, específicamente en la elaboración de una herramienta para elpreprocesamiento de los textos del mismo proyecto. Tal estancia hizo efectivo un acuerdode colaboración e intercambio de estudiantes entre el Instituto de Ingeniería de la UNAMcon el IULA, lo que ha ayudado a reforzar la proyección del GIL a nivel internacional.Sumado a sus actividades como estudiante de Maestría, hoy en día está a cargo del área deinvestigación dedicada al desarrollo del Banco Terminológico.
Antonio Reyes Pérez. Estudiante de la Maestría en Lingüística Hispánica de la UNAM,desempeña labores en el GIL desde el 1º de octubre del 2000. Ha sido Servidor Social,becario al nivel de tesis de licenciatura (patrocinado por DGAPA y CONACYT), y en laactualidad becario de estudios de Posgrado (patrocinado por CONACYT). Su trabajo se hadirigido al análisis lingüístico de información para la obtención de paradigmas semánticospara los diccionarios de física y lingüística, usando la herramienta WordSmith, así como laimplementación de redes semánticas en textos de especialidad. Se encuentra a cargo del
área de investigación en Bases de Conocimientos Léxicos, la cual se deriva de sus estudiosen Licenciatura y Maestría. El resultado de sus análisis se ha presentado en ponencias yartículos publicados en foros nacionales y extranjeros desde el 2002 hasta la fecha.
• Becarios de Licenciatura
Antonia Estrada Trejo. Pasante de la carrera de Letras Hispánicas (con especialidad enLingüística) por parte de la UNAM. Ingresó al GIL en agosto del 2001 como becaria deestudios en el nivel de licenciatura, dedicada a la revisión lexicográfica del bancoterminológico, así como al reconocimiento de patrones tipográficos y sintácticos en eldiccionario onomasiológico de lingüística. Posteriormente, ha desarrollado un proyecto detesis de licenciatura enfocado hacia el análisis de relaciones conceptuales empleando elsistema de cómputo WordNet. Igualmente, colabora en el proceso de selección y escaneadode textos para el Corpus Lingüístico.
Carla Márquez González. Pasante de la carrera de Letras Hispánicas (con especialidad enLingüística) de la Facultad de Filosofía y Letras de la UNAM. Se incorporó al GIL en2001, realizando trabajos de análisis para la determinación de palabras claves para consultasonomasiológicas, así como escaneo de textos de especialidad para el Corpus Lingüístico deIngeniería. Concluyó tales labores en 2002. Desde 2003 hasta la fecha, colabora con el GILde manera externa en una investigación sobre el uso de paradigmas semánticos para larealización de búsquedas onomasiológicas (en colaboración con otros estudiantes de lasáreas de cómputo y lingüística), con miras a realizar su tesis de licenciatura.
Martha Grizel Delgado Rodríguez. Becaria de licenciatura en Letras Hispánicas(lingüística) desde el 1º de julio del 2002, colabora dentro del GIL en la digitalización detextos para el Corpus Lingüístico en Ingeniería. Realizó una estancia de trabajo en el VIIPrograma de la Investigación Científica, patrocinado por la AMC (julioagosto del 2003),en el Centro de Investigación en Cómputo del Instituto Politécnico Nacional, bajo laasesoría del Dr. Alexander Gelbukh, jefe del Laboratorio de Procesamiento de LenguajeNatural. En la actualidad, elabora su tema de investigación para tesis de licenciatura encuestiones de conceptualización desde un enfoque onomasiológico, colaborando con otrosestudiantes de cómputo y lingüística en las áreas de Diccionarios Electrónicos (a cargo deMarlene Moreno) y Base de Conocimientos Léxica (supervisada por Antonio Reyes).
Carlos Fonseca Rojas. Estudiante de la carrera en Ingeniera de la Computación de laUNAM, ingresó al GIL en junio del 2002, dándose de alta posteriormente como servidorsocial el 1º de septiembre del 2003. Ha hecho actividades de digitalización de textos para elCorpus Lingüístico de Ingeniería, así como la integración de sinónimos al Diccionario deLingüística. En la actualidad, realiza labores de apoyo en cómputo para las áreas deDiccionarios Electrónicos y Base de Conocimientos Léxicos, así como delimitación de unproyecto de tesis de licenciatura (en proceso).
Brenda Torres Castillo. Estudiante de la carrera en Ingeniera de la Computación de laUNAM. Se incorporó al GIL el 1º de septiembre del 2002 como becaria al nivel delicenciatura, bajo la coordinación de Gabriel Castillo. Ha desempeñado labores tales comola digitalización de documentos para el Corpus Lingüístico, así como apoyo para laobtención de documentos electrónicos especializados en Ingeniería. En la actualidad,colabora en el desarrollo de un prototipo para el Diccionario Onomasiológico enLingüística, asesorada tanto por Castillo como por Marlene Moreno.
Jessica Alejandra Méndez. Se integró al GIL el 1º de septiembre del 2002, como becariaal nivel de licenciatura. Es estudiante de la carrera en Ingeniería de la Computación porparte de la UNAM. Ha participado en la creación de una interfaz para un diccionario deSexualidad, así como en el desarrollo de sistemas para la creación de DiccionariosOnomasiológicos, bajo la dirección de Gabriel Castillo. En la actualidad, colabora en ladigitalización de textos para el Corpus Lingüístico. Contando con la asesoría de MarleneMoreno, formará parte de un proyecto de tesis colectiva entre estudiantes de cómputo ylingüística para el desarrollo de diccionarios electrónicos.
Nadia Buendía Silva. Desempeña labores dentro del GIL desde septiembre del 2002 bajola dirección de Gabriel Castillo. Se dio de alta como becaria al nivel de licenciatura el 1º demarzo del 2003. Participa en la digitalización de documentos para el Corpus de Ingeniería,y junto con Jessica Alejandra Méndez, se integrará a un proyecto de tesis colectiva para eldesarrollo de diccionarios electrónicos, coordinada por Marlene Moreno.
Eduardo Solares Martínez. Ingresó al GIL como becario al nivel de licenciatura el 1º deseptiembre del 2002 para trabajar en el etiquetado de palabras del diccionario de lingüística,así como escaneo de textos de especialidad para el Corpus Lingüístico en Ingeniería. Apartir de esto, ha colaborado en la selección y agrupamiento de palabras claves para elDiccionario de Física, en la implementación de un algoritmo para la agrupación de cabezasde paradigmas en JAVA, así como en la migración de sinónimos en WordNet en XML aMSSQL. En este año comenzará la elaboración de su tema de tesis de licenciatura en eldesarrollo de una interfaz para diccionarios electrónicos, en colaboración con otrosestudiantes de cómputo y lingüística, bajo la asesoría de Marlene Moreno.
APÉNDICE H
GIL
A continuación se detalla el desarrollo del GIL a través de sus integrantes y del trabajo quehan realizado.
Becarios Categoría Procedencia Nivel Área Ingreso
Adriana Miranda Nava Becario TL UNAM LicIng.Comp. 01Sep02
Antonia Estrada Trejo Becario TL UNAM Lic Letras His 01Sep01Antonio Reyes Pérez Becario M UNAM Ma Ling His 01Sep00
Brenda Torres Castillo Estudiante L UNAM LicIng.Comp. 01Sep02
Carla Márques González Becario TL UNAM Lic Letras His 01Sep01
Carlos Fonseca Rojas Estudiante L UNAM LicIng.Comp. 01Sep02
Carlos Méndez Cruz Becario Aca UNAM Lic Inform 01May03Carlos RodríguezPenagos Becario TD UPF Doc
LingAplid 01Ago03
César A. Aguilar Becario D UNAM Doc Ling His 01Mar02Eduardo SolaresMartínez Becario TL UNAM Lic
Ing.Comp. 28Abr03
Enrique Romero García SS UNAM LicIng.Comp. 23Mar04
Fabricio Jocabad Vallejo SS UNAM Lic Inform 01Mar04Grizel DelgadoRodríguez Becario TL UNAM
Bach. Letras His 01Jun02
Gabriel Garduño Torres Becario M UNAM MaIng.Comp. 01Mar01
Itzia Baca Ibarra SS UNAM Lic Filosof 21Nov03
Jessica Méndez Liceaga Becario TL UNAM LicIng.Comp. 01Sep02
Luis Daniel Escobar SS ENAH Lic Ling 14Oct03Mariano NavarroMorales Estudiante L UNAM Lic
Ing.Comp. 28Abr03
Marlene Moreno del Pilar Becario M UNAM MaIng.Comp. 01Mar02
Nadia Buendia Silva Becario TL UNAM LicIng.Comp. 01Mar04
Paulina Sánchez AguilarEstudianteTL UNAM Lic Inform 01Sep02
Rodrigo Alarcón Becario D UPF DocLingAplid 01Ago00
Roberto Saldaña SS UNAM LicIng.Comp. 01Mar04
Roberto Rodríguez SS UNAM Lic Inform 01Sep03Sonia Elisa Morett Estudiante UNAM Lic Letras His 01Mar04
Tabla 17: Relación de los miembros actuales del GIL
Becarios que hanterminado Categoría Procedencia
Nivel Área Ingreso Término
Becarios PasadosClaudia Colomer Becario Aca UNAM Lic Letras His 01Ago00 31Jul02
Claudia I. Vázques Becario L BUAP Lic Letras His 28Jun0327Ago03
Gabriela Muñoz Becario L UNAM Lic Letras His 01Ago00 31Jul01
Héctor Ortíz SS UNAM LicIng.Comp. 16Abr02
16Ago02
Juan C. Dávila SS UNAM Lic Inform 14Nov0314May04
Karla I. Ortega Becario TL UNAM Lic Inform 19Mar0131Dic02
José L. Godines SS UNAM Lic Inform 01Sep0329Feb04
Luisa Callejas SS UNAM LicIng.Comp. 08Sep03
29Feb04
Miguel A. Valdés Becario L UNAM LicIng.Comp. 01Abr01
31Ago01
Myriam Redonda Becario L UNAM LicIng.Comp. 01Abr01
31Ago01
Norma Alarcón Becario L UNAM LicIng.Comp. 01Oct00
30Sep01
Ramón Z. Ponce de León Becario L UNAM Lic Letras His 01Ago01 31Jul02
Raúl Montiel Romero SS UNAM Lic Inform 14Nov0314May04
Roy Elineema Becario M UNAM MaIng.Comp. 01Ago00 31Jul01
Sofía Kamenetskaia Becario Aca UNAM Ma Ling His 01Ago00 31Jul01
Úrsula Sánchez Becario L UNAM LicPsicología 01Jul02
31Ago02
Verónica ChávezMedonza Becario L UNAM Lic
Ing.Comp. 01Abr01
28Feb02
Xochitl López Becario L UNAM LicIng.Comp. 01Mar02
31Ago02
Tabla 18: Relación de becarios que trabajaron en el GIL
Académicos:
Nombre Categoría Procedencia Nivel Área
Gerardo Sierra MartínezInv. Asoc.C UNAM Doc
LingComp
Alfonso Medina UrreaInv.Posdoc. COLMEX Doc Ling Hisp
Gabriel CastilloHernández Tec. Acad. UNAM Ma Ing CompCarlos Méndez Cruz Académico UNAM Lic Inform
Tabla 19: Miembros académicos del GIL
Participación en el GIL:
Becarios Actividad Área Puesto
Jefe deárea /
Coordinador
Adriana Miranda Nava Variación léxica ParSem Estudiante
M. en C.GabrielCastillo
Antonia Estrada Trejo Evaluación de WordNet BCL EstudianteLic. AntonioReyes
Antonio Reyes Pérez Rel. Léxicas, sem y pragm BCL Jefe de áreaLic. AntonioReyes
Brenda Torres Castillo Variación léxica ParSem Estudiante
M. en C.GabrielCastillo
Carla Márques González Dicc Elec EstudianteIng. MarleneMoreno
Carlos Fonseca Rojas Digitalización ConstCLI / BCL Estudiante
Dr. AlfonsoMedina / Lic.AntonioReyes
Carlos Méndez Cruz No definido Cómp AcadémicoLic. CarlosMéndez
Carlos Rodríguez Penagos Operadores metalingüísticos CD's Coordinador
Mtro. CarlosRodríguezPenagos
César A. Aguilar Desc Ling Definiciones CD's / BCL Coordinador
Mtro. CésarA. Aguilar /Lic. AntonioReyes
Eduardo Solares Martínez Interfaces del Dicc Onomas Dicc Elec EstudianteIng. MarleneMoreno
Enrique Romero García Digitalización ConstCLI SSDr. AlfonsoMedina
Erick Arrellano Casillas Admin. Cómp. Cómp. EstudianteLic. CarlosMéndez
Fabricio Jocabad Vallejo Página WEB No definido SSLic. CarlosMéndez
Grizel Delgado Rodríguez Conceptualización lingüística Dicc Elec / BCL Estudiante
Ing. MarleneMoreno / Lic.AntonioReyes
Gabriel Garduño Torres Búsqueda de términos BT / EtCLI Jefe de área
M. en C.GabrielCastillo
Itzia Baca Ibarra No definido ConstCLI SSDr. AlfonsoMedina
Jessica Méndez Liceaga Interfaces del Dicc Onomas Dicc Elec EstudianteIng. GabrielCastillo
Julieta Villaseca Bello Admin. Cómp. Cómp SSLic. CarlosMéndez
Luis Daniel Escobar No definido ConstCLI SSDr. AlfonsoMedina
Mariano Navarro Morales No definido No definido Estudiante No definido
Marlene Moreno del Pilar Desarrollo de dicc electrónicos Dicc Elec Jefa de áreaIng. MarleneMoreno
Nadia Buendia Silva Interfaces del Dicc Onomas Dicc Elec Estudiante
M. en C.GabrielCastillo
Paulina Sánchez Aguilar Sist de Inf Bibliográfica No definido EstudianteLic. CarlosMéndez
Roberto Saldaña Banco terminológico BT SSIng. GabrielGarduño
Roberto Rodríguez Administración del sistema No definido SSLic. CarlosMéndez
Sonia Elisa Morett No definido ConstCLI / BCL Estudiante
Dr. AlfonsoMedina / Lic.AntonioReyes
Tabla 20: Actividades y responsables del GIL
APÉNDICE I
DIFUSIÓN
En este apéndice se señalan los trabajos de investigación del GIL que se han presentado endistintos foros y en distintos medios como forma de difusión.
Congresos:
"Descripción de la noción concepto desde una perspectiva lingüísticocognitiva para eldesarrollo de un diccionario onomasiológico." Delgado G., Reyes A., Aguilar C. IX Simposio Iberoamericano de Terminología "Estructuración de datos en bancos terminológicos para procesos de representación deconocimiento en sistemas de recuperación de información." Reyes A., Solares E. IX Simposio Iberoamericano de Terminología
"Procesamiento automático del metalenguaje en Terminología: Nuevas herramientas parala enseñanza y la investigación" Carlos Rodríguez RITERM2004 IX Simposio Iberoamericano de Terminología “La Terminología en el SigloXXI: contribución a la cultura de la paz, la diversidad y la sostenibilidad” "Metalinguistic Information Extraction for Terminology." Carlos Rodriguez 3rd International Workshop on Computational Terminology (CompuTerm 2004)
"Mining metalinguistic activity in corpora to create lexical resources using InformationExtraction techniques: the MOP system" Carlos Rodríguez ACL 2004 Main Conference "Comparación de densidades de disparadores de presuposiciones pragmáticas en el CorpusLingüístico de Ingeniería y el Corpus del Español Mexicano Conte" Medina A., Reyes A., Delgado G. V Coloquio de Lingüística en la Escuela Nacional de Antropología e Historia. "La Extracción de Información: un reto informático" Méndez C. Semana de la informática
"Preliminares del diccionario onomasiológico: hacia una metodología del diccionarioinverso" Delgado, G. 1° Encuentro de Estudiantes de Literatura y Lingüística de la Universidad NacionalAutónoma de México
"Modelos metalingüísticos en los procesos de recuperación de información." Reyes, A. Encuentro de Estudiantes de Literatura y Lingüística de la Universidad NacionalAutónoma de México.
"Patrones para una estructuración semántica de un diccionario onomasiológico. " Reyes A. Tercera Semana de Lingüística (UAM – I)
"Determinación de relaciones léxicas a partir de la coocurrencia en definiciones. " Reyes A., Sierra G. VII Congreso Nacional de Lingüística (AMLA).
"Researching research using metalinguistic information extraction: A common ground forknowledge through knowledge of language" Carlos Rodríguez Panel on Lexical Markers of Common Grounds. 8th International Pragmatics Conference "Ingeniería Lingüística de la UNAM" Delgado, G. 1er. Taller regional de Recuperación de Información y Procesamiento de Lenguaje Natural
"Segmentación estadística de vocablos del español: aplicación de la prueba deindependencia de x2 para descubrir afijos del español" Medina A. VIII Simposio Internacional de Comunicación Social.
"Banco terminológico para el Grupo de Ingeniería Lingüística" Sierra G., Garduño G., Moreno M. VIII Simposio Internacional de Comunicación Social.
"Análisis de predicaciones verbales en el Corpus de Referencia del Español Actual" Sierra G., Alarcón R. VII Encuentro Internacional de Lingüística en el Noroeste. "Métodos de segmentación automática (stemming) aplicados al sintagma verbal español" Medina A., Delgado G. VII Encuentro Internacional de Lingüística en el Noroeste.
"Análisis de frecuencia de construcciones anafóricas en narraciones infantiles a partir delprograma CHILDES" Aguilar C. VII Encuentro Internacional de Lingüística en el Noroeste.
"Características cuantitativas de la morfología flexiva del chuj" Medina A. VII Encuentro Internacional de Lingüística en el Noroeste. "Diccionario básico de sexualidad" Moreno M., Garduño G., Sierra G., Medina A., Casti Congreso Latinoamericano de Multimedieros Universitarios 2002. "Corpus Annotation for Automatic Extraction of Definitions" Sierra G., Medina A., Ortega K. The Fourth North American Symposium on Corpus Linguistics.
"Hacia la extracción automática de conceptos" Alarcón R., Sierra G. VIII Simposio Iberoamericano de Terminología.
"Identification of recurrent patterns to extract definitory contexts" Sierra G., Alarcón R. Conferencia Internacional CICLing2002.
"Patrones recurrentes para la introducción de conceptos en textos de ingeniería" Sierra G., Alarcón R. II Encuentro Internacional: "Lingüística Aplicada y Sociedad".
"Lingüística Computacional " Sierra G. I Ciclo de Conferencias Redes e Internet.
"Terminología e Infomática " Sierra G. I Encuentro Nacional de Terminología.
"Taller: Recursos terminológicos en Internet " Sierra G. I Encuentro Nacional de Terminología. "Retos y oportunidades de la lingüística computacional " Sierra G.
Facultad de Matemáticas de la Universidad Autónoma de Yucatán. "Extracción automática de términos de física a partir de textos especializados" Sierra G., Reyes A. VI Congreso Nacional de Lingüística Aplicada.
"Desarrollo de la Ingeniería Lingüística en la UNAM, México" Sierra G., Castillo G., Reyes A., Alarcón R. II Taller Internacional de Procesamiento Computacional del Español y Tecnologías delLenguaje.
"Búsqueda de palabras a partir de las definiciones en los diccionarios de lenguaautomatizados" Sierra G. VII Simposio Internacional de Comunicación Social.
"La informática en el trabajo terminológico" Sierra G. II Jornadas Iberoamericanas de Terminología.
"Terminología, Inteligencia Artificial e Ingeniería Lingüística" Sierra G. II Jornadas Iberoamericanas de Terminología.
"The onomasiological dictionary: a gap in lexicography " Sierra G. IX Congreso Internacional EURALEX 2000
"Extracting semantic clusters from the alignment of definitions" Sierra G., McNaught J. XVIII Congreso Internacional Coling2000
"Situación actual y futuro de la ingeniería lingüística en México" Hayet M., Sierra G. Situación actual y futuro de la ingeniería lingüística en México "Extraction of Semantic Clusters for Terminological Information Retrieval from MRD " Sierra G., McNaught J. II Conferencia Internacional LREC2000
"Analogy Based Method for Semantic Clustering " Sierra G., McNauht J. Conferencia Internacional CICLing2000
"El diccionario de búsqueda onomasiológica: perspectivas de la lingüística computacional"Sierra G. V Congreso Nacional de Lingüística
"Ingeniería Lingüística: retos y oportunidades" Sierra G. Ingeniería Lingüística: retos y oportunidades "Analogybased semantic clustering for terminological information retrieval " Sierra G. Second UK Special Interest Group for Computational Linguistics "Avances en el desarrollo del Diccionario Electrónico de búsqueda Onomasiológica " Sierra G. V Simposio Iberoamericano de Terminología "A ConceptOriented Dictionary for the Missing Word " Sierra G. First Academic MiniConference
"INTERCOCTA Workshop" INTERCOCTA Workshop "Estructura semántica del Léxico en un diccionario onomasiológico práctico " Sierra G. III Congreso Nacional de Lingüística "Bases del diccionario onomasiológico computarizado en el área de desastres " Sierra G. IV Simposio Iberoamericano de Terminología "Problemas en la búsqueda de términos en el área de desastres " Sierra G. I Congreso Nacional de Lingüística: Las lenguas y su uso
Tabla 21: Conferencias en las que ha participado el GIL
Artículos en Revistas:
Sierra G., McNaught J. "Natural Language System for Terminological Information Retrieval" En Lecture Notes in Computer Science (indizada por SCIE). Num.2588, Volumen , 2003.pp. 543554
Sierra G., Alarcón R. "Identification of recurrent patterns to extract definitory contexts " En Lecture Notes in Computer Science (indizada por SCIE). Num.2276, Volumen , 2002.436438
Sierra G., McNaught J., Castillo G. "Extracting semantically rich knowledge from alignment of definitions" En Computational Linguistics and Intelligent Text Processing. Num.1, Volumen 1, 2002.245249
Sierra G., McNaught J., "Extracting semantic clusters from MRD for an onomasiological search dictionary" En International Journal of Lexicography. Num.4, Volumen 13, 2000. Sierra G., McNaught J. "Design of an onomasiological search system: A conceptoriented tool for terminology" En Terminology. Num.1, Volumen 6, 2000.
Medina A. "Automatic Discovery of Affixes by means of a Corpus: A Catalog of Spanish Affixes" En Journal of Quantitative Linguistics. Num.2, Volumen 7, 2000. Sierra G. "Estructura semántica del léxico en un diccionario onomasiológico práctico" En Estudios de Lingüística Aplicada. Num.23 y 24, Volumen , 1996. Sierra G. "Outline of an Onomasiological Dictionary Software in the Disaster Area" En IITF Journal, Terminology Science & Research. Num.2, Volumen 6, 1995.
Sierra G. "El diccionario de desastres del GIID: un informe de su avance" En Estudios de Lingüística Aplicada. Num.15 y 16, Volumen , 1992.
Tabla 22: Publicaciones en revistas del GIL
Capítulos en libros:
Sierra G., Alarcón R., Medina A., Aguilar C. "Definitional Contexts Extraction from Specialised Texts" En Practical Applications in Language and Computers PALC 2003. Peter Lang, Alemania,2004. 2131 Alarcón R., Sierra G.
"Hacia la extracción automática de conceptos" En Proc. VIII Simposio Iberoamericano de Terminología (ISBN 9583340227).Iberoamericana de Terminología RITerm, Cartagena, Colombia, 2002. Sierra G., Alarcón R. "Identification of recurrent patterns to extract definitory contexts" En Computational Linguistics and Intelligent Text Processing. Colección en Ciencias de laComputación, Alexander, Springer, Berlin, 2002. 436438 Sierra G., McNaught J. "Analogybased method for semantic clustering" En Computational Linguistics and Intelligent Text Processing. Fondo de CulturaEconómica, México, 2002.
Tabla 23: Trabajados publicados como parte de libros
Tesis:
Metalinguistic Information Extraction from specialized texts Carlos Rodríguez, Doctorado, Universitat Pompeu Fabra, Noviembre, 2004. (Asesor ToniBadia). Diseño e implantación de un banco terminológico para el Grupo de Ingeniería Lingüística Garduño Torres Gabriel, Licenciatura, Facultad de Ingeniería, UNAM, Agosto, 2003.(Asesor Dr. Gerardo Sierra Martínez). Investigación cuantitativa de afijos y clíticos del español de México: Glutinometría en elCEMC Medina Urrea, A., Doctorado, El Colegio de México, abril, 2003. (Asesor Dr. LuisFernando Lara).
Análisis y diseño de un corpus lingüístico en ingeniería Ortega K., Licenciatura, Facultad de Contaduría y Administración, UNAM, febrero, 2003.(Asesor Dr. Gerardo Sierra). Hacia una obtención computarizada de términos (aplicación concreta al léxico de la físicaen el nivel bachillerato) Reyes A., Licenciatura, Facultad de Filosofía y Letras, UNAM, octubre, 2002. (Asesor Dr.Gerardo Sierra). Algoritmo revisado para la extracción automática de agrupamientos semánticos Castillo G., Maestría, Posgrado en Ciencia e Ingeniería de la Computación, octubre, 2002.(Asesor Dr. Gerardo Sierra).
Design of a conceptoriented tool for terminology. Sierra G., Doctorado, Department of Language Engineering, UMIST, agosto, 1999.(Asesor Dr. John McNaught (UMIST)).
Bases para la búsqueda onomasiológica de términos Sierra G., Maestría, Instituto de Ingeniería, UNAM, enero, 1996. (Asesor Dr. Felipe Lara yLuis Fernando Lara).
Tabla 24: Tesis publicadas a partir del trabajado realizado en ingeniería lingüística por miembros delGIL
top related