lexicografía académica

56
Lexicografía académica Presente y futuro

Upload: yuri

Post on 12-Jan-2016

50 views

Category:

Documents


1 download

DESCRIPTION

Lexicografía académica. Presente y futuro. Modernización tecnológica. Informatización del fichero. 1993 . Se inicia el proceso de informatización del fichero general que servía como fundamento para la preparación de los diccionarios. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Lexicografía académica

Lexicografía académica

Presente y futuro

Page 2: Lexicografía académica

Modernización tecnológica

Page 3: Lexicografía académica

Informatización del fichero

• 1993. Se inicia el proceso de informatización del fichero general que servía como fundamento para la preparación de los diccionarios.

• Los ficheros léxicos, aunque de gran valor filológico, resultaban insuficientes para documentar con rapidez y precisión los usos lingüísticos de la comunidad hispanohablante.

Page 4: Lexicografía académica

Corpus electrónicos

• 1995. El proceso de informatización de ficheros es sustituido por la construcción de un gran banco de datos basado en corpus.

• Ventajas:• -Acceso inmediato a grandes conjuntos de

materiales.• -Documentación por frecuencia estadística.• -Informaciones utilísimas sobre el uso.

Page 5: Lexicografía académica

Corpus de referencia• En lingüística, se llama corpus a un conjunto formado por miles de

textos (novelas, obras de teatro, guiones de cine, noticias de prensa, ensayos, transcripciones de noticiarios radiofónicos o televisivos, transcripciones de conversaciones, discursos, etc.) y cientos de millones de formas. Son empleados habitualmente para conocer el significado y características de palabras, expresiones y construcciones a partir de los usos reales registrados. Dado el tamaño que poseen, los corpus tienen que estar en formato electrónico.

• Un corpus general (llamado de referencia) tiene como propósito básico el de servir para obtener las características globales que presenta una lengua en un momento determinado de su historia. En el caso del español actual, el corpus debe contener textos de todos los tipos y también de todos los países que constituyen el mundo hispánico.

Page 6: Lexicografía académica

BANCO DE DATOS DE LA REAL ACADEMIA ESPAÑOLA

• CORDE (Corpus diacrónico del español).• CREA (Corpus de referencia del español

actual).• CORPES (Corpus del español del siglo XXI).

Page 7: Lexicografía académica

Nuevos corpus

• Corpus escolar.• Corpus jurídico (CJ).• Corpus científico-técnico (CCT).• Corpus de la Gramática (CGRAE)• Corpus del Diccionario histórico (CDH)

Page 8: Lexicografía académica
Page 9: Lexicografía académica

CREACorpus de referencia del español actual

• Medio: El 90% corresponde a la lengua escrita y el 10% a la lengua oral.

• Cronológico: El corpus está dividido en períodos de cinco años: 1975-1979; 1980-1984; 1985-1989; 1990-1994; 1995-1999, 2000-2004.

• Geográfico: El 50% del material del CREA procede de España, y el otro 50%, de América.

• Temático: Cada grupo de materiales (libros y prensa, miscelánea y oral) se clasifica de modo independiente.

• Cantidad: 160 millones de registros.• Uso. Diferentes diccionarios académicos.

Page 10: Lexicografía académica

CREA• Campos temáticos

Se han establecido seis áreas generales a las que deben asignarse cada uno de los textos del corpus. Cada una se estructura en áreas temáticas. Son criterios de búsqueda que pueden seleccionarse en la aplicación.

• Adquisición de textos• Escaneado: programa de reconocimiento óptico de caracteres

(ROC).• La prensa más reciente se descargó en formato electrónico.• La prensa de los años 70 y 80 se procesó mediante un programa de

dictado automático,.• Miscelánea: bien manualmente (propaganda, prospectos..), bien en

formato electrónico (correos electrónicos, blogs…).• Además, el CREA integra materiales procedentes de otros corpus.

Page 11: Lexicografía académica

Aplicaciones del CREA• Diccionarios académicos: utilizan diariamente los

materiales del corpus, cuyas posibilidades de consulta permite que la información registrada en ellos resulte ajustada a la realidad de la lengua.

• El CREA es el punto de partida forzoso para investigaciones sobre el español actual, principalmente lingüísticas, pero también de campos tan dispares como el de la publicidad, la terminología o la sociología, así como para la elaboración de numerosos productos derivados: gramáticas, diccionarios, tesauros, correctores ortográficos, métodos de didáctica del español y aplicaciones de traducción automática, entre otros.

Page 12: Lexicografía académica

CORDECorpus diacrónico del español

• Ámbito. El CORDE es un corpus textual de todas las épocas y lugares en que se habló español.

• Cantidad. Cuenta con 300 millones de registros. Es el mayor conjunto de registros léxicos de la historia de la lengua española.

• Tipología textual. El corpus recoge textos escritos en prosa y verso y, dentro de cada modalidad, en textos narrativos, líricos, dramáticos, científico-técnicos, históricos, jurídicos, religiosos, periodísticos, etc. Se pretende recoger todas las variedades geográficas, históricas y genéricas.

Page 13: Lexicografía académica
Page 14: Lexicografía académica

CORPES XXICorpus del español del siglo XXI

• Es un corpus de referencia. • Textos. Seleccionados de acuerdo con una serie de parámetros y

son tratados con un sistema de codificación .• Aprobación. Congreso celebrado en Medellín en marzo de 2007.• Tipos y países. De todos los tipos y todos los países con un volumen

de 25 millones de formas por año.• Primera fase (hasta diciembre de 2014): textos entre 2001 y 2012. • La primera fase: 300 millones de formas.• En diciembre de 2013: 160 millones de formas.• La versión provisional se presentó en el VI Congreso Internacional

de la Lengua Española (Panamá, octubre de 2013). • Disponible a través de la aplicación de consulta.

Page 15: Lexicografía académica

Departamento de Español al Día• Servicio de consultas. -Por formulario. La Academia tiene abierta línea directa a través

de Internet para cuantos usuarios deseen plantear dudas, problemas, sugerencias… Actualmente se atienden más de cien consultas diarias. Este servicio tiene una importancia grande, pues a través de las consultas se detectan fallos, lagunas, ambigüedades, contradicciones, indeterminaciones, vaguedades… de las obras académicas.

-En Twitter. Más de seiscientos mil seguidores.• Diccionario panhispánico de dudas.• Ortografía. • Corrección de las obras académicas.

Page 16: Lexicografía académica

Diccionario panhispánico de dudas (2005)

• Constituye una aplicación de desarrollo de largas investigaciones sobre los diferentes bastiones de la norma, investigación acelerada desde la creación del Servicio de consultas del Departamento de ‘Español al Día’ de la RAE.

Page 17: Lexicografía académica
Page 18: Lexicografía académica

Estructura del DPD•  I. Diccionario propiamente dicho, formado por las distintas

entradas ordenadas alfabéticamente.•  II. Apéndices:•          Modelos de conjugación verbal.

         Lista de abreviaturas.         Lista de símbolos alfabetizables.         Lista de símbolos o signos no alfabetizables.         Lista de países y capitales, con sus gentilicios.

•  III. Glosario de términos lingüísticos: aclara los conceptos gramaticales usados en el diccionario.

•  IV. Fuentes citadas: datos identificativos de las fuentes citadas en los ejemplos de uso.

Page 19: Lexicografía académica

Tipos de artículos

• Artículos temáticos. Tratan cuestiones generales, como las normas de acentuación gráfica, el uso de los signos de puntuación o de las mayúsculas, las reglas de formación del femenino o del plural, el dequeísmo, la concordancia, etc. En VERSALITA NEGRITA.

• Artículos no temáticos. Son los referidos a palabras concretas que plantean algún tipo de duda en lo que respecta, por ejemplo, a su acentuación, su forma gráfica, su forma de plural o de femenino, su régimen preposicional, etc. El lema de estos artículos aparece impreso en redonda negrita, salvo extranjerismos crudos (en cursiva negrita).

Page 20: Lexicografía académica
Page 21: Lexicografía académica

Diccionario del estudiante (2005)

• Obra lexicográfica de nueva planta y basada en corpus juvenil de lengua, destinada a los estudiantes. Constituyó una aportación novedosa y de gran calidad.

Page 22: Lexicografía académica

Diccionario del estudiante• Dirigido a los alumnos hispanohablantes entre los doce y los

dieciocho años, • Contiene más de 40 000 voces y locuciones del español. • Vocabulario que debe manejar un estudiante de secundaria y

bachillerato. • Cada definición va acompañada de ejemplos basados en el uso real.• Elaborado sobre un banco de datos léxico procedente de los libros

de texto y de consulta de España y de América. • Es un diccionario de nueva planta: todas las voces recogidas y cada

una de sus definiciones han sido redactadas de primera mano y sometidas a una metodología nueva en forma adecuada a las necesidades de los estudiantes a quienes va dirigida la obra.

• Dos ediciones : la primera se presentó el 15 de septiembre de 2005. En 2011 se publicó una segunda edición, que sumó a la anterior una serie de voces y acepciones nuevas. Revisión ortográfica.

Page 23: Lexicografía académica

Diccionario práctico del estudiante• Versión del Diccionario del estudiante dirigida a los alumnos de

institutos y colegios de los países hispanoamericanos • Se prescinde de voces no empleadas allí. Ejemplos adaptados al uso

americano con un lenguaje actual y de fácil comprensión.• Contiene más de 30 000 palabras y locuciones del léxico vivo del

español general, y en particular de América. Se selecciona el vocabulario fundamental que debe manejar un estudiante de enseñanza secundaria, desechando los usos anticuados y puramente nacionales.

• Dos ediciones • -La primera: 2007 (Congreso Internacional de la Lengua Española,

Cartagena de Indias, Colombia).• -En 2012 se publicó una segunda edición. Sumó voces y acepciones

nuevas, aprobadas para la próxima edición del DRAE (2014).

Page 24: Lexicografía académica

DICCIONARIO DE

AMERICANISMOS

Page 25: Lexicografía académica

Diccionario de americanismos (2011)

• La colaboración de la RAE y de la Asociación de Academias cristalizó en la concreción de un largo proyecto diseñado a finales del siglo XIX: un diccionario del español hablado en los países americanos. Participaron todas las Academias coordinadas por D. Humberto López Morales. El resultado ha sido una obra esencial para conocer la lengua del mundo hispánico.

Page 26: Lexicografía académica
Page 27: Lexicografía académica
Page 28: Lexicografía académica

DRAE • Edición: cerrada el 14 de marzo de 2014. • Publicación: octubre 2014, coincidiendo con el tricentenario.• Objetivos: enriquecerlo, modernizarlo y hacerlo más coherente.• Armonización: Nueva gramática de la lengua española, Ortografía

de la lengua española y Diccionario de americanismos. • Regularización de las marcas geográficas americanas.• Revisión del tratamiento de los extranjerismos.• Incrementado de entradas: incorporación de neologismos y a la

actualización del léxico de diversos campos temáticos.• Técnica lexicográfica: cambios en la estructura de los artículos con

el fin de que sean más claros y coherentes.• Versión en línea : se elabora una nueva aplicación de consulta, que

amplíe las posibilidades de búsqueda y permita la navegación dentro del Diccionario.

Page 29: Lexicografía académica
Page 30: Lexicografía académica
Page 31: Lexicografía académica

Adiciones Supresiones Enmiendas Total

5.ª tanda 457 19 1221 1697

Acumulado 2445 170 19 374 21 989

Page 32: Lexicografía académica

NUEVO DICCIONARIO HISTÓRICO

DE LA LENGUA ESPAÑOLA

Page 33: Lexicografía académica
Page 34: Lexicografía académica

Antecedentes

• 1996: Suspensión del Diccionario histórico.• 2001: Nuevo tesoro lexicográfico de la lengua española.

Recopila 216 diccionarios del español, desde Nebrija.Ediciones conjuntas: -Léxico hispánico primitivo (siglos VIII al XII). Con la fundación

Menéndez Pidal. -Nuevo tesoro lexicográfico del español (s. xiv-1726). Lidio

Nieto y Manuel Alvar Ezquerra.

Page 35: Lexicografía académica

Fundación Lapesa

• 2005. Se crea la Fundación Instituto de Investigación Rafael Lapesa para el Nuevo diccionario histórico de la lengua española.

• Director: José Antonio Pascual.• 2006. Proyecto prioritario en el ámbito de las

humanidades (presidente J.L. Rodríguez Zapatero).

Page 36: Lexicografía académica

CDH (Corpus del Nuevo diccionario histórico)

• Se ha confeccionado como punto de partida para la elaboración del Nuevo diccionario histórico. Cuenta con más de 53 millones de ocurrencias (32 pertenecen a textos españoles y más de 20 millones a obras americanas). Los textos se han sometido a un minucioso proceso de anotación lingüística esencial en el trabajo lexicográfico. Se ha desarrolló una modélica interfaz de consulta aplicable a otros corpus. Dirigido por el académico José Antonio Pascual.

Page 37: Lexicografía académica

Redacción y herramienta

• El CDH se ha terminado en el 2009.• Se ha iniciado la fase de redacción y de confección de

la herramienta.• Se elaboran las versiones parciales a medida que se

perfecciona la herramienta provisional.• Se pueden consultar unas 500 voces pertenecientes

a tres campos semánticos: instrumentos musicales, armas y enfermedades.

• Será modelo para próximos diccionarios.

Page 38: Lexicografía académica

Plataforma tecnológica de la lengua española

• Es un banco de datos, un conjunto de recursos lingüísticos para la comunidad hispanohablante.

• Es un banco de datos inmenso en el que se integran todas las obras (diccionarios, gramáticas, ortografías), todos los ficheros, todos los fondos documentales y todos los corpus de de la RAE. Integra los corpus existentes y las ampliaciones que se realizarán en los próximos años.

• Es un banco de datos unificado. Todos los datos del banco se verán sometidos a un procesamiento minucioso, integrado, interrelacionado y unificado. Esto permitirá una potente conexión interna, una mejor interrelación con datos de otras fuentes externas (bibliográficas, geográficas, estadísticas…) y una mejor adaptación a las herramientas tecnológicas. A la vez, este avance cualitativo que permitirá un enriquecimiento exponencial de los resultados.

Page 39: Lexicografía académica

Objetivos

• Facilitar un acceso inteligente tanto a recursos lingüísticos como a nuevos métodos de procesamiento e inferencia de conocimiento lingüístico.

• Propiciar la generación de nuevo conocimiento de la lengua española y mejorar su competitividad no solo en el ámbito cultural, sien el mundo científico y tecnológico

• Situar con estos recursos a la lengua española en el nuevo mundo emergente, de manera que salga de la situación de desventaja en la que se halla frente a otras lenguas que disponen ya de dichos medios.

• Promover la creación de una industria basadas en esta tecnología.• Ayudar a colectivos especializados (investigadores, universidades, etc.) en

su labor de investigación pura y facilitarles el acceso al conocimiento que existe y que se acumula en torno a la lengua española.

Page 40: Lexicografía académica

Objetivos de la PTLE

• Facilitará a sectores industriales y colectivos (investigadores, docencia, gran público, etc.) todos los recursos léxicos de la lengua española que puedan requerir para desarrollar sus proyectos con contenido filológico, lingüístico, lexicográfico y bibliográfico o en general para satisfacer sus necesidades:– Creando dichos recursos cuando no existan– Procesando y consolidando los existentes en la RAE– Enlazando con otras fuentes de recursos externas a la RAE

• Ofrecerá el acceso a dichos recursos a través de aplicaciones avanzadas y flexibles, dotadas de un amplio menú de funcionalidades

• Facilitará soporte y recursos para diseño y desarrollo de aplicaciones industriales relacionadas con la lengua española, como correctores ortográficos, gramaticales y de estilo, traductores automáticos, etc.

• Innovará y unificará los procesos de edición y producción de diccionarios y otras obras de referencia del español.

• Atenderá las necesidades docentes y del público general en materia lingüística mediante consultas avanzadas a diccionarios, consultas gramaticales y ortográficas, consultas unificadas, etc.

Page 41: Lexicografía académica

Principios

• 1.1. La PAE es una infraestructura de recursos lingüísticos del español de todo el mundo. La Academia se propone, con la ayuda de este proyecto, la creación de un centro de recursos lingüísticos del español de todo el mundo. Para la creación de esta infraestructura ha de colaborar con la red de Academias de la Lengua asociadas en ASALE y con muchas universidades y centros de investigación del mundo hispánico.

• 1.2. La PAE es una infraestructura de recursos lingüísticos para los estudiosos del español, así como de las industrias de la lengua en todo el mundo. Se abordará la creación de una infraestructura necesaria para el funcionamiento de los equipos de investigación y de las industrias de la lengua, pero que ni los equipos universitarios ni las empresas pueden abordar por sí solas. La línea que se seguirá es la adoptada hasta el presente en los proyectos otorgados a la RAE: se recibe la subvención, se construye el recurso y se pone a disposición de los usuarios.

Page 42: Lexicografía académica

Estructura PTLE:• Banco de datos Unificado (BDU). Capa que contiene las bases de datos ,

repositorio de recursos lingüísticos y conectores con otras fuentes léxicas• Capa de Tecnologías Lingüísticas, desde donde se ofrecen determinadas

funcionalidades especiales (consulta avanzada al diccionario, corrección ortográfica, etc.)

• Capa de Consulta, que facilitará el acceso a los usuarios al Banco de datos Unificado, permitiendo gran cantidad de criterios de búsqueda (procedencia del texto, naturaleza, autor, etc.)

• Capa de Servicio, desde donde se realizarán todas las funciones relacionadas con la gestión y administración de usuarios (identificación, gestión de perfiles, gestión de incidencias, informes de uso, etc.). Soportará además los interfaces (API´s) sobre los que agentes externos podrán desarrollar sus propias aplicaciones, productos y servicios.

• Entorno de Redacción. Aplicación de redacción específicamente diseñada para la edición de diccionarios y que integrará además interfaces de conexión estándares con el mundo exterior. Sobre esta capa se desarrollarán también, como parte del proyecto, dos aplicaciones tipo que representarán una perspectiva diacrónica de la lengua (Diccionario Histórico) y otra sincrónica (Diccionario Fundamental)

Page 43: Lexicografía académica
Page 44: Lexicografía académica

Banco de datos unificado• Fondos lexicográficos: Todos los diccionarios de la RAE. • Obras académicas: Gramática, Ortografía y Diccionario

panhispánico de dudas.• Fondos documentales y bibliográficos: archivo y bibliotecas (más

de doscientos mil libros y dos millones de documentos)• Fichero general: fichero con más de diez millones de papeletas.

Biblioteca del léxico e inventario de recursos lingüísticos o mapa de enlaces a fuentes lingüísticas externas a la RAE

• Repositorio de consultas (millones de consultas mensuales) que la RAE recibe a través de distintos medios (portal web, correo, twitter, etc)

• Corpus:

Page 45: Lexicografía académica
Page 46: Lexicografía académica
Page 47: Lexicografía académica

Vigor del español• • Es la segunda lengua más hablada (unos 495 millones).• Es el segundo idioma en comunicación internacional.• Es la tercera lengua más utilizada en internet (con un crecimiento

del 807 % entre 200º y 2011),• Es una de las primeras en número de países donde se habla y en

extensión geográfica• Presenta unas perspectivas de crecimiento superiores a las del

chino y del inglés, tanto por razones demográficas como por el número de quienes la estudian como segunda lengua.

• Se considera que para 2030 el 7,5 % de la población mundial hablará español y que hacia el 2050 Estados Unidos será el primer país hispanohablante del mundo

Page 48: Lexicografía académica

Vigor del español (2)• • Es un idioma relativamente homogéneo. • Es una lengua geográficamente compacta.• Muchos países hispanohablantes ocupan territorios contiguos.• Los territorios hispánicos ofrecen un índice de comunicatividad

muy alto.• Tiene carácter oficial y vehicular en 21 países.• Es una lengua en expansión.• Es una de las grandes lenguas de cultura, con una gran

proyección internacional en el mundo de la literatura, de la música, de la pintura, de la arquitectura y de la moda.

• Los países hispanoamericanos se hallan en un período de expansión económica.

Page 49: Lexicografía académica

Desfase del español en la ciencia• • España ocupa el décimo lugar en la clasificación

mundial de producción científica.• En el número de documentos citados, se sitúa en

undécimo lugar.• El número de revistas españolas incluidas en la base

de datos del ISSN constituye el 4,4 % del total, aunque ha crecido más del 211 % con respecto a 2001.

• El español científico y técnico se halla relegado a un plano apenas perceptible en el ámbito internacional.

Page 50: Lexicografía académica

Desarrollo de la lexicografía• La lexicografía surge hace más de seis mil años. Sin embargo, no adquiere

madurez metodológica y estatuto de disciplina científica hasta la segunda mitad del siglo xx, en el seno de la lingüística aplicada. Su evolución y crecimiento ha sido espectacular. A ello han contribuido:

• La publicación de importantes reflexiones metalexicográficas.• La renovación tecnológica de la informática ha supuesto un cambio

cuantitativo y cualitativo. Ha renovado y mejorado ad infinitum en tiempo, en costes, en esfuerzo, en capacidad de almacenamiento de datos y en accesibilidad a los mismos, en seguridad, en capacidad de interrelación, en la redacción y en otras tareas de elaboración de los diccionarios. Las modernas bases de datos permiten idear y realizar diccionarios totales integrados que hace pocos años eran impensables. En el pasado inmediato ha supuesto un cambio radical, pero son aún mayores las expectativas.

• La multiplicación de variedades de diccionarios, algunos de ellos muy especializados y de gran calidad.

Page 51: Lexicografía académica

Limitaciones de la ciencia lexicográfica• Limitaciones ligadas a diccionario de papel: ahorro de espacio y de información.• La lexicografía no ha incorporado avances experimentados por la ciencia

lingüística: • Fonética . • Sintaxis. Combinatoria formal y sintáctica . No se incorporan aportaciones de la

gramática.• Semántica estructural , cognitiva y generativista.: una diferenciación más

objetiva de entradas, en de acepciones, de la estructura argumental de cada acepción o incluso de la estructura de qualia. No aparecen las combinaciones (o colocaciones). Raros son los diccionarios que establecen las relaciones (sinonimia, antonimia, hiperonimia…) que cada acepción mantiene con otros signos de la lengua.

• Análisis del discurso (marcadores y conectores).• La pragmática. Locuciones ligadas a actos de habla (¡No me digas!, Buenos días,

De acuerdo, ¡Ni hablar!…). Efectos inferenciales. Las connotaciones de los signos se hallan frecuentemente asociados a valores argumentativos.

Page 52: Lexicografía académica

Limitaciones de la ciencia lexicográfica• Sociolingüístico y dialectal, las informaciones de los diccionarios son muy breves,

fragmentarias, vagas, inexactas. • Información normativa. Se reduce a determinadas marcas (desusado, poco usado,

México, vulgar…), presentadas en forma de abreviaturas y con un valor científico muy vago.

• Ejemplos. En un diccionario electrónico, el usuario podría acceder a una batería de ejemplos que contribuirían a facilitar la comprensión, a perfilar sus usos mayoritarios y prototípicos, a familiarizarse con sus combinaciones…

• Iinformaciones etimológicas y diacrónicas de las que muchos diccionarios prescinden.

• Desde el punto de vista tecnológico, la lexicografía se halla lastrada por un déficit inicial. Los corpus sobre los que trabaja (por mucho que se acerquen a cantidades masivas de macrodatos o big data) suelen llegar a los umbrales mínimos de especificación y de etiquetados en metadatos. Como consecuencia, la obtención de información y la redacción de las entradas suele adolecer de excesiva carga de intuición, de lentitud, de dificultades de comprobación…

Page 53: Lexicografía académica

Limitaciones de la lexicografía sobre el español

• Carecemos una lexicografía diacrónica que presente una explicación relacional e integrada de la evolución del léxico, de los factores que han intervenido….

• A pesar de la reciente publicación del Diccionario de americanismos (y del avance que supuso en un terreno inculto) nuestro conocimiento del léxico ultramarino no deja de poseer muchas lagunas. Necesitamos corpus documentales en los países americanos y en Filipinas.

• Los corpus necesitan un inevitable enriquecimiento cualitativo para prestar mejores servicios a una lexicografía moderna del español. Precisan de un etiquetado minucioso, refinado, orientado, exhaustivo… con el fin de que el lexicógrafo no tenga que enfrentarse en el momento de la redacción a una masa amorfa de datos.

• Los diccionarios generales de uso, entre los que se encuentra en DRAE, son obras de aluvión. Se hallan llenos de incongruencias, de vacíos, de desproporción, de pervivencias incompresibles, de ausencias inexplicables, de definiciones arcaicas… Por otra parte, en su sistema de organización de la microestructura necesitan una reforma y una actualización metodológica inaplazables.

• La información etimológica (en especial la que fija los caminos de entrada del léxico en el español, necesita muchas precisiones. De igual modo, se presenta como imprescindible abordar el estudio fónico y morfológico con mayor apoyatura documental en la evolución del léxico.

• Los productos adolecen de atomicismo. Los diccionarios recogen y describen el léxico “palabra por palabra” sin tomar en consideración las restricciones que presentan a su “valor” los conjuntos en los que se inscriben, ya sean familias etimológicas (familias léxicas), de significado (campos semánticos) o de convivencia en la realidad (campos de experiencia).

Page 54: Lexicografía académica

Bases metodológicas• • Metodología. El proyecto ha de resolver todos los interrogantes

teóricos y metodológicos que afectan a la macroestructura de un diccionario de la era digital, en el que no pesan las limitaciones impuestas por el papel: orden alfabético, condensación, economía, manejabilidad… Los medios de acceso, de almacenamiento de datos, de manejabilidad permiten otra forma de hacer lexicografía, la lexicografía del futuro, forma que pretende investigar y dilucidar hasta donde sea posible este proyecto. Por otra parte, la investigación ha de resolver cómo puede enriquecerse la microestructura del diccionario con el desarrollo experimentado por la ciencia lingüística en las últimas décadas. A causa de sus limitaciones, la lexicografía se ha mantenido fiel a sus principios, lo que equivale, a un alejamiento de las propuestas y de los indiscutibles avances de la lingüística estructural, generativa y de las disciplinas de la comunicación.

Page 55: Lexicografía académica

Pancronía y tecnología• Diccionario total. El proyecto afronta el reto de construir

las bases de una lexicografía total y pancrónica del español. Un elevado porcentaje de los problemas del léxico del pasado y del presente son comunes. Lo que hoy es presente, mañana será pasado. La descripción lexicográfica de hoy ha de ser integrable y homogénea con las descripciones del pasado.

• Tecnología. La lexicografía se apoya en el empirismo del dato, de los textos. Se necesitan millones de datos para apoyar la investigación sobre cada unidad lexicográfica (fundamentalmente palabras). La tecnología será necesaria para el almacenamiento, recuperación, transmisión y aprovechamiento de las conclusiones.

Page 56: Lexicografía académica

Fuentes documentales• Investigación. Además de la investigación metodológica señalada

más arriba, la lexicografía implica numerosas etapas de investigación:

• a) En la selección de la autenticidad y calidad de los textos que se recogen en los corpus.

• b) En el etiquetado de cada uno ítems. Los metadatos que se asignen a cada unidad del corpus el resultado de decisiones minuciosamente contrastadas.

• c) En el estudio de los textos para determinar el significado y las características de cada una de las ocurrencias, datos que luego serán procesadas en el proceso de definición.

• Todas las acepciones de una entrada lexicográfica (por ejemplo, palabras como savia, rural, ya o según) serán el resultado de larga y laboriosa investigación.