c onceptos generales de la lingÜÍstica computacional ana maría tangarife patiño

Post on 25-Jan-2016

226 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

CONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL

Ana María Tangarife Patiño

OBJETIVO

Exponer los conceptos generales de la disciplina, identificando las relaciones y diferencias con otras áreas disciplinares que comparten su objeto de estudio.

INTERDISCIPLINARIEDAD

Lingüística Informática

Objetivo:Generar modelos computacionales que reproduzcan uno o más

aspectos del lenguaje humano.

ÁREAS DISCIPLINARES INVOLUCRADAS (1)

LCIA

Industrias de la Lengua

Lingüística

aplicada

Lingüística

teórica

La LC es un campo interdisciplinario cuyo objetivo es incorporar en los computadores la habilidad en el manejo del lenguaje humano o natural.

ÁREAS DISCIPLINARES INVOLUCRADAS (2)

Informática IA

•Es la ciencia de hacer máquinas inteligentes.

LC •Diseña máquinas capaces de comprender el lenguaje, aprender, razonar y tomar decisiones.

ÁREAS DISCIPLINARES INVOLUCRADAS (3)

Lingüística teórica

•La lingüística es el estudio científico de la lengua. Como tal, se ocupa de descubrir y entender la naturaleza y las leyes que gobiernan el lenguaje.

LC •Elabora modelos formales (implementables informáticamente) del lenguaje humano.

FUNDAMENTOS DE LA LC

Lingüística aplicada •Rama de la lingüística que se ocupa de los problemas que el lenguaje plantea como medio de relación social y de la cual derivan tres ramas o campos de acción: enseñanza de lengua materna, enseñanza de segunda lengua y enseñanza de lenguas asistida por computador.

LC •Aplica los modelos y métodos de investigación lingüísticos en campos como la enseñanza de idiomas, la traducción, etc.

FUNDAMENTOS DE LA LC

LC •Elabora programas informáticos (software) para el mercado como los traductores, procesadores de texto, etc.

Industrias de la lengua

•Entendida como una actividad de índole fundamentalmente comercial, requiere el desarrollo de la ingeniería lingüística para disponer de las herramientas y técnicas a partir de las que se crean productos que realizan diversas funciones relacionadas con la utilización del lenguaje.

OBJETIVOS DE LA LC

Comprobar los modelos lingüísticos y las teorías, diseñando algoritmos y sistemas que puedan ser evaluados y comprendidos en trabajos de procesamiento de lenguaje natural (PLN).

Diferencia entre LC y PLN

LC: usa las máquinas computacionales para investigar o tratar los fenómenos lingüísticos.

PLN: aplicaciones concretas para el procesamiento de textos.

VERTIENTES DE LA LC

Dado que la LC abarca muchos objetivos es necesario diferenciar tres vertientes que delimitan su campo de acción:

1. Informática aplicada a la investigación

2. Implementación de teorías lingüísticas

3. Aplicaciones lingüísticas de la informática

INFORMÁTICA APLICADA A LA INVESTIGACIÓN

• Su objetivo es emprender el estudio científico del lenguaje por medio ordenadores.

• Suele recibir el nombre de Lingüística informática o de Informática aplicada a la lingüística.

Ejemplo: conocer el uso del sufijo –able en inglés moderno temprano por medio de un corpus escrito.

IMPLEMENTACIÓN DE TEORÍAS LINGÜÍSTICAS

• Su objetivo es elaborar formalismos lingüísticos que son lenguajes artificiales diseñados específicamente para representar conocimientos lingüísticos y que pueden ser entendidos por los ordenadores.

• Suele recibir el nombre de Lingüística computacional en sentido estricto.

Ejemplo: Wordnet, corpus lingüístico para el inglés

APLICACIONES LINGÜÍSTICAS DE LA INFORMÁTICA

• Diseña sistemas informáticos encaminados a la comprensión y generación del lenguaje natural.

• Esta vertiente recibe el nombre de Procesamiento del lenguaje natural, Tecnologías de la lengua o Ingeniería lingüística.

Ejemplo: tecnologías del habla, traducción automática, sistemas de extracción de información, etc.

PROGRAMAS PRINCIPALES DESARROLLADOS POR LA

LINGÜÍSTICA COMPUTACIONAL Modelos de teorías lingüísticas

Enseñanza de lenguas extranjeras

Corrección de ortografía y sintaxis de textos

Reconocimiento de voz humana

Procesamiento de información

Sistemas expertos

Traducción automática

ÁREAS DE LA LC

Análisis automático de la fonética, la fonología, la morfología, la sintaxis y la pragmática.

A partir de las siguientes tareas Etiquetamiento morfológico o tagging Análisis sintáctico o parsing Técnicas de reconocimiento automático de voz Recuperación inteligente de información Sistemas de diálogo y sistemas expertos Traducción automática

ANÁLISIS MORFOLÓFICO

Tagging (Etiquetador)

Análisis automático de las palabras que componen una frase.

ANÁLISIS SINTÁCTICO

Parsing (Parse: analizar sintácticamente)

Análisis automático de una oración.

Fase inicial para la interpretación semántica

ANALIZADORES MORFOSINTÁCTICOS

Ejemplos para el español http://www.gedlc.ulpgc.es/investigacion/desambi

gua/morfosintactico.htm http://www.mystilus.com/MorphosyntacticAnalyz

er

Analizador para el inglés: http://www2.lingsoft.fi/cgi-bin/engcg/

RECUPERACIÓN INTELIGENTE DE INFORMACIÓN

Information Retrieval

Almacenamiento y envío digital de datos

Técnicas de extracción de datos contenidos en textos y su transmisión a los usuarios

Ejemplos: Bases de datos Buscadores de internet

SISTEMAS DE DIÁLOGO Y SISTEMAS EXPERTOS

Comunicación entre uno o más usuarios y la computadores

Sistemas pregunta-respuesta

Ejemplo: Asistente en la instalación de un programa, compras por internet

Sistemas expertos Representación de conocimiento Generación automática de textos

Software de manipulación de datos: Esto requiere un CORPUS amplio sobre los dominios

Ejemplos: Diagnósticos automatizados de enfermedades

TRADUCCIÓN AUTOMÁTICA

Representación intermedia de dos o más códigos linguísticos

INTERLINGUA

Ejemplos: http://www.reverso.net/text_translation.aspx?lan

g=ES http://translate.google.es/

LC COMO ÁREA DE CONOCIMIENTO

Un programa de formación en lingüística computacional debe contener las siguientes áreas de conocimiento: Lingüística Matemática Informática

En cuanto a los conocimientos teóricos Teorías estructuralistas Teorías generativistas clásicas Gramática de casos de Fillmore Gramática funcional Lingüística algorítmica

PROBLEMAS ACTUALES EN LA LC

La LC trabaja en distintos niveles del lenguaje:

Fonética/Fonología

Morfología

Sintaxis

Semántica

Pragmática

PROBLEMAS ACTUALES EN LA LCFONÉTICA Y FONOLOGÍA

Sistemas de análisis y síntesis del habla

Reconocimiento de voz

Generación de voz

Estos desarrollos se dirigen hacia el interés de diseñar programas para el dictado y reconocimiento automático.

No presentan aún desarrollos significativos puesto que no se logra modelar flexiones y variaciones en entonaciones particulares en las lenguas

PROBLEMAS ACTUALES EN LA LCMORFOLOGÍA

Análisis y síntesis automático morfológico (sufijos, prefijos, raíces y flexiones)

Hace falta la construcción de diccionarios robustos

Aunque ha habido grandes desarrollos, se requiere una estandarización efectiva del lenguaje para la marcación

PROBLEMAS ACTUALES EN LA LCSINTAXIS

Análisis y sintáctico (parser)

Es especialmente difícil automatizar en español donde no hay un orden fijo de las palabras que componen una oración

Ejemplo:

¿Estuviste en el parque el sábado?

¿El sábado estuviste en la parque?

¿Tu estabas en el parque el sábado?

PROBLEMAS ACTUALES EN LA LCSEMÁNTICA

Construcción de redes semánticas donde se presenten conceptos y relaciones entre ellos Problemas: Polisemia Ejemplo:

Gato (animal felino) Gato (instrumento)

Encontrar sentidos y hacer separaciones entre ellos Lexicografía: construcción de diccionarios generales y

especializados

Representación de conocimientos en general Elaboración de terminologías especializadas Ontologías

PROBLEMAS ACTUALES EN LA LCPRAGMÁTICA

Relaciones entre oración y el mundo externo.

Como ya se tienen muchos problemas en la semántica, es difícil continuar el análisis en el nivel siguiente.

REFERENCIAS

Domínguez Burgos, Andrés. Lingüística computacional: un esbozo. Boletín de lingüística, No. 18. pp. 104-119

Mercado, Heiner (2008). Fundamentos de la LC [presentación de clase]

Sidorov, Grigory (2001). Problemas actuales de lingüística computacional. Revista digital universitaria, Vol. 2, No. 1

top related