boletín de vigilancia economía digital tecnológica

39
Programa de Excelencia en Contenidos Digitales y Economía Digital Boletín de Vigilancia Tecnológica Procesamiento del Lenguaje Natural Actualizado a Septiembre de 2015

Upload: others

Post on 14-Jul-2022

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Boletín de Vigilancia Economía Digital Tecnológica

Programa de Excelencia en Contenidos Digitales y

Economía Digital

Boletín de

Vigilancia

Tecnológica

Procesamiento

del Lenguaje

Natural

Actualizado a

Septiembre de 2015

Page 2: Boletín de Vigilancia Economía Digital Tecnológica

Índice

General

3. Futuro del Procesamiento del Lenguaje

Natural

2. Aplicaciones del Procesamiento del

Lenguaje Natural

4. Agentes clave

1. Introducción

5. Patentes

6. Iniciativas de interés

7. Fuentes de información

Page 3: Boletín de Vigilancia Economía Digital Tecnológica

1. Introducción

Page 4: Boletín de Vigilancia Economía Digital Tecnológica

4

La información es el recurso más importante que poseemos los seres humanos. Gran parte de esta

información se comunica, almacena y maneja en forma de lenguaje natural, en sus diferentes formas.

En la actualidad, podemos obtener grandes volúmenes de información en forma escrita, ya sea de manera

impresa o electrónica. Los ordenadores son una herramienta indispensable para el procesamiento de la

información plasmada en los textos, ya que son capaces de manejar grandes volúmenes de datos. Sin

embargo, un ordenador no puede hacer todo lo que las personas normalmente hacemos con el texto, por

ejemplo, responder preguntas basándose en la información proporcionada, hacer inferencias lógicas sobre

su contenido, o elaborar un resumen de esta información.

El esfuerzo que la Ciencia invierte hoy en día para contrarrestar esta situación se denomina procesamiento

de lenguaje natural, procesamiento de texto, tecnologías de lenguaje o lingüística computacional. El lenguaje

humano es complejo, multiforme y rico en expresiones, pero a la vez puede ser ambiguo y requerir

interpretación de acuerdo al contexto, al momento y la intención del hablante. El lenguaje formal o artificial,

por el contrario, se diseña con una finalidad concreta, es restringido en su sintaxis y en su semántica, por ello

es más preciso, con menos espacio para la libre interpretación y libre del contexto.

El Procesamiento del Lenguaje Natural (PLN) es una rama muy importante de la Inteligencia Artificial y una

de las más antiguas. Las primeras traducciones automáticas se iniciaron en la década de los 40 con la II

Guerra mundial. Sin embargo, como consecuencia de la escasa potencia de los ordenadores los intentos

fracasaron, pero a pesar de ello, a partir de la década del 60 el procesamiento de lenguaje natural resurgió

nuevamente.

Lenguaje natural vs Lenguaje Artificial

Lenguaje Artificial

Se compone de símbolos y fórmulas, con el objetivo de formalizar la programación de ordenadores o representar simbólicamente el conocimiento científico.

Las palabras y oraciones están perfectamente definidas, una palabra mantiene el mismo significado prescindiendo del contexto o su uso.

Propiedades:o Se desarrollan a partir de una teoría

preestablecida.o Componente semántico mínimo.o Posibilidad de incrementar el componente

semántico de acuerdo con la teoría a formalizar.o La sintaxis produce oraciones no ambiguas.o Los números tienen un rol importante.o Poseen una completa formalización,

posibilitando la construcción computacional.

Lenguaje Natural

Medio principal para la comunicación humana.

Gran poder expresivo.

Para conseguir un alto grado de comprensión del lenguaje natural es necesario que los algoritmos posean un completo conocimiento del idioma; desde los caracteres de una palabra hasta el contexto del diálogo.

Propiedades:o Han sido desarrollados por

enriquecimiento progresivo previo a cualquier teoría.

o La importancia de su carácter expresivo se debe a la riqueza del componente semántico (polisemia).

o Existe dificultad o imposibilidad de una formalización completa.

Page 5: Boletín de Vigilancia Economía Digital Tecnológica

5

El Procesamiento de Lenguaje Natural (PLN) tiene por objetivo habilitar a los ordenadores para que

entiendan el texto, procesándolo por su sentido. Para llevar a cabo esta tarea, un sistema de procesamiento

de lenguaje natural necesita conocer la estructura del lenguaje, la cual se analiza normalmente en 4 niveles:

1. Nivel Morfológico::Se estudia cómo se construyen las palabras. Detecta las relaciones que se

establece entre las unidades mínimas que forman una palabra (sufijos, prefijos) y la relación con el

léxico, siendo éste un conjunto de información sobre cada palabra que el sistema utiliza para el

procesamiento.

A continuación se muestra un ejemplo de análisis morfológico para la oración “Un gato negro caza un ratón

blanco”:

2. Nivel Sintáctico: Se estudia cómo combinar las palabras para formar oraciones. Su función es

asignar etiquetas a cada uno de los componentes que aparecen en la oración a analizar, de manera

que se sepa cómo se combinan las palabras y forman estructuras gramaticales correctas.

Existen dos enfoques para describir formalmente la gramaticalidad de las oraciones: los constituyentes y las

dependencias:

a) El enfoque de constituyentes consiste en analizar la oración mediante un proceso de segmentación y

clasificación, obteniendo como resultado un árbol como el siguiente:

Niveles del Procesamiento de Lenguaje Natural

Page 6: Boletín de Vigilancia Economía Digital Tecnológica

6

b) El enfoque de dependencias consiste en el establecimiento de la relación entre pares de palabras, una

de ellas tiene el rol de rectora y la otra el rol de dependiente o subordinada, obteniendo como resultado

una estructura jerárquica, el árbol de dependencias, donde la única palabra que no tiene rectora es la

raíz del árbol, tal y como se muestra a continuación:

3. Nivel Semántico: Se estudia el significado de las oraciones, representándolo de manera formal.

Existen varias formas de representación formal semántica de las oraciones, tales como las siguientes:

Lógica de primer orden

Redes semánticas

Grafos conceptuales

4. Nivel Pragmático: Se estudia cómo el contexto afecta a la interpretación de las oraciones.

Ésta es la cadena de análisis ideal con los cuatro niveles, que sin embargo no se corresponde con la

realidad, dado que la mayoría de los sistemas no van más allá del análisis sintáctico.

Page 7: Boletín de Vigilancia Economía Digital Tecnológica

2. Aplicaciones del Procesamiento

del Lenguaje Natural

Page 8: Boletín de Vigilancia Economía Digital Tecnológica

8

Las principales aplicaciones prácticas del Procesamiento de Lenguaje Natural (PLN) son las siguientes:

Minería de datos

Sistemas de búsqueda de respuestas

Corrección ortográfica

Síntesis de voz

Sistemas de diálogo

Reconocimiento de voz

Análisis de sentimientos

Generación de resúmenes automáticos

Traducción automática

Recuperación y extracción de información

A continuación se presenta un breve detalle de cada una de estas aplicaciones:

Minería de datos1

La minería de datos es la extracción no trivial de información que reside de manera implícita en los datos. En

este concepto se engloba un conjunto de técnicas encaminadas a la extracción de conocimiento procesable,

implícito en las bases de datos. Las bases de la minería de datos se encuentran en la inteligencia artificial y

en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda

la solución a problemas de predicción, clasificación y segmentación.

La minería de datos proporciona potentes herramientas para descubrir patrones ocultos y relaciones en

datos estructurados. Este proceso asume que los datos se encuentran almacenados en un formato

estructurado. Por ello, su pre-procesamiento consiste en la limpieza y normalización de los datos, y la

generación de numerosos enlaces entre las tablas de las bases de datos.

La minería de datos usa técnicas y metodologías de Recuperación de Información, Extracción de Información

y corpus procesados con técnicas de lingüística computacional.

Page 9: Boletín de Vigilancia Economía Digital Tecnológica

9

Sistemas de búsqueda de respuesta2

En Internet existe infinidad de documentos que contienen todo tipo de información, falsa y verdadera. La

información no se encuentra bien distribuida en la red y encontrarla se hace difícil. Los buscadores

tradicionales aún no entienden completamente qué necesita el usuario a pesar de haberse incorporado

técnicas como el reconocimiento semántico. Mediante la implementación de las técnicas semánticas las

búsquedas de información en Internet hoy en día son superiores a las de tres años atrás, de manera tal que

el buscador parece comprender más de lo que el usuario “humano” necesita.

Los sistemas de búsqueda de respuesta son sistemas diseñados para formular una pregunta en lenguaje

natural y proporcionar una respuesta. De esta manera los usuarios no tienen que navegar y leer una o varias

páginas de resultados de búsqueda.

Estos sistemas se construyen sobre motores de búsqueda y requieren contenido como fuente para descubrir

las respuestas. Deben tener métodos para entender las preguntas del usuario y determinar el tipo de

respuesta que debe dar, generar una búsqueda significativa de la consulta, y finalmente calificar los

resultados obtenidos.

De estos tres problemas el más difícil de enfrentar es determinar el tipo de respuesta. Para hacerlo se

realizan tres pasos: entrenamiento, fragmentación y determinación del tipo de respuesta.

Para construir un sistema de respuestas se necesita aplicar técnicas como: Recuperación de Información,

Extracción de Información con algoritmos de reconocimiento de entidades y etiquetado, comparación de

secuencias de caracteres, etc.

Corrección ortográfica3

La corrección ortográfica es una de las aplicaciones del procesamiento de lenguaje natural de mayor uso

cotidiano. La aplicación está continuamente analizando el texto, y avisa de los errores normalmente

subrayando la palabra en rojo.

Los primeros correctores ortográficos eran muy simples: contaban con un corpus léxico del idioma a

analizar, y si una palabra no estaba en el mismo, era considerada como errónea. Con el tiempo, los

algoritmos fueron evolucionando y aparecieron los primeros correctores ortográficos que mostraban

sugerencias cercanas a la palabra mal escrita. Los siguientes avances fueron encaminados a encontrar

errores sintácticos y/o de concordancia de género y número.

Actualmente, los correctores automáticos han dado un salto más allá de los procesadores de texto, de tal

forma que podemos encontrarlos en multitud de aplicaciones: los navegadores web incorporan un corrector

para los contenidos introducidos por el usuario, los propios sitios web de edición de blogs, contenidos wiki y

los clientes de mensajería instantánea hacen uso de esta tecnología.

Page 10: Boletín de Vigilancia Economía Digital Tecnológica

10

Síntesis de voz4

La síntesis de voz tiene como objetivo transformar, de forma automática, cualquier texto en una locución

auditiva lo más semejante posible al habla de un humano. A un sistema capaz de producir dicha salida se le

conoce como sintetizador de voz o Text-To-Speech (TTS).

Un sistema de TTS recibe como entrada una cadena de texto en un idioma determinado, la analiza y

procesa, dando como resultado una salida auditiva que contiene una locución verbal que representa al texto

de entrada.

Durante la etapa de análisis se realizan multitud de operaciones: la normalización del texto, la pronunciación

o el cálculo de la prosodia (velocidad, tono, duración, etc.). A la hora de generar la salida auditiva, se necesita

un modelo de lenguaje y de información fonética del mismo.

Estos sistemas son muy utilizados en los sistemas de avisos automáticos de aeropuertos, estaciones de

autobuses y ferrocarriles, sistemas telefónicos de atención al cliente, dispositivos móviles y GPS, etc. Fuera

del ámbito comercial, se emplean en aplicaciones educativas y en los sistemas para personas con

discapacidades visuales.

Sistemas de diálogo5

Los sistemas de diálogo persiguen el objetivo de que un humano pueda conversar con un sistema

informático con la misma naturalidad con la que conversa con otro humano.

Entre los problemas que debe tratar el propio gestor del diálogo se encuentran: el contexto del discurso, el

tipo de estrategia de diálogo (colaborativa, proactiva, ...), la elipsis, las construcciones anafóricas, etc.

Desarrollar un sistema de diálogo robusto y eficaz puede considerarse una de las tareas más complejas

dentro del procesamiento de lenguaje natural. Esta dificultad se debe fundamentalmente a dos factores. En

primer lugar, es una de las tareas más jóvenes y por tanto con menos años de investigación y experiencia a

sus espaldas. En segundo lugar, un gestor de diálogo por sí solo no tiene utilidad práctica; necesita

integrarse con otros módulos típicos como el reconocedor de voz, el sistema Text-To-Speech (TTS), o el de

generación de lenguaje natural. En definitiva, el éxito de un sistema de diálogo no depende sólo del módulo

que gestiona el diálogo en sí, sino de la perfecta armonía entre sus componentes. Los sistemas de diálogo

han proliferado mucho en los últimos años. Cada vez es más fácil encontrarlos en forma de asistentes

virtuales en distintos portales web con una misión orientativa de cara al usuario. Probablemente

encontremos en los próximos años nuevos asistentes dedicados a tareas más complejas: gestionar una cita

médica, comprar billetes de tren o avión, tienda virtual, etc.

Page 11: Boletín de Vigilancia Economía Digital Tecnológica

11

Reconocimiento de voz6

El reconocimiento de voz puede definirse como el proceso inverso a la síntesis de voz. Este sistema recibe

como entrada una locución de audio y genera como salida una cadena de texto que transcribe dicha

locución.

Los sistemas comerciales de reconocimiento de voz están siendo muy utilizados en aplicaciones telefónicas:

agencias de viajes, reserva de billetes/entradas, atención al cliente, información, etc. En los últimos años, se

han incorporado también a los dispositivos móviles, entornos domóticos, teleasistencia y vehículos militares.

Se trata de una disciplina relativamente joven respecto al resto, si bien su tecnología todavía se encuentra

en intenso desarrollo.

Hoy día suelen emplearse en dominios cerrados, ya que existen dificultades al enfrentarse a dominios

abiertos, habla espontánea o ruido ambiental.

Análisis de sentimientos7

El análisis de sentimientos en textos es la identificación y extracción de información subjetiva. También

denominado “minería de opiniones”, este proceso involucra el uso de herramientas de procesamiento de

lenguaje natural y software de análisis de textos para automatizar el proceso.

La forma básica de análisis es una clasificación polarizada de sentimientos que asigna calificaciones en un

rango de -10 a 10, basadas en el aprendizaje para evaluar emociones positivas y negativas en corpus

etiquetados de entrenamiento.

Las técnicas avanzadas analizan gramaticalmente y descomponen la oración. Se usan reglas gramaticales

para extraer inferencias. El motor de reglas se aplica varias veces para transformar el texto etiquetado en

oraciones que definen la asociación entre una palabra y una parte del habla con un sentimiento calificado.

Para la implementación se utilizan herramientas para etiquetar y una base de datos con claves y frases con

evaluaciones de polaridad de emociones. Esta información proviene de fuentes etiquetadas o por

aprendizaje en corpus.

Existen actualmente dos fuentes de datos disponibles : HDCUS y elWordNet-Affect. También existen librerías

de código abierto como Gate, Balie, Mallet.

Uno de los grandes campos de aplicación es en la web. Las empresas bucean en estos medios para estudiar

el mercado, obtener ideas para lanzar nuevos productos o recoger feedback sobre los clientes en base a sus

comentarios.

Page 12: Boletín de Vigilancia Economía Digital Tecnológica

12

Generación de resúmenes automáticos8

La generación automática de resúmenes consiste en crear una versión más reducida de un texto donde se

condense la información más importante. Normalmente estas aplicaciones realizan un análisis iterativo del

texto de entrada de forma que van remarcando las partes que se consideren relevantes.

El resumen vendrá determinado por aspectos tales como el tipo del documento (noticia, ensayo, etc.), el

estilo de redacción del texto, su longitud o incluso el tipo de expresiones utilizadas.

Existen dos formas de generar los resúmenes:

Por extracción: Consiste en extraer literalmente las partes más relevantes del documento, como

pueden ser los extractos que muestran los buscadores, donde marcan el contexto en el que aparecen

las palabras que buscamos. Estos pequeños fragmentos del texto original (snippets) se obtienen por

extracción.

Por abstracción: Consiste en parafrasear el texto original en unas pocas líneas, es decir, realizar una

explicación no literal para hacerlo más claro, conciso e inteligible.

Generalmente, los humanos realizan resúmenes de tipo abstractivo, mientras que la mayoría de las

herramientas comerciales generan resúmenes de forma extractiva.

Un problema común es la existencia de múltiples documentos sobre un mismo tema, en este caso se habla

de resúmenes a nivel de colecciones de documentos, que agrupan o separan los documentos por tópicos y

destacan las similitudes y diferencias de la información contenida en ellos. Los contenidos se relacionan

entre ellos en un sentido semántico: cubren el mismo tópico, tienen similares categorías semánticas o

conceptos estrechamente relacionados.

Las herramientas comerciales para la generación de resúmenes automáticos se pueden instalar en equipos

propios o ejecutar de manera online en Internet. Algunas de las herramientas instalables son Copernic

Summarizer y Microsoft Office Word, mientras que entre las herramientas online se encuentran Svhoong

Summarizer, Pertinence Summarizer, Tool4noobs Summarizer y Open Text Summarizer.

Page 13: Boletín de Vigilancia Economía Digital Tecnológica

13

Traducción automática9

La traducción automática consiste en convertir un texto de un idioma a otro manteniendo el significado,

por medio de un ordenador y sin intervención humana. Se trata de la disciplina que más ha contribuido en

el desarrollo de la lingüística computacional, al ser la tarea que da origen al procesamiento del lenguaje

natural como tal.

El proceso que rige el funcionamiento de la traducción automática es el siguiente: dado un texto de

entrada escrito en un idioma origen, se analiza, se procesa, y finalmente se genera el mismo texto en el

idioma destino.

Las herramientas actuales consiguen un alto grado de fiabilidad, si bien todavía no puede prescindirse

totalmente de la posterior revisión humana. Es posible conseguir mejores resultados pero rescindiendo la

traducción a dominios limitados.

Los sistemas de traducción automática se pueden clasificar de la siguiente manera:

Sistemas de traducción directa: Podrían equipararse con grandes diccionarios. Realizan la traducción

casi palabra por palabra, ya que la información sintáctica que poseen es mínima. Por ello, los

resultados que ofrecen suelen ser bastante pobres.

Sistemas de transferencia: Contienen grandes léxicos bilingües, además de un amplio conocimiento

sintáctico y semántico de los idiomas. Esto permite traducir palabras de una lengua a otra teniendo

en cuenta el contexto morfológico, sintáctico y semántico de la frase. También pueden llevar a cabo

la transferencia estructural, es decir, los cambios en el orden de elementos y en la estructura de la

frase para adecuarse a cada lengua.

Sistemas interlingua: Estos sistemas conocen todas las características y todas las distinciones de

todos los idiomas. Para realizar una traducción, se usa un analizador para convertir el texto en

idioma fuente al interlingua, y un generador que convierte el texto interlingua al idioma destino.

Estos sistemas están en fase de laboratorio o se utilizan para aplicaciones muy restringidas, debido

a los problemas prácticos que presentan el diseño y la implementación de una interlingua eficaz.

Sistemas estadísticos: La traducción automática estadística consiste en calcular las distintas

probabilidades de que cierta cadena de texto en el lenguaje destino sea la traducción de la misma

cadena en el lenguaje origen, maximizando la probabilidad de todos los pares de cadenas origen-

destino. Para el cálculo de dichas probabilidades, se realiza una fase de entrenamiento previo con

textos ya traducidos y supervisados por un humano. Un ejemplo es el traductor de Google, el cual

realiza un reconocimiento léxico, comparación con reglas sintáctica según la probabilidad de

aparición y finalmente hace una correspondencia entre parejas de palabras en los dos idiomas.

A pesar de los avances tecnológicos, existen diversos retos en la traducción, especialmente entre

lenguajes con distinto orden de palabras y una morfología compleja. La investigación en esta área se dirige

a la exploración de métodos de aprendizaje avanzado en modelos estadísticos de traducción, modelos

sintácticos y sus representaciones, datos paralelos para entrenamiento de modelos estadísticos,

integración de traducción del habla con otras aplicaciones como reconocimiento de voz y traducción

automática.

Page 14: Boletín de Vigilancia Economía Digital Tecnológica

14

Recuperación y extracción de información10

La recuperación de información es el proceso de encontrar en un repositorio grande de datos, material

(usualmente documentos) de naturaleza no estructurada (usualmente texto) o semiestructurada (páginas

Web, por ejemplo), que satisfaga una necesidad de información. Los datos no estructurados no tienen un

esquema claro, no están listos para procesar y son lo opuesto a los datos con un esquema estructurados

como los que se encuentran en bases de datos. Los datos semiestructurados están en documentos

esquema estructurados, con marcas explícitas como el código HTML.

La información encontrada debe ser pertinente y relevante: La relevancia es la medida de cómo una

pregunta se ajusta a un documento, mientras que la pertinencia es la medida de cómo un documento se

ajusta a una necesidad informativa.

Una de las primeras aplicaciones prácticas de los sistemas de recuperación de información fueron los

catálogos digitales, muy utilizados en organismos con gran cantidad de documentos como las

Administraciones Públicas o las bibliotecas. Éstas permitían a los usuarios realizar búsquedas rápidas sobre

criterios típicos como título, autor o año de publicación. Estas aplicaciones obtuvieron una gran aceptación;

sin embargo, estos sistemas obtendrían el impulso definitivo con el auge de Internet. Buscadores como

Yahoo! o Google representan un gran avance, especialmente en el modo en que nos han facilitado el acceso

a las distintas fuentes de conocimiento, siendo la primera opción a la que se acude para las necesidades de

información.

La tarea de recuperación se lleva a cabo, en general, separando varios procesos:

Análisis y normalización: Selección de los términos que mejor representan el contenido de los

documentos (y consultas), y transformación de los términos seleccionados con el objetivo de

reducirlos a formas canónicas, que faciliten las correspondencias posteriores en el proceso de

búsqueda. Los términos pueden ser palabras, frases, n-gramas, u otras unidades.

Cálculo de pesos: Asignación a cada uno de los términos de un valor numérico (peso) que representa

su importancia a la hora de representar el contenido de un documento.

Indexación: Creación de un índice que facilite el acceso a los documentos que contengan los términos

que los representan.

Búsqueda: Proceso basado en el cálculo de correspondencias y semejanzas entre la representación

de la consulta y la de cada documento. Para obtener representaciones compatibles y así permitir

comparar consultas con documentos, el texto de cada consulta deberá ser analizado de la misma

manera que el de los documentos.

Una vez que se ha logrado acceso a los contenidos buscados y se tiene control sobre los datos, en muchas

aplicaciones se hace necesario el siguiente proceso que es el de extracción de la información, que consiste

en la obtención de las partes que interesan en el texto para pasarlas a un formato de base de datos, es

decir, a un formato estructurado.

En general, los sistemas de extracción de información son útiles si la información a ser extraída está

especificada explícitamente; el documento puede resumirse con un número pequeño de plantillas; o la

información que se necesita está incluida completamente en el texto.

Page 15: Boletín de Vigilancia Economía Digital Tecnológica

3. Futuro del Procesamiento del

Lenguaje Natural

Page 16: Boletín de Vigilancia Economía Digital Tecnológica

16

Ambigüedad Separación entre

palabras

Recepción de la

información

El lenguaje natural es

inherentemente ambiguo. Por

ejemplo, una misma palabra

puede tener varios significados, y

la selección del apropiado se debe

deducir a partir del contexto.

Los diferentes tipos de

acentos, errores de

mecanografiado, expresiones

no gramaticales, etc., crean un

problema en la recepción de la

información.

Desde sus orígenes, la investigación en Procesamiento del Lenguaje Natural (PLN), ha

estado fuertemente guiada por una tendencia hacia el tratamiento de la lengua inglesa.

Sin embargo, cada vez más, los grupos de investigación españoles desarrollan sus

investigaciones para el español.

Los principales problemas detectados para el procesamiento del lenguaje natural son los

siguientes:

Fuente: Libro Blanco de las Tecnologías del Habla

Por ello, las principales líneas de investigación en el área de Procesamiento del Lenguaje

Natural son las siguientes:

Análisis léxico-morfológico:

categorización gramatical (POS tagging).

Anotación semántica de palabras

(resolución de la ambigüedad léxica).

Modelos estadísticos del lenguaje.

En la lengua hablada no se

suelen hacer pausas entre

palabra y palabra. Además, en la

lengua escrita existen idiomas sin

separación entre las palabras (p.

ej. chino mandarín).

Tratamiento morfológico

Tratamiento sintáctico

Tratamiento semántico

Tratamiento pragmático

Gramáticas para el

reconocimiento del Lenguaje.

Análisis sintáctico robusto.

Análisis sintáctico superficial

(chunkers).

Análisis semánticos robustos.

Categorización semántica y clasificación

de textos.

Construcción de ontologías lingüísticas.

Sistemas de compresión del lenguaje para diálogo; Traducción

automática; Sistemas de apoyo a la traducción; Reconocimiento

y comprensión de textos; Búsqueda y recuperación de

información textual; Adquisición y representación del

conocimiento; Detección de temas y dominios;

Sistemas de pregunta-respuesta; Extracción

de información; Elaboración automática y

semiautomática de documentos y

resúmenes; Resolución de fenómenos

lingüísticos: elipsis, anáfora, ambigüedad

estructural; Corrección de textos;

Sistemas de ayuda al aprendizaje.

Page 17: Boletín de Vigilancia Economía Digital Tecnológica

4. Agentes Clave

Page 18: Boletín de Vigilancia Economía Digital Tecnológica

18

La Red Temática en Tecnologías del Habla se creó en el año 2001, con el propósito de agrupar a todos los

agentes en el ámbito español relacionados con las Tecnologías del Habla.

Se trata de un foro común donde los investigadores en Tecnología del Habla pueden aunar esfuerzos y

compartir experiencias, con el fin de:

Fomentar la investigación en Tecnologías del Habla, atrayendo a nuevos jóvenes investigadores a

este campo, a través de las siguientes actividades:

o Ampliación del Centro Investigador y Docente virtual con nuevos recursos (material docente,

herramientas software y bases de datos), orientados a facilitar la incorporación de nuevos

investigadores en este campo.

o Generación de material bibliográfico de apoyo.

o Facilitar el intercambio de estudiantes de doctorado entre diferentes centros de investigación

mediante la concesión de becas.

o Definir ayudas para la asistencia a cursos organizados por algunos de los centros de

investigación, o la asistencia a congresos internacionales de reconocido prestigio donde los

estudiantes pueden publicar sus trabajos de investigación.

o Organizar premios para los mejores trabajos de investigación y tesis doctorales realizados en

Tecnologías del Habla.

Atraer inversiones para investigación de las empresas hacia las Tecnologías del Habla, mediante la

búsqueda de nuevas aplicaciones que ofrezcan nuevas posibilidades de negocio, a través de las

siguientes actividades:

o Financiación para la realización de prototipos y demostraciones que permitan mostrar a las

empresas estas nuevas aplicaciones y el potencial de investigación en Tecnologías del Habla.

o Foros de debate en los que intervengan investigadores y directivos de las empresas interesadas.

Avanzar en la creación de lazos de colaboración e integración de los miembros de la Red para

mantener el liderazgo de España en la investigación del Castellano, y potenciar también los idiomas

co-oficiales como el Catalán, Euskera y Gallego, a través de las siguientes actividades:

o Organización de las Jornadas Nacionales en Tecnologías del Habla, siendo un punto de

encuentro en el que los investigadores comparten los resultados de la investigación,

potenciando el networking y las líneas de trabajo conjunto.

o Creación de consorcios multidisciplinares para la solicitud de proyectos tanto nacionales como

europeos, mediante la creación de sesiones concretas dentro de las Jornadas en Tecnologías

del Habla.

o Promover la movilidad de recursos humanos, y el desarrollo y la difusión de recursos materiales

de interés común entre los miembros de la red.

o Mejorar la coordinación entre las infraestructuras científico-tecnológicas y las necesidades del

mercado relacionado con las Tecnologías del Habla, evitando esfuerzos redundantes.

o Facilitar las relaciones con otras "redes temáticas“ y sociedades que existen en otros países.

Red Temática en Tecnologías del Habla

Page 19: Boletín de Vigilancia Economía Digital Tecnológica

Asociación científica sin ánimo de lucro, formada por socios numerarios e instituciones, creada en el

año 1984, con el objeto de promover y difundir todo tipo de actividades referentes a la enseñanza,

investigación y desarrollo en el ámbito del procesamiento del lenguaje natural, tanto a nivel nacional

como internacional.

Los objetivos de la Sociedad son:

Establecer canales de intercambio de información y materiales científicos.

Organización de seminarios, simposios y conferencias.

Promoción de publicaciones.

Colaboración con otras instituciones relacionadas con su campo de actuación.

Entre las actividades más destacadas figuran las siguientes:

Celebración de un Congreso anual que sirve de punto de encuentro para los distintos grupos

de investigación que trabajan en el área del procesamiento del lenguaje natural.

Edición de una revista con garantiza unos criterios estables de calidad y periodicidad.

Página web con información sobre el procesamiento del lenguaje natural.

Información de actualidad y espacio de discusión para los socios.

La revista "Procesamiento del Lenguaje Natural" es un foro de publicación de artículos científico-

técnicos en el ámbito, tanto para la comunidad científica nacional e internacional como para las

empresas del sector, que permite presentar nuevos trabajos, comunicar resultados, discutir

problemas y obstáculos encontrados durante su trayectoria investigadora. Cuenta con el sello de

calidad de la Fundación Española para Ciencia y Tecnología (FECyT), el cual la certifica como revista

de excelencia, y por lo tanto, incluida en el Repositorio de Revistas Científicas españolas.

Las áreas temáticas tratadas son las siguientes:

19

Sociedad Española para el

Procesamiento del Lenguaje Natural

Modelos lingüísticos,

matemáticos y psicolingüísticos

del lenguaje.

Lingüística de corpus.

Desarrollo de recursos y

herramientas lingüísticas.

Gramáticas y formalismos para el

análisis morfológico y sintáctico.

Semántica, pragmática y

discurso.

Lexicografía y terminología

computacional

Resolución de la ambigüedad

léxica.

Aprendizaje automático en

procesamiento de lenguaje

natural.

Generación textual monolingüe y

multilingüe.

Traducción automática.

Reconocimiento y síntesis del

habla.

Extracción y recuperación de

información monolingüe,

multilingüe y multimodal.

Sistemas de búsqueda de

respuestas.

Análisis automático del contenido

textual.

Resumen automático.

Procesamiento de lenguaje

natural para la generación de

recursos educativos.

Procesamiento de lenguaje

natural para lenguas con

recursos limitados.

Aplicaciones industriales del

procesamiento de lenguaje

natural.

Sistemas de diálogo.

Análisis de sentimientos y

opiniones.

Minería de texto.

Evaluación de sistemas de

procesamiento de lenguaje

natural.

Implicación textual y paráfrasis.

Page 20: Boletín de Vigilancia Economía Digital Tecnológica

Además de entidades aglutinadoras de conocimiento, tales como la Red Temática en Tecnologías del Habla

y la Sociedad Española para el Procesamiento del Lenguaje Natural, cabe destacar los principales grupos de

investigación en este campo a nivel nacional.

La investigación en traducción automática es muy activa, tanto por el número de grupos que se dedican a

este tema como por la actividad en cuanto a congresos, talleres y asociaciones específicas sobre el mismo.

La Unión Europea mantiene un sistema de financiación de nuevos proyectos relacionados con las

tecnologías del lenguaje, y en particular con la traducción automática, que ha permitido que universidades y

empresas compartan sus conocimientos y combinen sus intereses académicos y comerciales, para

desarrollar y comercializar nuevos productos de traducción automática.

A continuación se presentan gráficamente los principales grupos de investigación a nivel nacional en el

ámbito del procesamiento del lenguaje natural:

20

Fuente: Elaboración propia basada en el Libro Blanco de las Tecnologías del Habla

Grupo ECA-SIMM. Universidad de Valladolid

Aprendizaje Computacional, Reconocimiento Automático y Traducción

Automática. Universidad Jaume I

CLiC, Centre de llenguatge i Computació. Universidad de Barcelona

Centre de Tecnologies i Aplicacions del Llenguatge i la Parla (TALP)

Universitat Politècnica de Catalunya

Grupo de Investigación en Procesamiento Digital de la Señal

(GPDS). Enginyeria i Arquitectura La Salle. Universitat Ramon Llull

Grupo SPPB. Universidad de Barcelona

Grupo de Tratamiento de Señal. Escola Universitària Politècnica de

Mataró

Dpto. de Física Aplicada Universidad de

Santiago

Grupo de Aplicaciones del Procesado de Señales:

Área Procesamiento del Lenguaje Natural.

Universidad Politécnica de Madrid.

Grupo de Procesado de Voz y Señales

Biomédicas- Universidad Politécnica de Madrid.

Grupo de Procesamiento de Lenguaje Natural de

la UNED.

Grupo SINTONIA: Área Habla-Voz. Universidad

Carlos III de Madrid.

Grupo de Tecnología del Habla, Dpto. Ingeniería

Electrónica, Universidad Politécnica de Madrid

Telefónica I+D, División de Tecnología del Habla.

Tecnologías del Habla y Procesado Multimedia.

Universidad Carlos III de Madrid.

Unidad de Psicolingüística Aplicada. Universidad

Complutense de Madrid.

Grupo de Estructuras de Datos y

Lingüística Computacional. Universidad

de Las Palmas de Gran Canaria.

Grupo de Investigación: Señales, Telemática y Comunicaciones

Grupo ITALICA. Universidad de Sevilla.

Grupo Julietta. Universidad de Sevilla.

IBM Voice Technology Development -Spain Group

Grupo IXA. Universidad del País Vasco

Grupo de Modelización y Simulación en

Psicología. Universidad de Málaga

Grupo de Neurociencia Cognitiva de

Lenguaje. Universidad de La Laguna

Grupo de Percepción del Habla.

Grupo PRHLT (Pattern Recognition and Human Language Technology Group. Grupo

de Reconocimiento de Formas y Tecnología del Lenguaje de la Universitat Politècnica

de València).

Grupo de Procesamiento del Lenguaje Natural. Universidad Politécnica de Valencia.

(subgrupo del grupo de investigación de Programación Lógica e Ingeniería del

Software).

Grupo Reconocimiento de Formas e Inteligencia Artificial. Subárea Diálogo.

Universidad Politécnica de Valencia.

Grupo de Procesamiento del Lenguaje y Sistemas de Información. Universidad de Alicante.

Grupo de Tecnologías de las Comunicaciones. Universidad

de Zaragoza

Grupo de Teoría de la Señal. Universidad

de Vigo

Seminario de Lingüística Informática.

Universidad de Vigo

PR & Speech Technologies. Universidad del País Vasco

Grupo de Tratamiento del Habla AhoLab. Universidad del

País Vasco/ Euskal Herriko Unibertsitatea

Grupo SINAI. Universidad de Jaén

Grupos de Investigación

Page 21: Boletín de Vigilancia Economía Digital Tecnológica

21

Verbio

Spin-off de la Universidad Politécnica de Cataluña, que apuesta por la automatización de los sistemas de

atención al cliente y por dotar de inteligencia y personalidad a cada uno de los contactos con sus usuarios.

La capacidad de sus soluciones de entender a los usuarios en lenguaje natural y comunicarse con ellos de

forma empática, permiten ofrecer servicios de valor añadido y gran sofisticación, mediante el uso de portales

o asistentes virtuales.

En base a su propia tecnología han desarrollado varias soluciones que se complementan entre ellas para

ajustarse a las necesidades de sus clientes:

Portal de Voz

Speech & Text Analytics

Biometría

Transcripción y Subtitulación

Text to Speech

Speech Recognition

Indisys

Empresa, recientemente adquirida por Intel, dedicada a desarrollar agentes inteligentes que permiten

mantener conversaciones flexibles en múltiples modalidades, idiomas, canales, dispositivos y plataformas.

Tiene por objetivo potenciar la experiencia de los usuarios, a la vez que se reducen costes a nivel

empresarial, con servicios de atención basados en la Inteligencia Artificial y las tecnologías de reconocimiento

de voz y lenguaje natural.

Su software utiliza procesamiento del lenguaje natural y gestión del diálogo, para poder traducir las palabras

del usuario a un lenguaje que la máquina pueda comprender y así decidir cuál es la mejor respuesta.

Otro de sus puntos fuertes es la gestión del diálogo, permitiendo que sus asistentes puedan mantener el hilo

de la conversación, al tener en cuenta el contexto de la misma.

Empresas

A nivel privado, las principales empresas relacionadas con el ámbito del procesamiento del lenguaje

natural son las que se presentan a continuación:

Page 22: Boletín de Vigilancia Economía Digital Tecnológica

22

Nuance

Empresa especializada en el desarrollo de software de voz para reconocer y emular la voz humana.

Diseñan y proporcionan tecnologías que unen de forma intuitiva al ser humano con la máquina y con el

almacén global de conocimientos, ayudando a las empresas y consumidores a trabajar de forma inteligente.

Su producto estrella es Dragon, el software de reconocimiento de voz más vendido del mundo, que permite

dictar documentos, realizar búsquedas en Internet o enviar correo electrónico, de forma rápida y precisa, con

sólo utilizar la voz.

Agnitio

Líder del mercado mundial en productos de identificación de voz. Es utilizado por las organizaciones

gubernamentales para prevenir el delito, identificar a los criminales y aportar pruebas en los tribunales.

El motor de reconocimiento de Agnitio es capaz de filtrar las características de la voz, así como las huellas

del tracto vocal en ondas de sonido.

Sus clientes utilizan los motores de identificación de voz para autenticar los clientes, identificar a los

defraudadores y proporcionar de una manera simple la identidad en múltiples aplicaciones.

Agnitio fue fundada en 2004 como una spin-off de un grupo de investigación universitario. Su equipo está

formado por expertos en tecnologías de reconocimiento que colaboran con universidades, institutos de

investigación y socios de negocios en todo el mundo. Su sede se encuentra en Madrid, con filiales en EE.UU y

Canadá.

Page 23: Boletín de Vigilancia Economía Digital Tecnológica

23

Daedalus

Empresa española especializada en extraer automáticamente el significado de todo tipo de contenidos

multimedia. Aplica tecnologías semánticas, de procesamiento del lenguaje, reconocimiento de voz, y análisis

de datos y texto que ayudan a sus clientes a:

Analizar y evaluar el impacto de lo que se dice en todo tipo de medios sociales y tradicionales (redes,

blogs, prensa, radio, TV).

Extraer elementos de significado y contexto de todo tipo de contenidos y conversaciones sociales, para

permitir una publicidad más enfocada y eficaz.

Enriquecer y personalizar toda clase de contenidos multimedia y multiidioma para combinarlos,,

distribuirlos y monetizarlos.

Extraer información de documentos financieros y contenido generado por los usuarios, para mejorar la

toma de decisiones de gestión de riesgos e inversión.

Integrar y recuperar información de repositorios heterogéneos.

Voice Base

Empresa que ha desarrollado una aplicación capaz de pasar un audio a texto, con la posibilidad de editarlo

fácilmente desde la web.

Se trata de una aplicación gratuita y online, por lo que no es necesaria su descarga. Únicamente es

necesario subir cualquier audio a dicha aplicación online, y ésta lo transcribirá inmediatamente a texto.

Ofrece un editor de texto para corregir cualquier error en su transcripción.

Page 24: Boletín de Vigilancia Economía Digital Tecnológica

5. Patentes

Page 25: Boletín de Vigilancia Economía Digital Tecnológica

25

Patentes a nivel nacional

La siguiente tabla muestra información de las patentes registradas en España relacionadas con el ámbito

del Procesamiento del Lenguaje Natural, en concreto se detalla el nombre de la patente, número de

publicación, solicitante, y una breve descripción de la misma:

Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Método para la utilización de lenguaje natural como interfaz para los

terminales móvilesES2261053 A1

Retevisión Movil,

S.A.

Descripción

Método para la utilización de lenguaje natural como interfaz para los terminales móviles, con el objetivo de interactuar

con aplicaciones instaladas en él, así como aplicaciones remotas, facilitando el uso de servicios de telefonía móvil

mediante la voz.

La aplicación del método requiere la instalación en el terminal de una aplicación software que utiliza el propio hardware

del terminal para capturar, preprocesar y codificar el audio a enviar al servidor.

Este método está destinado a facilitar el acceso a las aplicaciones, tanto locales como remotas, a cualquier tipo de

usuario

Nombre de la patente Nº de publicación Solicitante

Sistema de consulta de lenguaje natural para acceder a un sistema de

informaciónES2236483 T3 Voice-insight

Descripción

Sistema de interacción para permitir a un usuario de un sistema de información interactuar con el mismo, a través de un

sistema de reconocimiento que permite la interacción por medio de frases generadas por dicho usuario, y procesadas por

el sistema de reconocimiento.

El sistema de interacción comprende al menos un módulo de dominio, donde se definen unas estructuras de frases que

están construidas sobre la base de las clases de objetos, clases de atributos y clases de acciones que son comunes al

dominio de aplicación considerado, con el fin de definir una gramática de frases que están previstas para ser generadas

por el usuario para interactuar con el sistema de información.

Nombre de la patente Nº de publicación Solicitante

Interfaz de usuario interactivo de red que utiliza reconocimiento de voz y

tratamiento de lenguaje naturalES2235508 T3

One Voice

Technologies Inc.

Descripción

Un método para interactuar con un objeto de red, que funciona de la siguiente manera: Se recibe una interacción relativa

a un objeto de red desde un usuario; se determina si una tabla de objetos de red está asociada con dicho objeto de red;

se obtiene la tabla de objetos de red asociada si es que existe, se especifican una o más acciones asociadas con dicho

objeto de red; se actualiza un primer archivo de gramática con gramática relativa a dicho objeto de red; se busca el

primer archivo de gramática para otra interacción relativa a un objeto de red recibido desde un usuario; se busca un

segundo archivo de gramática si la correspondencia de frase no es encontrada en el primer archivo gramatical; se busca

una base de datos del lenguaje natural para representar dichas frases y se advierte al usuario de una clarificación en el

objeto de red si no se ha encontrado una correspondencia de entrada en la base de datos de lenguaje natural.

Page 26: Boletín de Vigilancia Economía Digital Tecnológica

26

Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Interfaz de usuario interactiva que emplea reconocimiento de voz y

tratamiento de lenguaje naturalES2235520 T3

One Voice

Technologies Inc.

Descripción

Un método para interactuar con un ordenador utilizando pronunciaciones, comprendiendo el método los pasos de:

Buscar en un primer fichero de gramática una frase de coincidencia para dicha pronunciación

Buscar en un segundo fichero de gramática una frase de coincidencia si dicha frase de coincidencia no ha sido

encontrada en dicho primer fichero de gramática

Buscar en una base de datos de procesamiento de lenguaje natural, una entrada de coincidencia para dicha frase

de coincidencia, representando las entradas frases que son conocidas por la base de datos NLP

Realizar una acción asociada con dicha entrada de coincidencia si dicha entrada de coincidencia es encontrada en

dicha base de datos

Nombre de la patente Nº de publicación Solicitante

Traducción de formas de palabras relacionadas para la indexación y

recuperación de texto en estado finitoES2168267 T3 Xerox Corporation

Descripción

Resuelve una serie de problemas a la hora de utilizar radicales (indicadores canónicos de significados de palabras) en la

recuperación de textos completos de documentos en lenguaje natural y por tanto permite mejorar la rellamada sin que

por ello sufra la precisión. Utiliza distintos modelos de traductores finitos (fsts) para codificar de manera precisa una serie

de modos deseados para mapear hacia adelante y hacia atrás entre palabras y radicales, teniendo en cuenta tanto los

aspectos sistemáticos del sistema de reglas morfológicas de una lengua como las irregularidades de palabra por palabra

que ocurren. La invención contempla al sistema de recuperación de información como una base de datos y un procesador

para responder a las consultas del usuario, para consultar la base de datos y para obtener respuestas correctas, si existen,

así como métodos para la formación de la nueva base de datos.

Nombre de la patente Nº de publicación Solicitante

Aparato y Métodos de Servicios de Telecomunicaciones ES2317317 T3 Intellprop Limited

Descripción

Aparato de servicios de telecomunicaciones para ser usado con una red de telecomunicaciones móviles, comprendiendo el

aparato unos medios para recibir un primer mensaje de texto desde un teléfono móvil, unos medios para procesar el

primer mensaje de texto recibido con el fin de determinar una dirección de red a partir del primer mensaje de texto

procesado, y unos medios para enviar la dirección de red determinada como segundo mensaje de texto hacia dicho

teléfono móvil o hacia otro teléfono móvil, caracterizado porque los medios de procesado del primer mensaje de texto

recibido comprenden un motor capaz de interpretar lenguaje natural que se puede hacer funcionar, en el caso de que no

se pueda determinar una dirección de red adecuada, para entrar en un diálogo con un usuario de dicho teléfono móvil.

Page 27: Boletín de Vigilancia Economía Digital Tecnológica

27

Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Dispositivo de tratamiento de datos con definición formal ES2389363 T3 Progilys

Descripción

Dispositivo de tratamiento de datos, que comprende:

una unidad de tratamiento capaz de interaccionar con una base de datos, comprendiendo la base de datos unas

tablas de datos

una interfaz gráfica de usuario establecida para permitir a un usuario introducir una expresión matemática

un editor de expresión matemática capaz de establecer una representación informática de trabajo de una

expresión matemática en interacción con la interfaz gráfica de usuario,

un diccionario de símbolos el cual, comprende información sobre la estructura de tablas de la base de datos

un editor de condiciones dispuesto para producir una expresión de condición, siendo la expresión de condición

utilizable en combinación con los metadatos para seleccionar un subconjunto de datos de la base de datos

un generador de consultas dispuesto para tratar la representación informática de trabajo para producir una

secuencia de código que ejecuta la expresión matemática de acuerdo con las reglas del lenguaje natural

Nombre de la patente Nº de publicación Solicitante

Método de Generación de Patrones Semánticos No DisponibleUniversidad Carlos Iii

De Madrid

Descripción

La presente invención está relacionada con los métodos de reconocimiento de lenguaje natural. Se encuadra con aquellos

métodos para la generación de patrones semánticos que posibilitan la organización de la información. Incluye las etapas

de: determinar la categoría gramatical de cada término de un texto, agrupar en grupos las categorías gramaticales,

contabilizar la frecuencia de aparición de cada grupo, establecer un candidato a patrón si la frecuencia de aparición de

un grupo es suficientemente alta, determinar la categoría semántica del candidato a patrón con una taxonomía

predefinida, identificar un patrón cuando el candidato a patrón tenga una categoría semántica asociada.

Nombre de la patente Nº de publicación Solicitante

Procesador de Textos ES2285736 T3 Walker, Randall C.

Descripción

Método para mejorar la presentación de texto a partir de un texto de lenguaje natural legible por máquina basándose en

parámetros específicos del lector, incluyendo como mínimo las dimensiones del campo de visión, que comprende: analizar

sintácticamente de dicho texto signos de puntuación y categorías gramaticales para extraer atributos específicos del

texto; almacenar dichos atributos específicos del texto en relación con las categorías gramaticales para producir un texto

enriquecido; aplicar reglas de terminación primarias seguidas por reglas de terminación secundarias a dicho texto

enriquecido; aplicar reglas de terminación secundaria hasta que se alcanza un determinado límite; aplicar reglas de

desplazamiento horizontal de segmentos de texto a dichos segmentos de texto para determinar un desplazamiento

horizontal para cada segmento de texto; y visualizar dicho texto mejorado mediante una presentación en cascada de

segmentos de texto en líneas descendentes y a lo ancho del dispositivo de visualización.

Page 28: Boletín de Vigilancia Economía Digital Tecnológica

28

Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Dispositivo de Control Remoto Basado en la Palabra ES2251942 T3 Matsushita Electric

Industrial Co., Ltd.

Descripción

Sistema de mando a distancia que comprende: una caja manual dotada de una interfaz de comunicación por medio de la

cual las instrucciones de mando son transmitidas a un componente remoto; una pantalla de visualización dispuesta en

dicha caja; un micrófono que sirve para recibir mensajes orales de entrada; un sistema analizador de voz acoplado a dicho

micrófono para procesar dichos mensajes orales de entrada ; un fichero de datos históricos de diálogos utilizado para

registrar las conversaciones que han tenido lugar en el conjunto del sistema; una memoria que contiene los datos de

perfiles de usuarios; un administrador de diálogos conectado a dicho sistema analizador de voz , a dicha memoria de datos

de perfiles de usuarios, y a dicha pantalla de visualización para transmitir instrucciones de mando y para presentar la

información en la pantalla de visualización; y un analizador sintáctico de lenguaje natural en comunicación de datos con

dicho sistema analizador de voz

Nombre de la patente Nº de publicación Solicitante

Provisión de servicios en una red de comunicaciones ES2403014 T3 Teliasonera Finland

Oyj

Descripción

Un procedimiento para proporcionar una amplia diversidad de servicios diferentes y combinaciones arbitrarias de servicios

en una red de comunicaciones con al menos un servidor de aplicación que almacena las aplicaciones del servicio,

asignándose a cada una de las aplicaciones de servicio una operación por la cual se arranca la aplicación del servicio, y

terminales de usuario para suministrar peticiones 5 de servicio en lenguaje natural, incluyendo el procedimiento las

etapas de:

dar una petición de servicio del usuario en lenguaje natural

interpretar la petición del servicio del usuario y generar una descripción del servicio de formato genérico,

incluyendo la descripción del servicio, los nombres de las funcionalidades que se necesitan para cumplir la petición

de servicio del usuario y los parámetros que requieran dichas funcionalidades.

recibir la descripción del servicio de formato genérico,

dividir la descripción del servicio de formato genérico en uno o más elementos, incluyendo un elemento un nombre

de dicha funcionalidad como un tipo y los valores de los parámetros asociados,

analizar los elementos y examinar el tipo de los elementos y mapear dicho tipo a una entidad, indicando las

entidades las llamadas de servicio a realizar y los parámetros relativos a las llamadas de servicio para implementar

las funcionalidades especificadas en la descripción de servicio de formato genérico

usar dichas entidades para utilizar dichas aplicaciones de servicio

Page 29: Boletín de Vigilancia Economía Digital Tecnológica

29

Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Método para Normalizar Caja ES2316474 T3 Hapax Limited

Descripción

Un método para diferenciar automáticamente distinciones significativas de distinciones no significativas de caja alta y

caja baja en una serie de tipos de palabras de entrada de un texto en lenguaje natural por medio de un ordenador,

caracterizado por los pasos de: asignar un tipo de palabra de entrada a uno de una serie de grupos locales separados (LG1,

LG2, LG3, LG4) en base a la caja y a la posición de las letras que constituyan el tipo de palabra de entrada; asignar dicho

tipo de palabra de entrada a uno de una serie de grupos globales separados (GG1, GG2, GG3, GG4) en base a qué

variantes de caja de grupos locales de los tipos de palabras de entrada estén asignados; y normalizar las cajas para dicho

tipo de palabra de entrada de acuerdo con reglas predeterminadas asociadas con el grupo global al que esté asignado

dicho tipo de palabra de entrada.

Nombre de la patente Nº de publicación Solicitante

Método y Aparato para procesar Consultas Continuas No disponibleUribe-Etxebarria

Jimenez, Xabier

Descripción

Un método para procesar consultas continuas en lenguaje natural recibidas desde un equipo de cliente conectado a un

segundo servidor de aplicación de consultas continuas a través de un primer servidor de aplicación y de una red de

telecomunicaciones; que comprende las etapas de recepción en una unidad de procesamiento de lenguaje natural de

primeros datos de texto ordenados de acuerdo a normas lingüísticas del lenguaje natural de una consulta realizada, para

suministrar segundos datos de texto en un lenguaje intermedio basados en los primeros datos de texto de lenguaje

natural; generación en una unidad de diálogo de terceros datos de texto en lenguaje natural ordenados de acuerdo a

normas lingüísticas del lenguaje natural de un mensaje de respuesta, en función de los segundos datos de texto del

lenguaje intermedio recibidos desde unidad de procesamiento, y emisión del mensaje de respuesta al equipo de cliente a

través de un primer servidor de aplicación y de una red de telecomunicaciones.

Nombre de la patente Nº de publicación Solicitante

Pasaporte Intemporal de Identificación ES2475092 T3 Giannetti, Françoise

Née Rouzaud

Descripción

Procedimiento de realización de un artículo funerario para la identificación y la perpetuación del recuerdo de un difunto,

caracterizado porque comprende esencialmente las etapas que consisten en tomar un elemento en material inalterable

elegido entre las cerámicas cocidas, el vidrio, la piedra, el acero inoxidable, de unas placas primera y segunda en

material inalterable elegido entre las cerámicas cocidas, el vidrio, la piedra, el acero inoxidable, y:

marcar el citado elemento en material inalterable con un código único

atribuir el citado código único a un difunto y recoger los datos de identificación del citado difunto

disponer el citado elemento previamente marcado con el citado código único con los restos o las cenizas

marcar las citadas placas primera y segunda con el citado código único y marcar la segunda placa con los citados

datos de identificación en lenguaje natural

ensamblar las citadas placas así marcadas con la ayuda de un medio de fijación, para formar un dispositivo de

identificación y de memoria

Page 30: Boletín de Vigilancia Economía Digital Tecnológica

30

Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Sistema de Navegación Móvil ES2346631 T3 Infogation

Corporation

Descripción

Un método para suministrar un recorrido óptimo utilizando información en tiempo real para un sistema de navegación que

comprende un cliente y un servidor, dicho servidor está acoplado a una red de ordenador, dicho método comprende los

pasos de:

Establecer una conexión inalámbrica entre el cliente y el servidor

Transmitir designaciones de inicio y fin de recorrido desde el cliente al servidor

Acceder a información en tiempo real por parte del servidor, la información en tiempo real representa condiciones

actuales relevantes del recorrido propuesto

Calcular el recorrido óptimo por el servidor, basado en información en tiempo real y dichas designaciones de inicio

y fin del recorrido

Dar formato al recorrido óptimo en una descripción genérica en lenguaje natural que va a ser utilizada con una

base de datos local de mapas del cliente con el cliente

Descargar dicha descripción genérica en lenguaje natural al cliente

Reconstruir el recorrido óptimo por el cliente, a partir de la descripción genérica en lenguaje natural

Usar la base de datos local de mapas del cliente

Exhibir dicho recorrido óptimo en un sistema de representación visual acoplado al cliente

Nombre de la patente Nº de publicación Solicitante

Sistema y Método para Extracción y Codificación de Lenguaje Medico ES2218670 T3

The Trustees Of

Columbia University

In The City Of New

York

Descripción

En un tratamiento informatizado de datos médicos/clínicos en lenguaje natural que comprende un análisis y una

regularización de la frase, se refiere a parámetros cuyo valor puede precisarse por el usuario. Así, un sistema

informatizado puede volverse polivalente, especialmente para el tratamiento de datos de salida en varios campos. este

sistema tiene, además de un mecanismo de análisis y de regularización, un preprocesador, filtros de salida y un

mecanismo de codificación

Page 31: Boletín de Vigilancia Economía Digital Tecnológica

31

Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Sistema de Introducción de Información y Visualización ES2133355 T3 Koninklijke Philips

Electronics N.V.

Descripción

Para operar aparatos de usuarios, el usuario con frecuencia tiene que dar entrada a instrucciones operativas complicadas

(por ejemplo la programación de una grabadora de video). Con objeto de dar entrada a un gran número de datos sin una

instrucción, en una forma sencilla para el usuario, el aparato comprende medios para formar sentencias en fases y para

representarlas en un lenguaje natural. En cada fase, los datos a los que ya se ha dado entrada se reproducen, y los

próximos datos a dar entrada se identifican. De esta forma la comunicación con el usuario tiene lugar en un lenguaje

natural, sin que el usuario tenga necesidad de dar entrada a este lenguaje.

Nombre de la patente Nº de publicación Solicitante

Método Mejorado de Agrupamiento Espectral por Ordenador y Usos del

mismoNo Disponible

Universitat

Politècnica De

Catalunya

Descripción

Método mejorado de agrupamiento espectral por ordenador y usos del mismo. El método usa un algoritmo de

agrupamiento para dividir datos en una pluralidad de grupos de muestra de modo que las muestras en cada grupo o

agrupamiento tienen similitud máxima entre las mismas y similitud mínima con las muestras en otros agrupamientos,

usando el método implementado de agrupamiento espectral por ordenador al menos dos criterios de similitud o vistas de

datos diferentes para definir al menos dos matrices de similitud y aplicar el algoritmo de agrupamiento a los datos para

cada uno de dichos al menos dos criterios de similitud diferentes y además integrar simultáneamente información relativa

a dicha pluralidad de matrices de similitud a partir de varias vistas de datos en los grupos de muestra resultantes. Los usos

del método mejorado de agrupamiento espectral por ordenador para análisis de procesamiento de señal biomédica, para

análisis de agrupamiento génico, para análisis de visión por máquina, para procesamiento de lenguaje natural y para

análisis de cesta de compra.

Nombre de la patente Nº de publicación Solicitante

Sistema de Anotación Automática de Datos de Adiestramiento para un

Sistema de Comprensión del Lenguaje NaturalES2368213 T3

Microsoft

Corporation

Descripción

Procedimiento para la generación de datos de adiestramiento anotados para adiestrar un sistema de comprensión del

lenguaje natural, NLU, que incorpora uno o más modelos, comprendiendo el procedimiento:

La generación de una anotación propuesta con el sistema NLU para cada unidad de datos de adiestramiento no

anotados

La presentación de las anotaciones propuestas para la verificación o la corrección de usuario para obtener una

anotación confirmada por un usuario

El adiestramiento del sistema NLU con la anotación confirmada por un usuario

Page 32: Boletín de Vigilancia Economía Digital Tecnológica

32

Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Método y Aparato Analizador del Lenguaje Natural ES2228408 T3Matsushita Electric

Industrial Co., Ltd.

Descripción

Método de análisis sintáctico de lengua oral implementada en un ordenador para procesar una frase de entrada, que

comprende las fases de:

a) Facilitar una pluralidad de gramáticas indicativas de temas predeterminados

b) Generar una pluralidad de conjuntos de árboles de directorios de análisis sintáctico, relacionada con dicha frase

de entrada utilizando dichas gramáticas

c) Asociar etiquetas con palabras de dicha frase de entrada utilizando dichos conjuntos de árboles de directorios de

análisis sintáctico generados

d) Generar valoraciones de dichas etiquetas basadas en los atributos de dichos conjuntos de árboles de directorios de

análisis sintáctico

e) Seleccionar etiquetas para su uso como representación analizada sintácticamente de dicha frase de entrada,

basándose en dicha valoración generada

Fuente: Elaboración propia basada en la información extraída de la Oficina Española de Patentes y Marcas

Page 33: Boletín de Vigilancia Economía Digital Tecnológica

33

Patentes a nivel internacional

Según la Global Patent Search Network, existen actualmente 9.355 patentes sobre

Procesamiento del Lenguaje Natural registradas en todo el mundo. La primera de ellas

data del año 1986. El siguiente gráfico muestra el número de patentes que han sido

publicadas anualmente hasta el año 2012:

A continuación destacamos a los investigadores internacionales que más patentes han

publicado en este ámbito:

Fuente: Elaboración propia basada en la información extraída de Global Patent Search Network

0

200

400

600

800

1.000

1.200

1.400

19

86

19

87

19

88

19

89

19

90

19

91

19

92

19

93

19

94

19

95

19

96

19

97

19

98

19

99

20

00

20

01

20

02

20

03

20

04

20

05

20

06

20

07

20

08

20

09

20

10

20

11

20

12

Patentes registradas a nivel mundial

25%

19%

12%8%

7%

6%

6%

6%6%

5%

TOP 10 Investigadores

Paul Rapps Silver Brucker Gangtianzhizhi Ikeda Navigation

Li Secondary One Far in True Angle Wildly True Shiyutianyang

Leaf Jianfa Tensioning Yong

Fuente: Elaboración propia basada en la información extraída de Global Patent Search Network

Page 34: Boletín de Vigilancia Economía Digital Tecnológica

6. Iniciativas de Interés

Page 35: Boletín de Vigilancia Economía Digital Tecnológica

El Grupo de Aplicaciones del Procesado de

Señales de la Universidad Politécnica de

Madrid y el Grupo Quirón, trabajan en la

aplicación de técnicas de análisis de voz para la

detección de la apnea del sueño.

La investigación está impulsada por el

neumólogo José Alcázar Ramírez, y el

investigador Luis Hernández Gómez, del Grupo

de Aplicaciones del Procesado de Señales.

Para ello, se han recabado grabaciones de voz

para analizar la relación entre los

condicionantes clínicos del síndrome de

apneas-hipopneas del sueño (SAHS), y los

rasgos observados en el proceso de

caracterización del habla de estos pacientes.

La experiencia del grupo GAPS en el campo de

las tecnologías del habla ha permitido abordar

esta labor, adaptando algunas de las técnicas

de clasificación utilizadas en el reconocimiento

automático del habla y del locutor, al problema

específico de caracterización y clasificación de

locutores para la detección del SAHS.

Los resultados obtenidos resultan muy

alentadores. Actualmente, en los trabajos

participa el Hospital Quirón de Málaga, pero se

pretende extender a todos los Hospitales

Quirón de España, para demostrar la posible

influencia del acento local en la

sensibilidad/especificidad de la prueba.

Instituciones de distintos países se han

interesado por el trabajo desarrollado, tales

como el grupo de Ingeniería Biomédica de la

Universidad Ben-Gurion (Israel), equipos de la

Universidad de Aviñón (Francia), o el Instituto

Superior Politécnico José Antonio Echeverría

(Cuba).

35

Hospital Quirón y Universidad

Politécnica de Madrid

Siri es una aplicación con funciones de

asistente personal para iOS.

Esta aplicación utiliza procesamiento del

lenguaje natural para responder preguntas,

hacer recomendaciones y realizar acciones,

mediante la delegación de solicitudes hacia un

conjunto de servicios web que ha ido

aumentando con el tiempo.

Entre las cualidades destacadas, Siri es capaz

de adaptarse con el paso del tiempo a las

preferencias individuales de cada usuario,

personalizando las búsquedas web y la

realización de algunas tareas.

Siri ofrece interacción conversacional con otras

aplicaciones, tales como los recordatorios,

consulta con el estado del tiempo, la bolsa, el

servicio de mensajería, el correo electrónico,

calendario, contactos, notas, música, reloj,

navegador web, Wolfram Alpha y los mapas.

Es un producto surgido del Centro de

Inteligencia Artificial de SRI International,

nacido como una rama del proyecto CALO, un

proyecto financiado por DARPA, descrito como

"el mayor proyecto de inteligencia artificial

creado a la fecha". Las áreas técnicas en las

que hace foco primario el proyecto Siri son:

Interfaz Conversacional, Reconocimiento de

Contexto Personal, y Delegación de Servicios.

Apple - Siri

Page 36: Boletín de Vigilancia Economía Digital Tecnológica

El Centro Singular de Investigación en

Tecnologías de la Información (Citius), de la

Universidad de Santiago de Compostela, ha

creado un software libre que acelera el

procesamiento de textos y documentos

publicados en la web.

Su nombre es Perldoop, y permite el análisis de

los datos de una forma sencilla y eficiente. La

herramienta adapta aplicaciones del ámbito del

procesamiento de textos y documentos a

modelos de computación, lo que reduce los

tiempos de ejecución y permite trabajar con

grandes volúmenes de datos.

Su propuesta se ha basado en el diseño de un

sistema que permite transformar el software

usado para el procesamiento del lenguaje

natural en una solución compatible con las

tecnologías Big Data.

Con sólo introducir unas etiquetas en la

aplicación original, esta herramienta de

traducción permite al programador convertir

automáticamente todo su código en código

Java adaptado a MapReduce (modelo de

programación utilizado por Google para dar

soporte a la computación paralela sobre

grandes colecciones de datos), habilitándolo así

para su ejecución en un clúster, es decir,

permitiendo su ejecución simultánea en

múltiples cores o nodos de computación.

Otra característica es que los resultados se han

hecho públicos bajo una licencia de software

libre, con el objetivo de que esté a disposición

del mayor número posible de usuarios y

profesionales.

36

Perldoop

Watson es un sistema informático de

inteligencia artificial que es capaz de responder

a preguntas formuladas en lenguaje natural,

desarrollado por la corporación estadounidense

IBM. Forma parte del proyecto del equipo de

investigación DeepQA.

El sistema responde a las preguntas gracias a

una base de datos almacenada localmente. La

información contenida en esa base de datos

proviene de multitud de fuentes, incluyendo

enciclopedias, diccionarios, tesauros, artículos

de noticias y obras literarias, al igual que bases

de datos externos, taxonomías, y ontologías,

específicamente DBpedia, WordNet, y Yago.

La corporación lo describe como "una aplicación

de tecnologías avanzadas diseñadas para el

procesamiento de lenguajes naturales, la

recuperación de información, la representación

del conocimiento, el razonamiento automático,

y el aprendizaje automático al campo abierto de

búsquedas de respuestas.

El objetivo para Watson es permitir que las

computadoras comiencen a interactuar de

forma natural con humanos a través de una

amplia gama de aplicaciones y procesos,

comprendiendo las preguntas de los seres

humanos, y dando respuestas que los seres

humanos pueden comprender y justificar.

IBM y Nuance Communications Inc. se han

unido para explotar las capacidades de Watson

como sistema de apoyo para decisiones clínicas

para ayudar al diagnóstico y tratamiento médico

de pacientes.

IBM Watson

Page 37: Boletín de Vigilancia Economía Digital Tecnológica

7. Fuentes de información

Page 38: Boletín de Vigilancia Economía Digital Tecnológica

38

Fuentes de información

A continuación se presentan las principales fuentes de información utilizadas para el

desarrollo del presente documento:

• Aplicaciones de Procesamiento de Lenguaje Natural, Hernández M. Gómez J. Escuela Politécnica

nacional, Facultad de Ingeniería en Sistemas Quito, Ecuador, Universidad de Alicante, Departamento de

Lenguajes y Sistemas Informáticos, Alicante, España

• The Bhiopharmaceutical Challenge, Efficient Innvation, IBM Software. IBM Solutions

• IBM Watson Explorer, Explore, analyze and interpret information for better business outcomes, IBM

Software

• Aplicación de tecnologías de Procesamiento de lenguaje natural y tecnología semántica en Brand Rain

y Anpro 21, Oscar Trabazos, Silvia Suarez, Remei Bori y Oriol Flo

• Diseño e implementación de un sistemas para el análisis y categorización en Twitter mediante técnicas

de clasificación automática de textos, Universidad Carlos III de Madrid, Escuela Politécnica Superior de

Ingeniería Técnica de Telecomunicación: Telemática, Samuel Alcázar Jaén, Luis Sánchez Fernández,

María Luz Congosto Martínez

• Evaluación de las herramientas comerciales y métodos del estado del arte para la generación de

resúmenes extractivos individuales, Griselda Areli Matías Mendoza, Yulia Ledeneva, Rene Arnulfo

García- Hernández, Grigori Sidorov, Universidad Autónoma del Estado de México, Unidad Académica

Profesional Tianguistenco, Laboratorio de lenguaje natural y procesamiento de texto, Centro de

investigación en computación, Instituto Politécnico Nacional de México

• Generador de los grafos conceptuales a partir del texto en español, Centro de investigación en

computación, Instituto Politécnico Nacional de México, Macario Hernández Cruz

• Procesamiento del lenguaje Natural en recuperación de la información, Paula Andrea Benavides

Cañón, Sandra Rodríguez Correa, Universidad de la Salle, Colombia, Sistemas de Información y

Documentación

• Libro Blanco de las Tecnologías del Habla, Antonio Rubio Ayuso, Inmaculada Hernáez Rioja

• Procesamiento de Lenguaje Natural Robusto, Andrés T. Hohendahl, Laboratorio de Estereología y

Mecánica Inteligente, Facultad de Ingeniería, UBA, IIBM (Instituto de Ingeniería Bio Médica), Facultad

de Ingeniería, UBA.

• Procesamiento del lenguaje natural, F. J. Martín Mateos, J. L. Ruiz Reina, Dpto. Ciencias de la

Computación e Inteligencia Artificial, Universidad de Sevilla

• TESIS DOCTORAL Adquisición y representación del conocimiento mediante procesamiento del lenguaje

natural, Milagros FERNÁNDEZ GAVILANES, Dr. Manuel VILARES FERRO, Dr. Éric VILLEMONTE DE LA

CLERGERIE, Universidad de Coruña

• Técnicas de Procesamiento del Lenguaje Natural en la Recuperación de Información, Pablo GAMALLO

OTERO y Marcos GARCÍA GONZÁLEZ, Centro de Investigación sobre Tecnoloxías da Lingua (CITIUS)

Universidade de Santiago de Compostela

• Optimización Global de Coherencia en la desambiguación de las palabras, Sulema Torres Ramos,

Instituto Politécnico Nacional, Centro de Investigación en Computación, Laboratorio de lenguaje natural

• Nuance

• Verbio

• Agnitio

• Indisys

• Daedalus

• Voicebase

Page 39: Boletín de Vigilancia Economía Digital Tecnológica

39

Como complemento al trabajo de análisis e investigación, se ha contado con la visión de

los siguientes expertos en la materia:

• Alfonso Hernández Gómez, Profesor Titular de Universidad integrado en el Departamento de señales,

sistemas y radiocomunicaciones de la Universidad Politécnica de Madrid, Grupo de Procesado de

señales (GAPS)

• L. Alfonso Ureña López, Presidente de la Sociedad Española para el Procesamiento del Lenguaje

Natural ( SEPLN) y Profesor de la Universidad de la Jaén

• José Manuel Pardo Muñoz, Jefe de Grupo de GTH Speech Techonology Group

• Juan Ignacio Godino Llorente, Catedrático de Universidad Politécnica de Madrid, Director Proyecto de

I+D+i: Plataforma existente Medivoz

• Paloma Martínez Fernández, Profesora Titular del Departamento de Informática de la Universidad

Carlos III de Madrid y responsable del Grupo de Bases de Datos Avanzadas

• Sinuhé Arroyo, CEO & Founder en Taiger

• José Alcázar, Jefe de servicio de Neumología en Hospital Quirón

• Rubén San Segundo, Profesor asociado en el Departamento de Ingeniería Electrónica (DIE) de la ETSIT,

UPM

• Javier Ortega-Garcia, fundador y co-director del Grupo de Reconocimiento Biométrico - ATVS de la

Universidad Autónoma de Madrid

• Joaquín Gonzalez-Rodriguez, fundador y co-director del Grupo de Reconocimiento Biométrico - ATVS de

la Universidad Autónoma de Madrid