introducción traducción asistida

22
NOMBRE DEL MÓDULO TRADUCCIÓN ASISTIDA POR COMPUTADORA, TRADUCCIÓN AUTOMÁTICA Y POSEDICIÓN TÍTULO DE LECTURA: Nociones teórico-prácticas en torno a la traducción asistida por computadora (TAC) y la traducción automática (TA): Introducción REFERENCIA: Fernández Acosta, L. R. (2016) Nociones teórico-prácticas en torno a la traducción asistida por computadora (TAC) y la traducción automática (TA): Introducción. [Documento Inédito] Universidad Intercontinental. México. D.F. Material utilizado con fines didácticos

Upload: lcedillo

Post on 31-Jul-2016

239 views

Category:

Documents


5 download

DESCRIPTION

Traducción Asistida por Computadora

TRANSCRIPT

Page 1: Introducción Traducción Asistida

NOMBRE DEL MÓDULO TRADUCCIÓN ASISTIDA POR COMPUTADORA, TRADUCCIÓN

AUTOMÁTICA Y POSEDICIÓN

TÍTULO DE LECTURA:

Nociones teórico-prácticas en torno a la traducción asistida por computadora (TAC) y la traducción automática (TA): Introducción

REFERENCIA: Fernández Acosta, L. R. (2016) Nociones teórico-prácticas en torno a la traducción asistida por computadora (TAC) y la traducción automática (TA): Introducción. [Documento Inédito] Universidad Intercontinental.

México. D.F.

Material utilizado con fines didácticos

Page 2: Introducción Traducción Asistida

2

Contenido 1.1 Iniciación a la traducción asistida por computadora (TAC) y la traducción automática (TA) ... 3

1.1.1 ¿Qué son las herramientas TAC y cuál es su utilidad? ........................................................... 4

1.1.2 Tipos de licencias TAC ............................................................................................................ 7

1.1.3 Las herramientas TAC más utilizadas a nivel mundial. .......................................................... 8

1.1.4 Motivos para ser más eficientes en la industria de la traducción........................................ 12

1.1.5 Características generales de las herramientas TAC más utilizadas en la industria de la

traducción ..................................................................................................................................... 12

1.1.6 Principales motores de TA en el mercado ........................................................................... 15

Page 3: Introducción Traducción Asistida

3

1.1 Iniciación a la traducción asistida por computadora (TAC) y la

traducción automática (TA)

El nombre proviene de la traducción del inglés de CAT Tools (Computer-Assisted

Translation). En español, se les conoce como herramientas TAC o TAO. Esta

última abreviatura no tiene nada que ver con la filosofía china.

Prácticamente es la traducción que se hace con ayuda de programas informáticos

específicos que no hay que confundir con los motores de traducción automática

como Google Translate que es una aplicación donde interviene exclusivamente

una computadora conectada a un servidor sin ayuda del traductor. Veremos más

adelante (1.1.6.) sus características, funcionamiento y tipos de sistemas.

Las herramientas TAC son bases de datos que soportan el almacenamiento, la

navegación, la extracción y creación de recursos lingüísticos mediante la creación

de memorias de traducción (MT) y bases de datos terminológicas (BT). Son

consideradas tal vez las más utilizadas y especializadas por los traductores para

facilitar, agilizar el trabajo y ser más competitivos. El enfoque de la TAC se centra

más en el texto de destino y su comprensión que en el texto de origen.

La TAC y la TA (traducción automática) son dos conceptos que suelen confundirse

a menudo aunque son dos sistemas completamente diferentes que se

complementan e integran hoy en día en la mayoría de software comercial.

Page 4: Introducción Traducción Asistida

4

1.1.1 ¿Qué son las herramientas TAC y cuál es su utilidad?

La TAC se caracteriza principalmente por el uso de memorias de traducción (MT).

La MT es la base de este tipo de herramientas ya que es donde se almacenan

todos los segmentos traducidos en un formato bilingüe.

1) El texto se divide en dos principales columnas y muestra en forma de

segmentos (origen y destino) como se muestra en la imagen de abajo. Al unirse

ambos segmentos y confirmarse su traducción se crea una unidad de traducción

(UT).

Ejemplo del editor de la herramienta TAC de SDL Trados Studio 2014

2) Todos los segmentos traducidos se van almacenado en una base de datos

llamada «memoria de traducción» que podemos recuperar (reciclar) y reutilizar en

futuras traducciones con la misma temática. Es como si la información se

guardara en diferentes cajones y la sacamos cada vez que la necesitamos. Los

segmentos se parecen a una oración, pero no lo es ya que puede ser una palabra,

un número, una marca, una dirección electrónica, una sigla, una frase, etc.

Ejemplo de una memoria de traducción: http://www.textualia.com/memoria-de-traduccion/

Texto de origen Texto de destino

Page 5: Introducción Traducción Asistida

5

La mayoría de herramientas TAC funcionan con un estándar universal de

memorias de traducción: TMX (Translation Memory eXchange) que es un formato

abierto basado en XML el cual facilita la interoperabilidad de las memorias de

traducción entre diferentes herramientas TAC para que no se pierdan datos

importantes marcados por etiquetas de la traducción.

Actualmente, existe también otro estándar universal que está desplazando al TMX.

Se trata del XLIFF (XML Localization Interchange File Format), formato abierto

basado también en el XML que acepta cadenas de texto extraídas de un original

que se quieran traducir.

Ejemplo del flujo de trabajo de un proyecto de traducción en formato XLIFF:

https://www.google.com.mx/search?q=XML+y+XLIFF+imagen&rlz=1C1TSNG_enMX654MX654&es

pv=2&biw=1366&bih=667&tbm=isch&tbo=u&source=univ&sa=X&ved=0ahUKEwiUzb_-

_dzMAhXC44MKHT_FCN4QsAQIGQ&dpr=1#imgrc=ap1-_2lUh0j7fM%3A

El éxito en el uso de este tipo de herramientas depende en buena parte del tipo de

textos que cada traductor traduce. Son útiles para aquellas tipologías textuales

especializadas que provocan que el traductor esté traduciendo constantemente

textos muy parecidos o con muchas repeticiones: textos jurídicos, científicos,

técnicos, económicos, informáticos, médicos, farmacéuticos, entre otros.

Page 6: Introducción Traducción Asistida

6

Permiten mantener una coherencia terminológica a lo largo de cada texto

traducido, así como ahorrar mucho tiempo al memorizar términos y construcciones

que probablemente se repetirán en futuros textos del mismo tipo.

Además, nos libran de tareas extras tales como el formateo, la extracción de

contenido o la comprobación de la coherencia terminológica. Estos son cuatro de

las herramientas TAC comerciales más conocidas en el mercado de las cuales

usaremos las tres primeras más adelante.

En efecto, hay gran número de sectores que necesitan ser traducidos debido a la

escasez de traductores profesionales a nivel mundial. Para 2015, se registraron

863 105 652 sitios web en inglés en Internet, según cifras del sitio «internet live

stats»: http://www.internetlivestats.com/total-number-of-websites/.

Ahora veamos los sectores que más demanda han tenido según este cuadro

dividido en traducción realizada por humanos, con posedición o traducción

automática:

Page 7: Introducción Traducción Asistida

7

Fuente: http://www.slideshare.net/SDL-Language-Technologies/sdl-machine-translation-for-post-

editing

1.1.2 Tipos de licencias TAC

Existen dos tipos de licencias:

a) Licencias libres o gratuitas: OmegaT, Across, Anaphraseus, Google

Translator ToolKit o Wordfast Anywhere. Estas permiten cubrir las necesidades

básicas sin invertir nada ya que algunas funcionan en la nube, pero con algunas

restricciones. Por lo que su desarrollo no es tan amplio. Sin embargo, pueden

funcionar muy bien para llevar a cabo proyectos pequeños.

b) Licencias comerciales o de paga: SDL Trados Studio 2015, MemoQ Pro,

WordFast Pro o Classic, Déjà Vu X3 Professional, Fluency Translation Suite,

Translation Workplace, MadCap Lingo, Smartling Translation Management

System, MetaTexis, CafeTran Espresso, SwordFish Translation Editor, Transit

NXT Professional, MemSource Cloud, XTM Cloud, Heartsome Translation Studio,

etc.

Ya algunas herramientas TAC han conseguido acaparar el grueso del mercado ya

que contienen una serie de funciones avanzadas y son mucho más potentes y

sofisticadas que otras en su desarrollo.

Page 8: Introducción Traducción Asistida

8

Fuente: http://www.polyglot.lv/es/tecnologa-de-traduccin

1.1.3 Las herramientas TAC más utilizadas a nivel mundial.

Según la última encuesta realizada en marzo-abril de 2013 a 440 traductores

voluntarios de la organización Translators without Borders, arrojó que las principal

herramientas TAC más utilizadas por los traductores son:

Trados (40.2 %).

Wordfast (12.9 %).

MemoQ (5.5 %).

Déjà Vu (2.1 %).

Across (1.7 %).

4.29 % reporta que usa otras herramientas TAC.

Un tercio (33.3 %) reporta que no usa ninguna herramienta TAC.

Fuente: http://translatorswithoutborders.org/twbnewsletter/04/the-translators-without-borders-

translator-survey/

El último informe «State of the industry: freelance translators» de 2012 que realiza

desde 2010 la empresa estadounidense ProZ.com

(http://cdn1.proz.com/file_resources/other/624ef9448c436b3256d99120d18fe1bd_ProZ.co

m%20State%20of%20the%20industry%20for%20freelance%20translators%202012.pdf)

Page 9: Introducción Traducción Asistida

9

arrojó que Trados Studio es el software más utilizado con un 64 %. Wordfast le

sigue con un 16 %; Déjà Vu con un 12 % y MemoQ con un 6 %.

En 2013, la misma empresa realiza otra encuesta en su blog a unos 3000

traductores independientes sobre el uso y preferencias de las herramientas TAC

para traducir. SDL Trados Studio volvió a destacar con un 70 %. Le sigue

Wordfast con un 36 % y MemoQ con un 27 %.

Fuente: https://prozcomblog.com/2013/03/28/cat-tool-use-by-translators-what-are-they-

using/

En este sentido, el artículo en línea de Jacques Drillon

(http://bibliobs.nouvelobs.com/actualites/20140116.OBS2713/traduire-plus-pour-

gagner-moins-grandeur-et-misere-des-

traducteurs.html?goback=%2Egde_1617477_member_5832855681576767491#%

21), publicado el 25 de enero de 2014 en L’OBS menciona que alrededor de un

70 % de los traductores técnicos franceses utilizan herramientas muy

especializadas (Wordfast, OmegaT, Trados y Déjà Vu) para traducir más rápido y

ser más productivos por tratarse de textos similares: palabras, expresiones y

frases repetitivas.

Page 10: Introducción Traducción Asistida

10

Siguiendo en este mismo tenor, el Departamento de Traducción e Interpretación

del Centro de Enseñanza de Lenguas Extranjeras de la Universidad Nacional

Autónoma de México (UNAM) realiza, de enero a noviembre de 2014, la Encuesta

nacional del perfil del traductor profesional en México a 477 traductores en todo el

territorio mexicano, de los cuales 21 % usan SDL Trados Studio en sus diferentes

versiones, siendo el software más utilizado en el país.

Fuente:http://es.slideshare.net/raul4319/resultados-de-la-encuesta-del-perfil-del-traductor-

profesional-en-mxico

En 2015, la Société française des traducteurs (SFT) publica los resultados

preliminares de la encuesta sobre las prácticas profesionales de los puestos

relativos a la traducción donde participaron 1140 traductores. De los cuales 894

(78.42 %) utilizan una herramienta TAC y 246 (21.58 %) traductores no al utilizan.

Dentro de las tres herramientas TAC más utilizadas por los traductores franceses

se encuentran, en orden de importancia, SDL Trados con 620 traductores (54.39

%). Luego, le sigue MemoQ con 204 traductores (17.89 %) y Wordfast con 228 (20

%). Hay un 21.58 % de traductores (246) que todavía no utiliza ninguna

herramienta TAC. Es interesante ver las dos herramientas favoritas de libre

acceso de los franceses: Across (3.95 %) y OmegaT (4.47 %).

Page 11: Introducción Traducción Asistida

11

Fuente:

http://www.sft.fr/clients/sft/telechargements/news/fichier/1730_f1_2015_resultats_preliminaires.pdf

Por último, veamos un comparativo de la evolución de las herramientas TAC en

Francia en los resultados preliminares de la encuesta 2015 frente a la encuesta de

2008.

Fuente:

http://www.sft.fr/clients/sft/telechargements/news/fichier/1730_f1_2015_resultats_preliminaires.pdf

Page 12: Introducción Traducción Asistida

12

1.1.4 Motivos para ser más eficientes en la industria de la traducción

Los motivos por los cuales un traductor debe ser eficiente van de la experiencia, el

manejo de las herramientas TAC, el tamaño de las memorias de traducción hasta

el hecho de capturar rápido o incluso utilizar una herramienta de reconocimiento

vocal de la voz como las que traen actualmente los teléfonos inteligentes para

grabar su voz y buscar una información, por ejemplo.

Fuente: https://www.youtube.com/watch?v=zHHVAoUMv_g

1.1.5 Características generales de las herramientas TAC más utilizadas en

la industria de la traducción

Como ya vimos en las encuestas anteriores, las cuatro herramientas TAC

comerciales más utilizadas son SDL Trados Studio, MemoQ, Wordfast y Déjà Vu

de las cuales les presentaremos algunas de sus características.

NOMBRE: SDL Trados Studio.

PRECIO: Freelance 695 €, Freelance Plus 855 € , Freelance Ultimate 1.455 €,

Professional Single User 2.595 €.

FORMATOS: Trabaja con 70 formatos.

Page 13: Introducción Traducción Asistida

13

DURACIÓN DE LA LICENCIA: Definitiva.

SISTEMA OPERATIVO: Windows 7, 8 o 10.

SOPORTE TÉCNICO: Soporte gratis para la instalación de la licencia y servicios

de mantenimiento.

REQUERIMIENTOS DEL SISTEMA: 1 gigahertz (GHz) o más, procesador de

32-bit (x86) o 64-bit (x64) y 2 GB RAM (32-bit) o 4 GB RAM (64-bit), Microsoft

Windows PC y una resolución de pantalla de 1280x1024.

PRUEBA GRATIS: Demo por 30 días gratis.

IDIOMAS: Cualquier idioma de Microsoft Word.

NÚMERO DE USUARIOS: Alrededor de 225 000. FUENTE: http://www.translationzone.com/products/trados-studio/freelance/

NOMBRE: MemoQ Pro 2015.

PRECIO: 620 €.

FORMATOS: Adobe Framemaker™ (.MIF), Adobe InCopy™, Adobe InDesign™,

Adobe InDesign™ (.INX), Adobe InDesign™ Markup Language (.IDML), AuthorIT

(.XML), DITA (.DITA, .XML), FreeMind mind maps (.MM), GetText (.PO), HTML

(.HTML, .HMT, .SHT), Java properties, JSON, Microsoft Word™ 2003 (.DOC,

.RTF, .BAK, .DOT), Microsoft Word™ 2007-2010 (.DOCX), Microsoft Excel™

2003 (.XLS, .XML), Microsoft Excel™ 2007-2010 (.XLSX, .XLSM), Microsoft

Excel™ documents (.XLS, .XLT), Microsoft PowerPoint™ 2003 (.PPT, .PPS,

.POT), Microsoft PowerPoint™ 2007-2010 (.PPTX, .PPSX, .POTX, .SLDX),

Microsoft Visio™ (.VDX), MS Help™ Workshop (.HHC, .HHK), OpenDocument

text documents (.ODT, .ODF), Plain text (.TXT, .INF, .INI, .REG), Plain text from

PDF files (.PDF), Rich Text Format™ (.RTF, two-column .RTF), Scalable Vector

Graphics (.SVG), SDL Studio package (.SDLPPX), SDL TradosTag (.TTX), SDL

Trados bilingual RTF (.RTF or .DOC, .BAK), SDLXLIFF (.SDLXLIFF), TMX filter,

Typo3 pages (.XML), Wordfast Professional TXML (.TXML), ResX (.RESX), XML

(.XML), XLIFF (.XLF, .XLIF, .XLIFF), XLIFF:doc, YAML.

DURACIÓN DE LA LICENCIA: Definitiva.

SISTEMA OPERATIVO: Windows 7, 8 y 10, Windows 2000, Windows XP,

Windows Vista.

Page 14: Introducción Traducción Asistida

14

REQUERIMIENTOS DEL SISTEMA: .NET Framework Version 3.5 SP1, 512 MB,

1 GB o más, 60 MB (sin incluir el .NET Framework), resolución de pixels de

1024×768.

SOPORTE TÉCNICO Y ACTUALIZACIONES: Soporte en la instalación, 1 año

de soporte técnico gratis.

PRUEBA GRATIS: Demo por 45 días gratis, pero cuando se acaba el periodo de

prueba se puede seguir utilizando el programa

con ciertas restricciones.

IDIOMAS: Prácticamente todos los idiomas, interfaz de usuario en 10 idiomas. FUENTE: https://www.memoq.com/

NOMBRE: Wordfast.

PRECIO: 400 dólares americanos.

FORMATOS: MS Word, MS Excel, MS Powerpoint, HTML, XML, ASP/JSP/Java,

INX (InDesign), MIF, FrameMaker, TTX, PDF.

DURACIÓN DE LA LICENCIA: 3 años.

SISTEMA OPERATIVO: Windows Vista, Windows 7, 8 y 10, Mac OS X 10.4 o

superior, Linux.

SOPORTE TÉCNICO Y ACTUALIZACIONES: Tutoriales en línea,

actualizaciones gratis durante los tres años de la licencia.

PRUEBA GRATIS: Demo para trabajar hasta con 500 unidades de traducción.

IDIOMAS: Wordfast Pro y Classsic trabaja con cualquier idioma de Microsoft

Word. FUENTE: https://www.wordfast.net/

Page 15: Introducción Traducción Asistida

15

NOMBRE: Déjà Vu X3.

PRECIO: 420 €.

FORMATOS: XML, Open Office 2007, WB (Workbench).

DURACIÓN DE LA LICENCIA: Definitiva.

SISTEMA OPERATIVO: Windows Vista, Windows 7 y 8, Windows 2000,

Windows XP.

REQUERIMIENTOS DEL SISTEMA: 1GHz o MÁS 32-bit (x86) o procesador de

64-bit (x64), 1GB RAM.

SOPORTE TÉCNICO Y ACTUALIZACIONES: Soporte técnico gratis a través del

Centro de Soporte Técnico (support ticket center), actualizaciones gratis, pero no

la actualización de la versión.

PRUEBA GRATIS: Déjà Vu X3 FREE con restricciones.

IDIOMAS: Cualquier idioma que trabaje con Unicode de Microsoft Word.

FUENTE: http://www.atril.com/

1.1.6 Principales motores de TA en el mercado

La oferta de este tipo de programas es abundante, existen decenas de motores de

traducción en línea en Internet (Apertium, Babelfish, babylon, Dictionary, SDL

FreeTranslation, Frengly, Idiomax, Intertran, Linguatec - Personal Translator

Online, Microsoft – Bing, Orange Traduction (hasta 300 caracteres, traduce webs),

Reverso, Systran (se desarrolló en EE. UU. durante la Guerra Fría, traduce bien el

ruso), Traductor de Google (el más común, incluso con lenguas como el latín),

Voila, Utile, WebTrance, World lingo, entre otros.

Este tipo de software realiza la traducción de un texto de forma automática.

Básicamente se encarga de sustituir una serie de palabras en una lengua de

Page 16: Introducción Traducción Asistida

16

partida por sus equivalentes en la lengua de llegada. Para ello, el software de TA

realizará un análisis lingüístico del texto origen e intentará proporcionar un

resultado lo más correcto posible en la lengua de llegada. Veamos algunos

ejemplos de la interfaz de un traductor automático, que se compone básicamente

de tres partes: una en donde elegimos las lenguas de partida y llegada, otra en

donde pegamos o escribimos el texto que queremos que el software traduzca y

por último, el espacio donde sale el resultado de la traducción.

https://www.apertium.org/index.spa.html?dir=tat-kaz#translation

https://www.babelfish.com/

Page 17: Introducción Traducción Asistida

17

http://traduction.babylon-software.com/

http://translate.reference.com/

Page 18: Introducción Traducción Asistida

18

https://www.freetranslation.com/

https://translate.google.com/

Page 19: Introducción Traducción Asistida

19

http://www.systranet.com/translate/

La traducción automática, también conocida como Machine Translation en inglés,

se centra en el estudio de la traducción automatizada de lenguas naturales

basándose en la lingüística computacional, es decir, en el análisis del lenguaje

verbal humano desde la perspectiva de la ingeniería informática. En los últimos

años, los traductores automáticos se han convertido en herramientas

verdaderamente útiles pues constituyen el medio ideal para conseguir

traducciones a muy bajo o nulo costo, en un tiempo récord y, aunque el producto

final no se caracteriza por ser un texto perfectamente coherente y comprensible, sí

permite superar los obstáculos comunicativos, por lo que en gran parte cumple la

función de la traducción.

En el ámbito empresarial e institucional internacional (ONU, UE, UNESCO), esto

se traduce en términos de rentabilidad y rapidez por lo que es razonable que todas

estas entidades hayan realizado inversiones que permitan desarrollar y crear

herramientas de traducción automática cada vez más sofisticadas y eficaces.

El funcionamiento de los traductores automáticos consiste en la entrada de

información en una lengua (lengua origen) dentro del sistema para descomponerla

Page 20: Introducción Traducción Asistida

20

en unidades sintácticas y morfológicas que más tarde analizará con el fin de

encontrar sus equivalentes en la lengua meta y así componer el texto en esa

lengua. Tal como su nombre indica, el proceso de traducción automática no

requiere la intervención de ninguna acción manual, es decir, es un proceso

totalmente independiente que proporciona un resultado automáticamente.

El comienzo de la traducción automática se inicia con el 701 Translator, un

software de traducción automática desarrollado por la multinacional IBM en 1954

para traducir del ruso al inglés.

Fuente: https://www-03.ibm.com/ibm/history/exhibits/701/701_141502.html

En esta dirección, podemos leer la noticia de prensa en 1954 cuando se

anunciaba el lanzamiento de este gran «cerebro» traductor: https://www-

03.ibm.com/ibm/history/exhibits/701/701_translator.html.

Existen diferentes sistemas de traducción automática que generalmente podemos

clasificar en tres grupos. Por un lado, aquellos que se basan en la lingüística

computacional y en inteligencia artificial. Pueden ser directos ya que carecen de

una fase intermedia y dan lugar a estructuras sintácticas inapropiadas debido a

que no cuentan con una base lingüística apropiada. Otros son los indirectos que

(interlingua, transferencia) que podemos ver de manera esquemática en el

Triángulo de Vaquois que representa los tipos de sistemas con conocimiento

lingüístico (Oliver, Moré y Climent, 2008: 36).

Page 21: Introducción Traducción Asistida

21

Fuente de la imagen: http://elies.rediris.es/elies9/3-2.htm

Estos métodos utilizan una representación intermedia a partir de la que se genera

el texto en la lengua meta.

Por otro lado, los que están basados en el estudio y procesamiento de corpus

lingüísticos como es el caso de “linguee” que todos hemos consultado alguna vez

para conocer el contexto de un término: http://www.linguee.es/.

Page 22: Introducción Traducción Asistida

22

Utilizan corpus o bases de datos de textos en diversas lenguas y modelos

estadísticos para la resolución de problemas de optimización. Su traducción

automática está basada fundamentalmente en ejemplos (Example-Based M T) y

estadísticas que se extraen de un corpus paralelo que contiene alineación de

oraciones, locuciones y palabras en diferentes lenguas.