homonimia y polisemia en la traducción automática del ...585352/fulltext01.pdf · traducción...

64
- 1 - Homonimia y polisemia en la traducción automática del español al sueco Johan Marqués Sahlberg Institutionen för spanska, portugisiska och latinamerikastudier Examensarbete 15 högskolepoäng avseende filosofie kandidat Spanska Spanska fristående kurs Vårterminen 2012/Höstterminen 2012 Handledare: Johan Falk English title: Homonymy and Polysemy in Machine Translation from Spanish to Swedish

Upload: ngokiet

Post on 20-Sep-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

  • - 1 -

    Homonimia y polisemia en la traduccin automtica del espaol al suecoJohan Marqus Sahlberg

    Institutionen fr spanska, portugisiska och latinamerikastudier

    Examensarbete 15 hgskolepong avseende filosofie kandidat

    Spanska

    Spanska fristende kurs

    Vrterminen 2012/Hstterminen 2012

    Handledare: Johan Falk

    English title: Homonymy and Polysemy in Machine Translation from

    Spanish to Swedish

  • - 2 -

    Homonimia y polisemia en la traduccin automtica del espaol al sueco

    Sumario

    Esta investigacin elabora y defiende la hiptesis de que la traduccin automtica no es capaz de traducir las palabras que presentan polisemia u homonimia. La homonimia y la polisemia son dos fenmenos lingsticos que implican, cada uno a su manera, la ramificacin de distintos significados bajo un mismo denominador (palabra). Por regla general estos fenmenos pasan desapercibidos gracias a que el significado de cada palabra se interpreta en un contexto. Por lo tanto el contexto activa un significado de cada palabra y cancela los dems. Creemos que la traduccin automtica no es capaz de decodificar la informacin necesaria del contexto. La investigacin gira alrededor de los resultados obtenidos por un corpus espaol traducido al sueco por Google Translate.

    -----------------------------

    Palabras clave

    Homnimo/homonimia, polisemia, acepcin, contexto, cotexto, lingstica computacional, inteligencia artificial.

  • - 3 -

    ndice

    1. Introduccin .................................................................................................4

    1.1 Marco terico .................................................................................................... 5

    1.2 Objetivo e hiptesis......................................................................................... 10

    1.3 Premisas........................................................................................................ 10

    1.4 Mtodo y delimitacin ..................................................................................... 12

    2. Introduccin al anlisis ............................................................................... 15

    3. El anlisis

    3.1 Los sustantivos............................................................................................... 17

    3.1.1 Primarias............................................................................................... 17

    3.1.2 Presidencia ............................................................................................ 21

    3.1.3 Coincidencia .......................................................................................... 24

    3.1.4 Beneficios.............................................................................................. 26

    3.1.5 Estado ................................................................................................. 29

    3.1.6 Manifestaciones/una serie de/cuotas/interferencia/aplicacin ....................... 31

    3.2 Los verbos ..................................................................................................... 36

    3.2.1 Coincidir ............................................................................................... 36

    3.2.2 Llevar .................................................................................................. 39

    3.2.3 Sealar vs. hacer notar .......................................................................... 41

    3.2.4 Comunicar ............................................................................................ 42

    3.2.5 Pensar ................................................................................................. 43

    3.3 Los adjetivos .................................................................................................. 45

    3.3.1 Irresistible ............................................................................................ 45

    3.3.2 Su/sus ................................................................................................. 46

    3.4 Las preposiciones............................................................................................ 53

    3.4.1 Sobre/para/por/en ................................................................................. 53

    4. Conclusiones ...............................................................................................55

    5. Bibliografa ..................................................................................................57

    6. Apndice / Corpus........................................................................................58

  • - 4 -

    1. Introduccin

    La influencia de los ordenadores sobre nuestras vidas ha sido impactante durante los ltimos diez o quince aos. Sin hacer clculos exactos podemos constatar empricamente que la capacidad computacional que antiguamente se consideraba excepcional, hoy en da la hallamos y adems mltiplemente potenciada en un sinfn de dispositivos comunes para toda persona.1 Con el aumento de la capacidad de los ordenadores tambin han surgido muchas nuevas aplicaciones.2

    Sobre todo la relativamente nueva intercomunicacin global de los ordenadores, mejor conocida como Internet, ha conllevado que ejerzamos la mayor parte de nuestro lenguaje natural escrito mediante el ordenador.

    La lingstica computacional es el campo multidisciplinar que se encarga de procesar y tratar el lenguaje natural en su representacin digital.3 Nos topamos con ella a diario cada vez que usamos un procesador de textos o cada vez que hacemos una bsqueda en internet. El procesador de textos nos corrige la ortografa y algunos pero no todos los errores gramaticales. El buscador de internet nos sugiere la(s) palabra(s) antes de que hayamos terminado de escribirla(s). Si instalamos ciertos programas podemos dictarle al ordenador con nuestra voz lo que queramos que escriba en la pantalla. Nuestro correo electrnico descarta sistemticamente algunos mensajes recibidos, basndose, entre otras cosas, en las palabras que contiene. Etctera. La traduccin automtica es una de las aplicaciones, y posiblemente la ms compleja, de la lingstica computacional. Lo afirmamos debido a que, al contrario de muchas otras aplicaciones que se ocupan principalmente de percibir y distinguir manifestaciones digitales del lenguaje natural (es decir la forma), la traduccin automtica tiene que encargarse, adems, del significado de tales manifestaciones.4

    Aunque los avances tecnolgicos de la informtica hayan sido enormes y hoy podamos hacer cosas con ella que hasta hace poco eran impensables, la traduccin automtica es una ambicin relativamente antigua. Existen bastantes libros sobre el tema escritos en los aos setenta y ochenta, incluso algunos en los aos sesenta. Si lo pensamos, no es tan sorprendente. Una de las funciones bsicas de todo ordenador, desde el comienzo hasta nuestros das, ha sido el almacenamiento de textos. Si excluimos la posibilidad de que la traduccin automtica mejore

    1 Comparar datos tcnicos de un ordenador del ao 2000 con un mvil del ao 2012.

    2 Aplicaciones: ejemplo de una palabra polismica que independientemente de cul de sus acepciones lgicas

    se escoja es funcional en este contexto.

    3 Cada letra de este mismo trabajo tiene designado un nmero hexadecimal, y por lo tanto cada palabra se compone de una serie de nmeros nicos para tal palabra.

    4Aunque la lingstica computacional generalmente se considere pertenecer a la inteligencia artificial, quiz en

    algunos casos sera ms conveniente hablar de percepcin verbal digital.

  • - 5 -

    significativamente en proporcin al tamao del corpus accesible, idea que adems supone de un modo u otro que el ordenador tenga alguna clase de capacidad autodidctica, los prerrequisitos necesarios para almacenar todo un diccionario bilinge y contar con un dispositivo de reglas morfolgicas, sintcticas y lxicas necesarias para la descodificacin y recodificacin verbal escrita implicadas en la traduccin automtica ya deben estar cumplidos hace tiempo. Sea cual sea el caso, la intencin de esta monografa no es estudiar la tecnicidad de la traduccin automtica sino ms bien revelar dos aspectos de ella que demuestran la complejidad del lenguaje humano. En esta monografa, la traduccin automtica es el medio por el que observaremos como se resuelven la homonimia y la polisemia.

    La inspiracin para escribir esta tesina no fue el fruto de haber elaborado con programas de traduccin automtica cosa que hasta ahora nunca habamos hecho sino que surgi durante la meditacin acerca de los errores cometidos por aprendices de segundas lenguas. Transferidas estas observaciones al campo de la traduccin automtica, sospechamos que Google Translate cometer errores similares.

    1.1 Marco terico

    Hoy en da se puede decir que, aunque no todos seamos lingistas, pertenece a la cultura general conocer el significado de la palabra sinnimo. Es uno de los trminos lingsticos que casi indudablemente aprendemos en la escuela. Sin embargo, probablemente una gran mayora de la gente no sabra definir los trminos homnimo/homonimia o polisemia.

    Las definiciones de homonimia y polisemia de la Real Academia Espaola son las siguientes:

    (En la Real Academia Espaola la palabra homonimia no hace ms que apuntar a la palabra homnimo: 1. f. Ling. Cualidad de homnimo.)

    homnimo, ma.

    (Del lat. homonymus, y este del gr. ).

    1. adj. Dicho de dos o ms personas o cosas: Que llevan un mismo nombre. U. t. c. s.

    2. adj. Ling. Dicho de una palabra: Que, siendo igual que otra en la forma, tiene distinta significacin; p. ej., Tarifa, ciudad, y tarifa de precios. U. t. c. s. m.

    3. m. y f. tocayo.

    polisemia.

    (De poli-y el gr. , significado).

    1. f. Ling. Pluralidad de significados de una palabra o de cualquier signo lingstico.

  • - 6 -

    Rigindonos por la Real Academia Espaola constatamos que los sinnimos para ser considerados como tales basta que tengan muy parecida significacin, mientras que la homonimia como la polisemia se refieren a palabras que se escriben de la misma manera, es decir comparten el mismo significante5, pero tienen ms de un significado. La diferencia es que para que se d una relacin de homonimia, los significados asociados a un mismo significante deben ser totalmente diferentes y no permitir ninguna asociacin a un comn denominador:

    La distincin de Weinreich (1964) entre ambigedad contrastiva y ambigedad complementaria es ilustrativa en este caso. Ambigedad contrastiva, tradicionalmente conocida como homonimia, es la situacin en la que una palabra es asociada con al menos dos significados distintos que no tienen ninguna relacin.(Pustejovsky/Boguraev 1996:26)

    Se podra opinar que el hablar de la situacin es un tanto contraproducente, porque la palabra mantiene cierta relacin con el significado de la palabra contexto (ver las premisas de la monografa). Justamente la situacin, si la consideramos equivalente a lo que es un contexto, es el factor que excluye ms de una asociacin para la palabra en cuestin. Esta distincin nos extrae el ncleo de los dos conceptos: la ambigedad de significado. La ambigedad contrastiva es la homonimia y la ambigedad complementaria es la polisemia. Por lo tanto podemos deducir que la homonimia siempre es polismica, pero la polisemia no siempre es homonmica. La polisemia puede producirse a causa de algn pequesimo matiz o alguna variacin mnima de significado, mientras que la homonimia, por su naturaleza, no posee tal posibilidad.

    Hay quienes sostienen que para hablar de homonimia no es suficiente que la palabra (el significante) tenga dos significados distintos, sino que adems dichos significados tienen que tener distintas etimologas7. En algunos diccionarios, por ejemplo el diccionario de El Mundo en lnea, esta necesidad est precisada en la definicin de homonimia. A juicio de otros se puede hablar de homonimia en el momento en que los hablantes ya no perciben ninguna relacinsemntica entre dos o ms de los significados de la palabra, compartan o no un mismo origen.

    5 2. m. Ling. Fonema o secuencia de fonemas que, asociados con un significado, constituyen un signo

    lingstico. (RAE)6 Weinreichno figura en la bibliografa de Pustejovski/Boguraev.

    7 1. f. Origen de las palabras, razn de su existencia, de su significacin y de su forma. (RAE)

  • - 7 -

    Las palabras de los diccionarios van evolucionando sus significados. Los significantes/palabrasen uso, ya se trate de homonimia o expansin de significado/polisemia, tienen que albergar ms significados al mismo tiempo que algunas acepciones viejas se van eliminando. Un ejemplo es la palabra sueca amatr, cuyo equivalente espaol es aficionado. Antiguamente la palabra en sueco significaba person med srskild knsla fr viss verksamhet/persona con apititud extraordinaria para cierta actividad (Norstedts svenska ordbok), pero hoy en da solamente genera una asociacin despectiva. La comprensin ante este proceso de expansin o reduccin de significados se ve un tanto reducida, y, como ya hemos dicho, no en el centro de inters de nuestra investigacin. No obstante, de vez en cuando se produce la oportunidad de evidenciarestos procesos, lo cual se ilustra bastante bien con otro ejemplo sacado del sueco. En sueco el verbo reklamera (equivalente espaol: reclamar) se sola usar nicamente para quejarse de algo. Despus de que mucha gente hiciera un uso indebido de tal verbo, ahora el mismo verbotambin puede significar todo lo contrario: hacer publicidad/propaganda de algo. En cuestin de reklamera uno se puede preguntar si lo que se dice de que toda publicidad es buena publicidadhaya podido servir de plantilla de tal razonamiento. Ms adelante veremos algunos otros ejemplos de palabras que pueden significar tanto una cosa como todo lo contrario.

    Para ejemplificar una palabra que presenta ambigedad, y adems tanto homonimia8 como polisemia, nos valdremos de la palabra banco, que parece ser una de las preferidas ya que tanto Van Eynde (1993:112) como Pustejovsky/Boguraev (1996:3) la usan como ejemplo.Comparemos algunas de las varias acepciones9 de la palabra:

    banco. (RAE)

    (Del fr. ant. bank, y este del germ. *banki).

    1. m. Asiento, con respaldo o sin l, en que pueden sentarse varias personas.

    2. m. Madero grueso escuadrado que se coloca horizontalmente sobre cuatro pies y sirve como de mesa para muchas labores de los carpinteros, cerrajeros, herradores y otros artesanos.

    3. m. En los mares, ros y lagos navegables, bajo que se prolonga en una gran extensin.

    4. m. Conjunto de peces que van juntos en gran nmero.

    5. m. Establecimiento pblico de crdito, constituido en sociedad por acciones.

    8 Con homonimia nos referimos no a la definicin tcnica de diferente etimologa sino aparentemente distinto

    significado. Tcnicamente hablando es fcil ver si la palabra estudiada es homnima o no; los homnimos tienen entradas propias en los diccionarios. Ver mtodo y delimitacin.

    91. f. Cada uno de los significados de una palabra segn los contextos en que aparece.

  • - 8 -

    La asociacin entre las dos primeras acepciones no es nada forzada, es fcil percibir que asiento y madero grueso tienen algo en comn. En lo que se refiere a la traduccin al sueco, estas dos acepciones, que mantienen una relacin polismica, en general tampoco tendran que causar ningn problema; en sueco estos dos significados tambin comparten un mismo significante: bnk. Sin embargo, las siguientes tres acepciones en sueco requeriran otros significantes. En los mares, ros y lagos navegables, bajo10 que se prolonga en una gran extensin no tiene su equivalente sueco en bnk sino en sandbank, rev o grund (y adems podra ser discutible cul es el ms apropiado). Conjunto de peces que van juntos en gran nmero requerira el equivalente sueco fiskstim, y establecimiento pblico de crdito, constituido en sociedad por acciones el equivalente sueco bank. En el proceso de traduccin automtica, el programa tiene que interpretar el significado intencionado en espaol e identificar y seleccionar el significante correspondiente en sueco.

    A primera vista podra aparentar que solamente la homonimia (y no la polisemia) pueda serpotencialmente problemtica en cuestin de traduccin automtica. Este no es el caso, lo cual se ilustra mediante por ejemplo la palabra polismica crepsculo:

    crepsculo. (RAE)

    (Del lat. crepusclum).

    1. m. Claridad que hay desde que raya el da hasta que sale el Sol, y desde que este se pone hasta que es de noche.

    Haciendo uso de sus sinnimos, podemos ver cmo en espaol el mismo significante (crepsculo) puede referirse tanto al amanecer como al atardecer. En sueco cada uno de estos acontecimientos requiere su propio significante gryning respectivo skymning y no existe ninguna palabra sueca que pueda denotar las dos cosas. Aunque no sea cuestionable que el amanecer y el atardecer son dos diferentes caras de la misma moneda, el programa de traduccin tiene que partir segn el significado de una de ellas y generar la palabra equivalente en sueco.

    En realidad la distincin entre polisemia y homonimia no es del todo pertinente para nuestroestudio; confiamos en que las interpretaciones errneas saldrn a la vista, ya sea homonimia o polisemia. Los errores a causa de la polisemia y la homonimia pegan al ojo. Confiamos que este ser el caso basado en la seguridad que normalmente tenemos en cuanto a la eleccin de significados: Por otra parte, no cabe ninguna duda de que estas oraciones no son ambiguas para los seres humanos. El contexto, el resto de los elementos de la oracin y sus relaciones mutuas, determinan que la interpretacin de banco es una nica. (Van Eynde 1993: 112) Si esto es cierto, y, en consecuencia, no tenemos ninguna dificultad de atribuirle a una palabra el sentido correcto, tampoco deber ser difcil percatarnos de los usos errneos. Si poseemos esta capacidad interpretativa que nos permite elegir entre los posibles significados el apropiado, tambin deberamos saber distinguir con facilidad los no apropiados. Adems, por lo menos en el caso de los homnimos, probablemente no sea muy difcil motivar por qu uno de sus significados es vlido y otro no; la eleccin de una acepcin errnea podra fcilmente generar una traduccin

    10 [] elevacin del fondo [] (RAE)

  • - 9 -

    absurda: jag placerade mina besparingar i sandrevet, jag tillverkade en bank, eleverna satte sig i sina banker och gjorde lxorna, etc.

  • - 10 -

    1.2 Objetivo e hiptesis

    El objetivo de este trabajo es investigar el grado de fidelidad al texto fuente obtenido en la traduccin automtica del espaol al sueco en lo que se refiere a las palabras que presentan homonimia o polisemia.

    La hiptesis en la que se basa esta pesquisa es que los ordenadores no son capaces de traducir correctamente del espaol al sueco ni las palabras homnimas ni las que ofrezcan polisemia.11

    Tal y como mencionaremos en las premisas del trabajo, creemos que esto se debe principalmente a la incapacidad del ordenador de procesar una informacin compleja del contexto.

    Hasta cierto grado intentaremos averiguar las causas de los errores y problematizar algunas cuestiones que aparentan ser fundamentales. Puede ser tentadora la idea de analizar el cdigo (la programacin) de este u otro programa de traduccin automtica, pero queremos acentuar que este trabajo no incluir nada de ello. Creemos que, aun as, ser posible decir algo de validez acerca del razonamiento del programa. Y tambin alguna opinin, aunque de forma especulativa, acerca de la probabilidad de que los traductores seres humanos sean o no remplazados por mquinas dentro de un no demasiado lejano futuro.

    1.3 Premisas

    Toda persona que haya reflexionado sobre las numerosas peculiaridades del lenguaje humano habr notado que la misma expresin puede significar diferentes cosas en diferentes contextos. Como se ha explicado en la introduccin, el lenguaje humano tiende inevitablemente a ser ms pragmtico12 que exacto en su expresin, y para llegar al sentido de un enunciado los factores a tener en cuenta son varios. Preguntamos a alguien si tiene hora y en lugar de respondernos que s o que no nos dice la hora que es. Decimos que tenemos muchsimas ganas de hacer los deberes cuando en realidad se entiende todo lo contrario. El mismo enunciado puede ser tanto una declaracin como una pregunta, segn la entonacin. Decimos que hemos ledo a Kafka cuando en realidad hemos ledo slo uno de sus libros. Etctera. Esto nos lleva a concluir que la forma no es suficiente para el entendimiento de la expresin verbal. Tiene que haber algo ms. Este ms si tuviramos que denominarlo de alguna manera sera el contexto.

    Partimos de la premisa que el lenguaje humano es demasiado complejo y variable para poder ser traducido por una mquina que necesariamente tiene que basarse en sistemas formalizados de apareamiento de significados. Particularmente en el caso de la homonimia y la polisemia creemos que esto se debe principalmente a la dificultad de formalizar la influencia de los factores contextuales, es decir que el contexto y la informacin enciclopdica es inaccesible para la traduccin automtica. A continuacin veremos qu se entiende por contexto:

    11Hiptesis que aunque no lo investiguemos debe ser vlida para cualquier otra combinacin de lenguas que

    presenten homonimia/polisemia.

    12 3. f. Disciplina que estudia el lenguaje en su relacin con los usuarios y las circunstancias de la

    comunicacin. (RAE)

  • - 11 -

    contexto. (RAE)

    (Del lat. contextus).

    1. m. Entorno lingstico del cual depende el sentido y el valor de una palabra, frase o fragmento considerados.

    2. m. Entorno fsico o de situacin, ya sea poltico, histrico, cultural o de cualquier otra ndole, en el cual se considera un hecho.

    3. (m. p. us. Orden de composicin o tejido de un discurso, de una narracin, etc.)

    4. (m. desus. Enredo, maraa o unin de cosas que se enlazan y entretejen.)

    Es un punto de partida razonable sostener que toda expresin verbal slo cobra existencia en un enunciado emitido en un contexto. Como podemos ver, el contexto no se limita nicamente a lo recin expresado, sino tambin tiene un significado ms amplio segn la segunda acepcin. Este principio se puede ilustrar mediante un hecho real. Se dio el caso de un alumno que pidi cita para una clase de autoescuela. Acordaron que la clase sera a las cinco. Cuando el alumno se present para la clase a las cinco de la tarde le informaron de que la clase tuvo lugar a las cinco de la maana. El alumno haba dado por sobrentendido, segn su conocimiento de cmo funciona el mundo, que de ninguna manera se poda tratar de las cinco de la maana.

    A luz del ejemplo anterior pensamos que se puede hablar de convenciones aprendidas o normalidad de significado de una expresin. No hay manera de saber lingsticamente si a las cinco se refiere a la tarde o a la maana, al menos que se acompae de alguna expresin que loprecise directa o indirectamente. Aunque la traduccin de este mismo ejemplo probablemente nocausara dificultad, esta amplia nocin del contexto, por ser todava potencialmente inalcanzable para un ordenador, la consideramos parte de la premisa de este trabajo. Nuestra sospecha se ve corroborada por Dreyfus:

    Debido a que el ser humano utiliza e interpreta los enunciados en situaciones que le son familiares, la nica manera de hacer que el ordenador entienda estos enunciados y traduzca un lenguaje natural podra perfectamente ser, tal y como Turing sospech, programndolo de modo que aprenda de qu consiste el mundo real. (Dreyfus 1992: 109)

    Pese a que partimos de la premisa de que el ordenador no entiende el contexto, compartimos la opinin de Halliday en cuanto a la facilidad de compresin del contexto en el caso de los seres humanos:

    [Pero] cuando leemos una frase o un texto no nos dejamos engaar, en condiciones normales, por ninguna ambigedad. Normalmente no tenemos ningn problema para entender lo que una frase significa. Esto se debe a que no nos fijamos en las palabras aisladas, sino incluidas en un contexto. (Halliday 2004: 83)

  • - 12 -

    1.4 Mtodo y delimitacin

    El programa que hemos usado para la traduccin automtica es el servicio en lnea de Google Translate. Lo primero que debemos mencionar es que Google no es una compaa especializada en traducciones. Tampoco ofrece ningn servicio de traduccin automtica especializado en la traduccin de las dos lenguas de este trabajo; ofrece traducciones entre una multitud de lenguas. Sin embargo, lo que no se puede negar es que Google es una compaa altamente especializada en el procesamiento de textos, adems probablemente el ms usado. Por lo tanto es probable que Google rena muchas de las condiciones necesarias para la traduccin automtica, especialmente si sta depende del volumen de corpus y tambin se basa en la adaptacin de logaritmos lingsticos ya en funcionamiento.

    Estamos convencidos de que la homonimia y la polisemia no son las nicas dificultades que se presentan a la hora de la traduccin automtica, pero hemos decidido concentrar el estudio en estos dos aspectos. Esto tambin quiere decir que este estudio se centrar nicamente en los aspectos lxicos de la traduccin. Por lo tanto prescindiremos de todo error sintctico, morfolgico o gramatical que pueda surgir durante el trayecto. Somos conscientes de que estos aspectos en muchos casos probablemente se entrecrucen, pero no nos interesaremos por la forma ni la estructura a menos que afecten notablemente al significado de las expresiones lxicas que hemos decidido estudiar. Para llegar a un entendimiento de los factores contextuales influyentes en el proceso de la traduccin conviene prestar atencin no slo a los casos de traduccin defectuosa sino tambin intentar averiguar por qu los dems fueron traducidos debidamente.

    Hemos realizado un par de estudios piloto alimentando el servicio de Google Translate con diferentes textos obtenidos en la pgina web del peridico El Pas. Casi todos presentaron, necesitando nada ms una inspeccin general, alguna clase de problemtica en cuanto a la homonimia/polisemia, pero uno de ellos destac por su gran abundancia y variedad.13

    Esta variedad tambin nos ha hecho aplicar los trminos homonimia/polisemia de una manera flexible. Como veremos en cuestin de por ejemplo la traduccin de las preposiciones, existen palabras que en s mismas bsicamente carecen de significado, pero que alteran el significado de las palabras ms adyacentes de un modo que sera errneo no considerarlas polismicas.Tcnicamente hablando la distincin entre homonimia y polisemia es fcil de discernir. En la mayora de los diccionarios seriamente elaborados los homnimos tiene una entrada nica y separada, la cual seala y advierte de que se trata de un nuevo lexema con un significadoinicial. La definicin de homnimo supone que se consigan dos entradas, por lo tanto que exista por lo menos dos palabras que en su forma sean idnticas, compartiendo la misma forma visual/morfolgica pero que en el plano del significado no comparten ninguna semejanza en absoluto (ms que por pura coincidencia). El motivo por el que hemos dicho que tcnicamentehablando es fcil la distincin entre homonimia y polisemia es que en la prctica, y careciendo muchas veces de la comodidad de poder consultar las palabras en el diccionario, la relacin inherente entre dos (o ms) significados de una misma palabra puede ser difcil de percibir. La palabra puede perfectamente aparentar ser un homnimo, cuando en realidad la diferencia es polismica. Por ejemplo, el hecho de que los dos significados (entre varios otros) de la palabra

    13 Es de sospechar que el gnero del texto influya en la probabilidad de que contenga homonimia/polisemia.

  • - 13 -

    estado estado situacional-modal y estado territorial-gubernamental tengan algo en comn,a nuestro juicio es sinceramente difcil de percibir.

    En nuestra eleccin de corpus hemos elegido un artculo de debate de unas diez pginas escritopor Prudencio Garca a comienzos del 2012 y publicado en el peridico El Mundo (en Internet).Garca, adems de ser profesor del Instituto Gutirrez Mellado de la UNED, es investigador de la Fundacin Accin Pro Derechos Humanos. La traduccin automtica de ciertos gneros de textoha sido posible desde hace muchas dcadas, incluso ya en los aos 60 (consulte con Dreyfus 1992: 92 y Domenij 2008). Los textos ms favorables para la traduccin automtica son los textos acadmicos y los manuales tcnicos. Por ejemplo, algunos planes de estudio de la universidad de Estocolmo se benefician de la traduccin automtica (consulte con Domenij 2008). Es probable que los programas de traduccin automtica ms sofisticados y especializados permitan introducir el gnero del texto, por ejemplo el gnero econmico o el jurdico, y que a consecuencia se haga ms estrecha la eleccin de significado de la palabra cuando exista una posible rivalidad entre ellos. Si en el grupo de textos ventajosos para la traduccin automtica se encuentran los textos acadmicos y los tcnicos, hemos supuesto que en el polo opuesto debeestar la literatura de ficcin o la poesa. A causa de que el contexto de una novela requerira la lectura de todo el libro, la hemos descartado. Hemos opinado que el texto de Garca es adecuado como corpus por situarse en el medio de los gneros. El texto ofrece referencias al mundo real, trminos econmicos y cierto nivel retrico. Adicionalmente, resulta que algunas de las palabras que son altamente polismicas se repiten dentro del texto, ofreciendo de tal modo contextos variados en torno a la misma palabra, lo que es un factor fundamental para la investigacin de nuestra hiptesis.

    El corpus nos ha servido para reparar en algunos casos de homonimia/polisemia que a nuestro juicio merecen ms atencin. Son casos en los que estimamos que el resultado casi siempre ser el mismo, o casos que dentro de nuestro corpus se repiten. Para investigarlo nos hemos visto obligados a desviarnos temporalmente del corpus, provocando el programa a traducir enunciados generados por nosotros mismos acorde a la tendencia supuestamente observada. En algn sentido podra ser ms provechoso y eficaz dedicarse nicamente a la alimentacin de construcciones verbales ficticias que deliberadamente contengan un alto grado de polisemia/homonimia y adems de distinto carcter.14 Por otra parte, un principio sano de la investigacin cientfica es que no debe basarse en antojos personales sino someter el programa a pruebas bien controladas a fin de comprobar la hiptesis. Un corpus autntico parece ser lo ms fundamental y obligatorio para cualquier investigacin. Adems, en este caso presenta la gran ventaja de revelar los casos potenciales de homonimia/polisemia que, a causa del ya mencionado proceso de desambiguacin automtica intrnsecamente humano, de otro modo quiz no hubieran salido a la luz. La necesidad de basarnos en un texto autntico en lugar de intentar fabricar enunciados ficticiosse evidencia en cuanto se hace el intento de escribir deliberadamente mal. Cosa que es francamente difcil.

    Los significados potencialmente pueden ser muy complejos, y no nos ser ni posible ni de intersagotar todas las posibilidades semnticas discernibles. Adems tenemos que correr el riesgo de 14 Quien sea de la opinin que la polisemia no es compleja y polifactica que consulte algunos de los captulos

    de Rakova et al 2007, por ejemplo p. 146: Polisemia pseudosistemtica metafricamente motivada

  • - 14 -

    decir cosas y argumentar de alguna manera que quiz no se vea respaldada por el diccionario.Esto sin embargo no parece ser nada muy fuera de lo comn: Repetidamente, la evidencia decorpus sugiere que existen muchas ms combinaciones semnticamente relevantes que las mencionadas en los diccionarios. (Halliday 2004:87) Garca-Carpintero expresa una conviccin semejante: Intuitivamente hablando, se ve fcilmente que, en muchas ocasiones, los hablantes consiguen dar a sus palabras, en virtud del contexto en que hacen uso de ellas, significados que las palabras literalmente no tienen. (Garca-Carpintero 1996: 492)

    El anlisis que a continuacin sigue es el fruto de haber descartado varios otros posibles mtodosde embestir el fenmeno de la polisemia/homonimia. Est divido en dos partes. La primera es la parte que podramos denominar la parte dinmica y la que ms se merece llamarse anlisis. La segunda parte es la parte estadstica/matemtica, en la que intentaremos medir el porcentaje de aciertos respective fallos. En la primera parte procuraremos evidenciar algunos casos que, no escogidos al azar pero s bien a nuestro gusto segn preferencias que iremos motivando en la introduccin al anlisis y muchas veces tambin en cada uno de los casos, respaldan nuestra hiptesis de que el ordenador es incapaz ante la tarea de traducir debidamente segn el contexto.Al mismo tiempo no nos daremos por aludidos ante los casos superados exitosamente bajo algunas circunstancias que hubiramos adivinado seran agravantes para la tarea.

    El corpus que hemos utilizado est incluido en el apndice de este trabajo. Adjunto a l existe un pequeo manual de cmo se deben interpretar nuestros marcajes. Sugerimos que antes de comenzar la lectura de nuestro anlisis se lea el corpus para hacerse una idea de lo que el texto trata.

  • - 15 -

    2. Introduccin al anlisisComo ya hemos advertido las palabras polismicas tienden a no ser percibidas en los casos de traduccin correcta. Por lo tanto hemos tenido que examinar con suspicacia forzada muchas de las palabras, siendo lo ms aplicados posible en el manejo del diccionario. No obstante, es casi seguro que el resultado de este pre-anlisis/corpus (adjunto como apndice) no es exhaustivo. Se nos ha ocurrido incluso la idea de procesar todas las palabras del texto por un programa informtico que hubiramos diseado a medida para la tarea. La funcin de tal programa hubiera sido escoger cada una de las palabras del texto espaol y mediante un diccionario digital espaol-sueco contar el nmero de acepciones que cada palabra presenta en el lado sueco del diccionario.En teora y simplificando la cosa, si todas las palabras procesadas presentaran slo dos acepciones ya se podra hablar de un resultado favorable por encima de una eleccin arbitraria en el caso de que el programa acertara en ms de un 50% de ellas. Sin embargo, este mtodo de medir la polisemia/homonimia presenta un par de obstculos. Para empezar, y retrocediendo a la palabra crepsculo, si uno se esperara que cada enumeracin de la palabra en el diccionario presentara slo una palabra, o como mucho una serie de palabras absolutamente sinnimas, tal idea tendra que ser descartada inmediatamente en vista de la siguiente enumeracin:

    crepsculo (Norstedts spansk-svenska lexikon)

    m1 skymning; gryning

    2 bildl. frfall, nedgng

    Anteriormente ya hemos ejemplificado que skymning y gryning no son sinnimos absolutos, aun as comparten la misma enumeracin en el diccionario. Por lo tanto este mtodo de abordar el problema mediante un programa diseado para la medicin polismica probablemente fallara, o por lo menos requerira diccionarios especializados para la tarea. Un segundo motivo por el que abstenerse de tal anlisis computacional es que posiblemente las palabras tengan significados centrales y otros perifricos, idea que veremos y desarrollaremos ms adelante.15 De todos modosy como ltimo obstculo no superado, la compaa Wordfinder16 que parece ser el nico diccionario espaol-sueco seriamente elaborado que se puede descargar en formato digital nos ha prohibido explcitamente usar su diccionario digital para tal tarea. Norstedts, cuyos diccionarios son los que Wordfinder incorpora, no ha respondido a nuestra peticin de poder acceder a sus diccionarios en formato digital.

    15 Sugiriendo ya que frfall y nedgng no perteneces a tal clase de significados de la palabra crepsculo.

    16 http://www.wordfinder.com

  • - 16 -

    Hemos optado por una categorizacin clsica ordenando el anlisis segn la parte de la oracin17 a la que cada palabra pertenece. Despus de haber ojeado el apndice, es decir hecho el pre-anlisis, se ve obvio que no podemos comentar cada una de las palabras. El corpus por pequeo que sea es demasiado largo. Tampoco hemos optado por separar estrictamente los casos correctos de los errados, mereciendo atencin los dos. Aun as, hemos intentado seguir ciertas pautas.

    Las preferencias para nuestra eleccin de objeto de estudio han sido las siguientes:

    A) La palabra analizada presenta un alto grado obvio de polisemia, y la traduccin automtica destaca por haberla traducido correctamente (o no fallado demasiado, porque naturalmente existen graduaciones).

    B) La palabra analizada presenta un alto grado obvio de polisemia, y la traduccin automtica la ha traducido indebidamente confirmando de tal modo nuestra hiptesis.

    C) La palabra analizada es digna de ser analizada por el motivo de ilustrar algn aspecto nuevo y todava no comentado. Estamos en busca de tonalidades, modos y variaciones de significado.

    D) La palabra recogida es digna de ser analizada por el motivo de consolidar algn aspecto o alguna dinmica ya intuida en algn caso anterior.

    E) La palabra se repite varias veces en nuestro corpus, y por lo tanto constituye un ejemplar ideal para la bsqueda de los factores influyentes en la traduccin automtica.

    Al introducir una palabra nueva a analizar marcamos entre parntesis si la traduccin ha sido exitosa (+) o errnea (-).

    17 Ordklass no confundir con satsdel.

  • - 17 -

    3.1 Los sustantivos3.1.1

    Primarias (-)

    Anteriormente ya hemos sugerido que una de las cuestiones centrales en lo que podramos llamar la medicin del grado de polisemia podra ser el significado predominante de cada palabra. La cuestin es si cada una de las palabras con las que nos topamos puede tener un significado predominante, que haga la eleccin entre todos sus posibles significados, especialmente en el caso de duda, una cuestin de optar principalmente por tal significado predominante. En el siguiente caso, asimismo el primero con el que abrimos la investigacin, es de sospechar que primarias en el sentido primrval no es el significado predominante de la palabra. Poniendo como ejemplo para el efecto de contraste: las investigaciones primarias y las necesidades primarias.

    Original:

    Las [sic!] candidatos republicanos que disputan unas primarias por competir por la presidencia de Estados Unidos coinciden en su radical rechazo de la reforma sanitaria emprendida por Obama.

    Traduccin:

    De republikanska kandidaterna tvlar om en primr fr ordfrandeskapet i USA r eniga i sitt avvisande av radikala hlsovrdsreform utfrs av Obama.

    En nuestro diccionario (Norstedts spansk-svenska lexikon), la acepcin intencionada es la tercera acepcin en funcin de susbstantivo s de la palabra:

    primario

    I adj1 pprriimmrr, ggrruunnddllggggaannddee {necesidades -as}, ggrruunndd-- {enseanza -a}, bbaass-- {conocimientos ~s} 2 pprriimmiittiivv {instintos ~s} II s1 f skol. lgstadium, mellanstadium 2 m geol. paleozoikum3 fpl polit. primrval

    Es obvio que la traduccin de primarias a primr es incorrecta. La primera sospecha que nos planteamos es que la acepcin correcta, primrval, simplemente no est incluida en el diccionario. En cualquier traduccin, la opcin de dejar una palabra en blanco no es ninguna opcin a menos que se opte exitosamente por alguna clase de reconstruccin usando otras

  • - 18 -

    estrategias. No lo intentaremos justificar estadsticamente porque no nos es posible, pero cabe imaginarse, como ya hemos mencionado, que la acepcin primrval no es la ms frecuente del vocablo primarias. Probablemente la relacin entre la acepcin primrval de primarias es parecida, por su escasez de uso, a la relacin entre la acepcin spanskt statligt lotteri y su significante (la) primitiva. A continuacin ofrecemos un par de ejemplos contrastantes para intentar convencer de que primitiva tiene otros usos ms predominantes: la gente primitiva, la funcin primitiva, la poca primitiva de la humanidad, etc.

    En cualquier caso y siguiendo nuestra conviccin de que provocando otros contextos el resultado de la traduccin puede ser distinto, resulta que la acepcin primrval s existe en el diccionario del programa. Es demostrado mediante la siguiente traduccin:

    Versin provocada:

    En las elecciones gan las primarias.

    Traduccin:

    I valet vann han primrvalen.

    Por lo tanto queda un tanto ms demostrado, adems, que el programa elige entre las posibles acepciones de una palabra segn las otras palabras en su entorno ms cercano. En el caso visto no podemos realmente hablar de un contexto, porque slo hemos alimentado el programa con una frase. Aun as, esta ltima traduccin descontextualizada es correcta y la de nuestro corpus, con todo su contexto, no lo es. Por lo tanto, en lugar de hablar de contexto en este caso tenemos que hablar de cotexto18:

    cotexto

    s. m. Conjunto de elementos lingsticos que incluyen, preceden o siguen a una palabra u oracin y que pueden determinar su significado o su correcta interpretacin. | contexto.

    (http://es.thefreedictionary.com/cotexto)

    En nuestra traduccin provocada, nos imaginamos que debe de ser la concordancia con elecciones lo que le atribuye la acepcin correcta (las) primarias/primrvalen. Este no es el caso, comprobado mediante la siguiente traduccin, substituyendo En las elecciones por En el verano:

    Versin provocada:

    En el verano gan las primarias.

    Traduccin:

    18 La palabra no existe en el diccionario de La Real Academia Espaola en Internet.

  • - 19 -

    P sommaren vann han primrvalen.

    La palabra clave para la correcta interpretacin de primarias parece ser gan. Sin embargo, es curioso que si la remplazamos por perdi la traduccin vuelve a ser incorrecta.

    Versin provocada:

    En el verano perdi las primarias.

    Traduccin:

    P sommaren vann han den primra.

    La distribucin estadstica la frecuencia de uso entre ganar o perder unas elecciones, por lgica pura, debe de ser aproximadamente un 50% para cada una de las dos opciones. Es igual de comn hablar de haber perdido unas elecciones que haberlas ganado. Incluso se podra argumentar que es ms frecuente perder unas elecciones que no ganarlas, habiendo muchas veces ms candidatos o partidos polticos que dos. Por lo tanto es extrao que nicamente el verbo ganar active la traduccin intencionada. Con el fin de investigar si otras palabras adyacentes, adems especialmente vinculadas al discurso poltico, provocan algn cambio de la traduccin, alimentamos el programa con el siguiente texto:

    Versin provocada:

    Hay tres partidos en el Parlamento. En Suecia no es obligatorio el19 votar. Los socialistas perdieron unas primarias.

    Traduccin:

    Tre partier i parlamentet. I Sverige r det inte obligatoriskt att rsta. Socialisternafrlorade en primr.

    Vemos que el contexto ms cercano no cambia el resultado, y lo hemos intentado sin provecho con unas cuantas ms palabras que tienen relacin con el significado poltico de primarias. Por pura casualidad, una vez que intentamos otras combinaciones, nos olvidamos de escribir el punto (.) al final de la oracin, y el resultado fue el siguiente:

    Versin provocada:

    En el verano perdi las primarias

    Traduccin:

    P sommaren frlorade primrvalen

    19 Aprovechando el caso para evidenciar que el en este caso se traduce debidamente a att.

  • - 20 -

    Este resultado es realmente extrao. Es extrao porque hemos meditado sobre la posibilidad de que un factor posible para deducirle la funcin substantiva hubiera podido ser todo lo contrario a quitarle el punto [ . ]: ponrselo. Lo cual cancelara la de otro modo posible expansin de la frase.La ausencia de sustantivo atribuido es el motivo por el que primarias arriba la interpretamos en su sentido poltico; primarias ya se interpreta como substantivo, y por lo tanto sus acepciones adjetivales no compiten. Se ve tentadora la idea de sugerir que la ausencia de sustantivo referenciado ejecuta el significado de primrvalen. La ausencia de primrvalen se observa mejor reduciendo los componentes necesarios para esta percibir esta acepcin:

    Versin provocada:

    Perdi las primarias.

    Lanzamos al aire la idea de que la probablemente la mayora de los lectores en este momento seguramente leen perfectamente el equivalente aproximativo a no obtuvo suficientes votos y por eso perdi las elecciones. Esto es un efecto de haber introducido el tema, habiendo ofrecido suficiente contexto. La carga semntica o memoria referencial es suficiente para vincular el significado visto. Es incluso tentadora la idea de sugerir que esta ltima versin, F, no posibilita ningn otro significado. Esto nos atrevemos a decir es producido gracias al fenmeno de la elipticidad que tanto el sueco como el espaol muchas veces presentan. Entre [ ] el sustantivo referido que es redundante para la producir la referencia correcta.

    Las pruebas de acceso a la universidad le han ido bastante mal. Las primarias[pruebas de acceso] las perdi.

    De momento no tenemos prueba de que el programa tenga en cuenta el contexto. Vemos que la posibilidad de expansin de contexto no se cierra mediante un punto [ . ], al contrario de ese modo el programa interpreta el significado correcto. Este resultado se debe a que, por alguna razn y de algn modo, si el punto no est, el programa sigue buscando otros significados y adems encuentra el apropiado: primrvalen. No hay otra explicacin, debido a que la presencia o ausencia de este punto no contiene ninguna substancia semntica20. Si el programa, cuando el punto no est, se inspira a la eleccin correcta basado en algo, este algo no est presente en nuestra pantalla. Esto segn Domeij (2008) de todos modos no tendra que influir, porque segn l no hay ningn programa de traduccin automtica que tenga en cuenta el contexto:

    Los programas de traduccin automtica de hoy en da traducen oracin por oracin. No se acuerdan de oraciones anteriores y por eso no pueden manejar dependencias textuales, por ejemplo referencias, que transcienden los lmites de la presente oracin y que pueden ser importantes para la traduccin. (Domeij 2008: 95)

    La cuestin natural que uno se plantea es la distincin exacta entre cotexto y contexto. Pero en nuestro caso da lo mismo; las fuentes de la versin C y la D slo se difieren en que la C tiene el

    20El uso o no uso de las comas [ , ]s son capaces de ejercen influencia semntica significativa.

  • - 21 -

    punto [ . ] Cmo es posible que sin aadirle por lo menos otra palabra substancial y solamente eliminando en punto se consigue activar la traduccin correcta?

    Con mucha ms claridad hemos visto cmo, aunque no entendamos en qu se distingue la influencia entre ganar y perder, el cotexto altera la traduccin de la palabra en cuestin.

    3.1.2

    Presidencia (-)

    El error producido en la traduccin de presidencia a primera vista no parece pertenecer a la clase de errores que tengan un alcance general. El resultado es inteligible aunque lejos de idiomtico, siendo la traduccin ordfrandeskapet lo ms parecido a un litotes en el contexto dado:

    Original:

    Las21 [sic!] candidatos republicanos que disputan unas primarias por competir por lapresidencia de Estados Unidos []

    Traduccin:

    De republikanska kandidaterna tvlar om en primr fr ordfrandeskapet i USA []

    El motivo por el que la incluimos es para ilustrar el carcter polifactico de la polisemia; la palabra gira alrededor de una constante semntica (por lo tanto es cuestin de polisemia y no homonimia):

    presidencia (Norstedts spansk-svenska lexikon)

    f1 presidentur, presidentskap, ordfrandeskap, ledarskap 2 presidentpost; ordfrandepost 3 mandattid fr president, ordfrande o.d. 4 presidents mbetsrum; ordfrandes mbetsrum5 ledning, presidium

    A continuacin provocaremos cotextos alterados para ver si se produce la traduccin intencionada. El primer intento consiste en preceder Estados Unidos a la presidencia para averiguar si de tal modo se activa la acepcin intencionada:

    Original alterado:

    21 El cambio de Las al correspondiente Los no cambia la traduccin.

  • - 22 -

    En Estados Unidos los candidatos republicanos disputan unas primarias por competir por la presidencia.

    Traduccin:

    I USA republikanska kandidaterna tvlar om en primr krning frordfrandeskapet.

    La alteracin del cotexto, aadiendo Estados Unidos no produjo el cambio que nos habamosesperado: ordfrandeskapet sigue ah, pero en lugar de tvlar om en primr fr ordfrandeskapet(Original) obtenemos tvlar om en primr krning. Pero como no afecta a la traduccin de presidencia seguimos la alteracin. Para descartar que la distancia entre Estados Unidos y presidencia influya negativamente en la traduccin, le ofrecemos otra combinacin al programaen la que Estados Unidos est a menos distancia textual de presidencia (una palabra en lugar de nueve). Esta vez tambin pos posicionada:

    Versin provocada:

    La presidencia en Estados Unidos dura cuatro aos.

    Traduccin:

    Ordfrandeskapet i USA r fyra r.

    El hecho de haber acercado Estados Unidos a presidencia no gener el cambio deseado. La traduccin sigue siendo errnea, y ahora lo es doblemente. Ahora presidencia no acepta ni presidentposten ni ordfrandeskapet como traduccin, sino requiere mandatperioden. La modificacin de significado vista es la suma de varios factores. La duracin de la presidencia no empuja necesariamente a la traduccin mandatperioden. Lo probamos alterando solamente la preposicin:

    Versin provocada:

    La presidencia de Estados Unidos dura cuatro aos.

    Traduccin (manualmente perfeccionada):

    USA:s ordfrandeskap varar fyra r.

    Estamos convencidos de que la cosa no termina aqu, pero con toda claridad podemos ver que, indudablemente, el cambio de una preposicin puede cambiar el significado de otra palabra. Anotamos y al mismo tiempo nos apartamos de esta observacin, la guardamos para el estudio especfico de las preposiciones, pero que fortalece nuestra sospecha en la parte terica de que los significados de las palabras de algn modo se rozan o transfieren. Lo interesante es tambin notar que Estados Unidos no es la palabra que obliga a traducir presidencia con presidentpostental y como nos habamos imaginado.

  • - 23 -

    Volvemos al original, y ahora lo alteramos quitando algunas palabras en lugar de aadir palabras nuevas: (Entre [ ] las palabras elididas)

    Original alterado:

    Las [sic!] candidatos republicanos que disputan unas primarias por [competir por] la presidencia de Estados Unidos []

    Traduccin:

    De republikanska kandidaterna tvlar om presidentvalet primrvalen i USA []

    El resultado es una transformacin un tanto extraa pero en todo lo esencial correcta. Elprograma hace una fusin verbal no del todo deseada entre primarias y presidencia: presidentvalet. Pero por lo menos el lexema22 correcto de president en lugar de ordfrande ya es discernible. Primarias parece haber sido traducida correctamente una vez (primrvalen) y ms bien transferida indeseadamente otra vez (president[valet]). Disminuyendo la distancia entre primarias y presidencia parece ser que se obtiene un efecto sinrgico: si primarias es traducido debidamente, presidencia tambin lo es, o por lo menos estira hacia serlo. Para ver si la traduccin correcta de primarias es lo que influye beneficiosamente a la traduccin de presidencia, remplazamos primarias por secundarias y la traduccin de presidencia vuelve a fallar.

    Quiz presidencia le de el toque semntico correcto a primarias, y primarias en tal caso a su vez la traduccin correcta de presidencia. Sabemos que secundarias no ayuda a la traduccin de presidencia, pero mucho ms no nos dice debido a que presidencia no puede (!) ayudar a la traduccin de secundarias.

    Estos resultados no descartan que el programa pueda tener otros mecanismos de razonamiento,pero combinado con las traducciones provocadas ya intentadas nos demuestra dos cosas:

    A)

    La presencia morfolgica de Estados Unidos en el cotexto no provoca la traduccin correcta, ya sea que se anteponga o posponga el nombre de la nacin. De todos modos, como ya hemos visto,tal razonamiento podra ser arriesgado y por lo tanto la presencia del nombre propio de una nacin en el cotexto no es indicacin suficiente para elegir la acepcin sueca president.

    22 lexema. (RAE)

    (Del gr. , palabra, y -ema).

    1. m. Ling. Unidad mnima con significado lxico que no presenta morfemas gramaticales; p. ej., sol, o que, poseyndolos, prescinde de ellos por un proceso de segmentacin; p. ej., terr, en enterris.

  • - 24 -

    B)

    Los factores cotextuales que provocan la traduccin debida tanto de primarias como de presidencia se ven aniquilados por la presencia de por competir.

    Habiendo desentraado los factores decisivos dejamos este caso con esperanza de que nuestra investigacin que sigue pueda echar ms luz sobre la dinmica de la traduccin automtica.

    3.1.3

    Coincidencia (-)

    Las dos anteriores palabras que hasta ahora hemos analizado tienen por lo menos dos cosas en comn: es fcil distinguir entre los significados apropiados y los menos o no apropiados, y no ha sido difcil motivar por qu una traduccin es correcta y otra no. En la siguiente traduccin sigue siendo obvio que la palabra tillfllighet no coincide con la intencin del texto original23, pero a primera vista no podemos ofrecer ninguna motivacin espontnea de por qu la consideramos errnea.

    Original:

    All sealaron sus diferencias y peculiaridades, pero sobre todo hicieron notar sums notable coincidencia: su rechazo unnime a la reforma sanitaria emprendida por el presidente Barack Obama.

    Traduccin:

    De pekade ut sina olikheter och egenheter, men framfr allt noterade hans1 mest anmrkningsvrda tillfllighet2: deras3 enhlliga frkastande av sjukvrdsreformen vidtas av president Barack Obama.

    coincidencia f (Norstedts)

    1 sammanfall, sammanfallande {la ~ de las fechas}2 verensstmmelse, likhet {la ~ de opiniones} 3 sammantrffande, tillfllighet, slump; por pura ~ av en tillfllighet, av en ren tillfllighet

    La segunda acepcin es la intencionada, pero como podemos ver el ordenador para ha escogido la tercera. Cotextualmente hablando, se ve casi imposible, o muy lejano, que la intencin del autor hubiera podido ser la tercera acepcin, es decir que su rechazo unnime a la reforma sanitaria emprendida por el presidente Barack Obama hubiese sido por azar o eventualidad, equivalente a Vaya casualidad que pensamos lo mismo! Sin embargo, ms claro est que lo que el autor quiere decir es que coincidan, pensaban lo mismo, no que fuera una sorpresa o algo imprevisto que lo

    23 Por lo cual es tentadora idea de llamarlo la no coincidencia de la coincidencia.

  • - 25 -

    hicieran. Esta conclusin se basa en lo que ya habamos sospechado en las premisas del trabajo, es decir que el contexto algunas veces no est basado en el texto no es ningn contexto tcnicamente hablando sino ms bien en la nocin de conocimientos enciclopdicos; el proponer que dos o ms polticos en un encuentro expresen asombro por tener la misma ideologa que otras personas del mismo bloque poltico24 se ve francamente casi impensable; a nuestro juicio todo lo contrario suele ser lo ms observado, siempre estn de acuerdo dentro del mismo grupo poltico.No obstante creemos que en el caso visto ya existe algn factor que en el momento de la lectura ya imposibilita que se pueda tratar de la clase de coincidencia imprevista. El motivo por el que sugerimos que en el caso visto no existe ninguna duda es por motivo de la relacin que sumantiene con coincidencia; si la coincidencia es propiedad de dos o ms personas se descarta que se pueda hablar de la otra clase de coincidencia, la casual.

    Si aprobamos la hiptesis de que su ejerce de desambiguador en el contexto en el que estamos analizando la presente coincidencia, completamos la idea sustituyendo su por una:

    Original alterado:

    All sealaron sus diferencias y peculiaridades, pero sobre todo hicieron notar unamuy notable coincidencia: su rechazo unnime a la reforma sanitaria emprendida por el presidente Barack Obama.

    El hecho de que la coincidencia ya no sea atribuida a las personas (su ms notable conicidencia la coincidencia de los polticos) libera la palabra de su monosemia y activa su potencial polismico, posibilitando ms de una interpretacin; la coincidencia ahora puede equivaler tanto a igualdad de ideas como a casualidad.

    Naturalmente, como ya hemos sugerido, recordamos una vez ms que la nocin amplia de lo que puede considerarse un contexto sin duda influye en la interpretacin a favor de la idea que ms armoniza con el resto del texto y con el concepto compartido de cmo funcionan las cosas en el mundo real. No es probable que los polticos que hagan notar su coincidencia hablen de que se encontraron todos juntos en el ascensor un da, o que todos llevaban corbatas negras y que eso pegaba muy bien. Lo que realmente ms que su, una o cualquier otra palabra adyacente atribuye la acepcin correcta, y por consecuencia discrimina los otros significados potenciales, en estecaso es la constitucin explcita de esta coincidencia: su rechazo unnime a la reforma sanitaria emprendida por el presidente Barack Obama.

    24 Izquierda o derecha, tradicionalmente.

  • - 26 -

    3.1.4

    Beneficios (-)

    Beneficios constituye una palabra ideal por figurar dos veces una vez indebidamente traducida y una vez bien. Comenzaremos analizando el caso errado por ser la primera ocurrencia de la palabra:

    Original I:

    Tal como precis en su da en estas pginas Tomothy Garton Ash, los beneficios de las diez primeras aseguradoras estadounidenses subieron un descomunal 428% entre 2002 y 2009.

    Traduccin:

    Som framgr vid den tidpunkt p dessa sidor Timothy Garton Ash, frdelarna med de tio bsta amerikanska frskringar steg en jttestor 428% mellan 2002 och 2009.

    Los beneficios en este caso han sido interpretados como privilegios, en sueco frdelarna. El problema es el de siempre, que segn la acepcin intencionada en el texto original es necesario escoger entre varios distintos significantes suecos, que entre ellos no mantienen ninguna relacin de sinonimia absoluta. En espaol se usa el mismo significante, beneficio, tanto para referirse a algo bueno en general como para referirse a una ganancia econmica. En sueco, si se trata de un beneficio fundamentalmente no econmico existe una serie de palabras apropiadas: nytta, frmn, frdel. Un segundo grupo posiblemente pueda comprender tanto el significado de beneficio general como el de beneficio econmico, probablemente inclinndose ms hacia el significado de beneficio general: utbyte, behllning. Finalmente otro grupo de palabras vinning, profit, vinst denotan principalmente ganancia econmica pero tambin pueden referirse a una ganancia general. El problema es que el programa de traduccin ha escogido un equivalente sueco, frdelarna, que en sueco de por s no denota ganancia econmica. Con ello ya fall la traduccin, pero hagamos el experimento de remplazar frdelarna por alguna de las otras palabras ofrecidas para ver si hubieran funcionado (corrigiendo al mismo tiempo los otros errores para facilitar la comprensin):

    Vinningen/profiten/vinsten fr de tio bsta amerikanska frskringsbolagen...OK

    Behllningen fr de tio bsta amerikanska frskringsbolagen...OK

    Utbytet25 fr de tio bsta amerikanska frskringsbolagen...ERROR

    25 A primera vista parece que utbytet en sueco no pueda denotar ganancia econmica, pero un simple

    ejemplo como Mitt utbyte av affren blev 1000 SEK debe ser suficiente para descartar tal idea. Sin

    embargo, algn factor intrnseco de la palabra, posiblemente la idea de reciprocidad, hace que no funcione en este contexto.

  • - 27 -

    Nyttan/frmnen/frdelen fr de tio bsta amerikanska frskringsbolagen...ERR.

    El motivo por el que el programa no interpret los beneficios en el sentido econmico de palabra probablemente sea debido a que el programa no haya encontrado los elementos cotextuales queconduzcan a la acepcin econmica. Para un ser humano probablemente sea suficiente leer los beneficios de las diez primeras aseguradoras para activar la acepcin correcta, es decir la econmica. Parece ser que la esencia semntica de aseguradoras es lo que activa la acepcin deseada y descarta las dems. Esta esencia semntica se debe a que todas las aseguradoras en fondo son empresas, y la finalidad de cualquier empresa es ganar dinero. Del mismo modo, el siguiente cotexto imaginado debe ser suficiente para descartar la acepcin econmica de la palabra:

    Versin provocada:

    Los beneficios de hacer deporte son enormes.

    Traduccin:

    Frdelarna med idrott r enorma.

    Por lo tanto vemos una vez ms que el programa toma en consideracin las palabras ms adyacentes e intenta adaptar la traduccin a significados congruentes. Por el mismo motivo la siguiente traduccin tambin provocada resulta correcta:

    Versin provocada:

    Los beneficios se elevaban a 1.000.000 dlares.

    Traduccin:

    Vinster uppgick till $ 1.000.000.

    Favorablemente para nuestra bsqueda del factor cotextual determinante, como ya hemos avisado, el texto ofrece la misma palabra en otro cotexto, y en ese caso es traducida debidamente:

    Original:

    Que nadie nos toque nuestro suculento balance empresarial, que nadie nos prive de nuestros bonus astrolgicos, que nadie pretenda aminorar los pinges26 beneficiosque nos reporta un sistema de asistencia privada ventajosamente controlado por nuestros poderosos lobbies y corporaciones, cuya meta intrnsecamente desigual, agudamente insolidaria, todos lo sabemos no es precisamente la igualdad.

    26 Norstedts spansk-svenska lexikon: Pinge: adj (fem. lika) rriikklliigg, yymmnniigg {~s beneficios}

  • - 28 -

    Traduccin:

    Lt ingen berra oss balansera vr vr verksamhet saftiga, ngon bervar oss vra astronomiska bonusar, lt ingen minska de enorma vinster vi redovisar ett privat vlfrdssystem med frdel styras av vra kraftfulla lobbygrupper och fretag vars ml i sig olika, akut unsupportive, som vi alla vet r inte exakt lika.

    Si en este caso quitamos la palabra pinges el programa vuelve a traducir beneficios con frdelar. Obviamente ninguna de las otras palabras, por ejemplo balance empresarial, bonus astrolgicos o corporaciones, inducen el programa a escoger la acepcin econmica de la palabra beneficios.Sin embargo, tampoco el adjetivo pinges, tal como sera imaginable, ejerce la acepcin econmica por defecto, lo cual demostramos mediante el siguiente ejemplo provocado:

    Versin provocada:

    Los pinges beneficios de hacer deporte son enormes.

    Traduccin:

    De stora frdelarna av sport r enorma.

    Aunque en el ejemplo arriba hayamos precisado Los pinges beneficios el programa no escoge lo que sera la acepcin errnea de beneficio econmico. Por lo tanto podemos concluir que la palabra pinges es decisiva para que el programa elija la acepcin econmica de la palabra beneficios, pero tambin vemos que no es la nica palabra que lleva a esa eleccin y que las otras palabras del enunciado perfectamente pueden cancelar tal efecto o que por lo menos pingesnecesita ser acompaada por otras palabras de carcter econmico para causar la traduccin de su significado econmico. Sin embargo, en un cotexto donde las dems palabras lo permiten, como en el primer ejemplo, la palabra cobra preferencia hacia la acepcin econmica intencionada:

    Original alterado (aadiendo pinges):

    Tal como precis en su da en estas pginas Tomothy Garton Ash, los pingesbeneficios de las diez primeras aseguradoras estadounidenses subieron un descomunal 428% entre 2002 y 2009.

    Traduccin:

    Som framgr vid den tidpunkt p dessa sidor Tomothy Garton Ash, de enormavinster de tio bsta amerikanska frskringar steg en jttestor 428% mellan 2002 och 2009.

    Una vez ms podemos concluir que el programa, al igual que en el caso de primarias, ejecuta un clculo multifactorial que induce un cotexto que a su vez desencadena entre los significantes del sueco uno que le resulta el ms apropiado.

  • - 29 -

    3.1.5

    Estado (-)

    La palabra estado tiene una gran cantidad de acepciones. Aparte de la situacin polismica originada por el sustantivo, tcnicamente hablando estado tambin podra ser el participio del verbo estar. Y en teora, Estados Unidos, palabras que se repiten varias veces a lo largo del corpus, tambin hubiera podido desencadenar otra traduccin que la favorablemente obtenida: USA. Por ejemplo Frenade Tillstnden.

    Siempre existe algn nexo semntico, aunque a veces vago, entre las acepciones de la palabra analizada. Incluso alguna clase de conexin entre las dos clases de coincidencias. Aunque la palabra estado no sea ningn homnimo si nos dejamos regir por el criterio que impone la necesidad de por lo menos dos orgenes separados que no parece tenerlo ya que la entrada en el diccionario es una sola el nexo entre sus significados es borroso y difcil de motivar. No vemos ninguna semejanza obvia entre estado con el significado condicin y estado con el significado pas. Precediendo lo que ms adelante observaremos acerca de la morfologa de las palabras, es interesante meditar un tanto sobre el hecho de que el sueco para la acepcin ms o menos equivalente a condicin posee una palabra que morfolgicamente hablando es similar a la otra alternativa. Mediante el siguiente ejemplo lo evidenciamos:

    estado = stat (aprox. Estado federal)

    estado = stadium (aprox. condicin)

    En cualquier caso, aunque se consideren estas dos acepciones como un caso de sinonimia u homonimia, la siguiente traduccin de la palabra estado no reproduce correctamente el texto original:

    Original:

    Cmo el estado ms rico del planeta puede mantener a unos 50 millones de sus ciudadanos desasistidos mdicamente, a pesar de los esfuerzos []

    Traduccin:

    Hur rikaste tillstndet p planeten klarar cirka 50 miljoner medicinskt missgynnade medborgare, trots de historiska insatser []

    Aunque el programa haya fallado en la traduccin de estados, notamos un fenmeno que merece ser mencionado. La palabra sueca tillstndet aparte de poder significar la condicin tambin puede significar el permiso: Tillstndet har gtt ut El permiso ha caducado. La palabra sueca tillstndet posee a su vez una ambigedad inherente de significados, adems a nuestro parecer un caso de ambigedad contrastiva (aunque tcnicamente no sea un homnimo). Por lo tanto, la dificultad en el caso de querer traducir estado/condicin a tillstndet/condicin no sera slo elegir la acepcin correcta en el texto fuente, sino tambin reproducir su palabra junto con un cotexto adecuado que activara su acepcin correcta en la lengua meta. Si el cotexto en el lado

  • - 30 -

    sueco presentara el potencial (o la obligacin) de activar la acepcin no correcta, la traduccin podra generar tillstndet/permiso. Esta certidumbre nace de la comprensin hasta ahora aportadade que el co(n)texto altera, y a veces drsticamente, las interpretaciones de las palabras. Esto tambin resulta en que no existe ninguna garanta de que (re)traduciendo tillstndet del sueco al espaol necesariamente tuviera que (re)generar la palabra estado en el lado espaol. Se puede visualizar de la siguiente manera: [ > significa traduccin]

    Estado > tillstnd

    Tillstnd > permiso

    Esto aparte, volviendo a la traduccin arriba observada, la cuestin tiene que ser, una vez ms, averiguar qu otras palabras cumplen la funcin de desambiguar la palabra estado y atribuirle el significado intencionado. A primera vista, el estado ms rico del planeta ya es suficiente para denotar que se trata de un pas y no de una condicin. El estado ms rico probablemente ya sera incluso suficiente, pero podra todava referirse a condicin visto en el siguiente ejemplo:

    Hallando a Dios entrars en el estado ms rico de tu vida27.

    Elaborando todava un poco ms con las exclusiones semnticas que nos imaginamos son producidas por el cotexto, el estado del planeta, ya sea el ms rico o el ms pobre, no necesariamente tiene que referirse a una nacin. Lo que a primera vista pareca ser un cotexto discriminante no lo es en vista de la siguiente construccin en la que se habla de un estado condicin:

    El estado ms pobre del planeta est todava por venir; si seguimos as nos quedaremos sin materias primas y las contaminaciones impactarn sobre la salud de todos.

    Dos cosas vamos a mencionar. Primero, el programa atribuye exitosamente el significante apropiado, stat, en los casos en los que Estado aparece con E mayscula28. Segundamente, elcorpus con el que trabajamos fue procesado por Google Translate en enero o febrero del 2012. A fecha presente, diciembre de 2012, el ejemplo fallido que hemos visto es traducido debidamente. Esto indica con toda claridad que Google Translate va evolucionando y mejorando las estrategias de la traduccin.

    27 Tambin observamos que este ejemplo, en el que estado denota condicin, cambia el significado de rico (adinerado) a rico (agradable).

    28 Por el mismo motivo suponemos que es una estrategia lingstica desambiguadora que existan dos maneras

    de escribir la palabra polica: polica y Polica.

  • - 31 -

    3.1.6

    Manifestaciones (+)

    (una) serie (de) (+)

    Cuotas (+)

    Interferencia (+)

    Aplicacin (+)

    En el anlisis de estas cinco palabras vamos a matar dos pjaros en un tiro, lo cual en sueco equivaldra a sl flera flugor i en smll. Esto es una traduccin idiomtica que, traducidaliteralmente, equivaldra a pegar varias moscas en un golpe. Sin embargo, la traduccin literaria no sirve, pegar varias moscas en un golpe se entendera pero no sera idiomtico. Sugerimos que la caracterstica principal de cualquier expresin idiomtica es que se compone de una serie de palabras que ninguna de ellas puede ser sustituida por otra palabra sinnima, ni en la lengua fuente ni en la lengua meta. Por lo tanto, las expresiones idiomticas no buscan el equivalente perfecto palabra por palabra, sino el equivalente perfecto a la idea generada por un conjunto de palabras. La traduccin idiomtica de las metforas no se beneficia se perjudica de la relacin sinonmica entre dos palabras de dos lenguas; lo visto en el diccionario no sirve. Para corroborarlos vamos a dar otro ejemplo, quien no llora no mama, que al sueco no se traducira mediante: den som inte grter fr ingen tutte. Las expresiones idiomticas a nivel metafrico son las metforas que han cobrado tanta conciencia entre los hablantes que tal palabras expresan mucho ms que lo que las palabras en s realmente aportan. Por consecuencia, las dos caractersticas principales de las expresiones metafricas idiomticas parece ser que las palabras usadas son obligadas y el que significado de tales palabras es ms amplio de lo que las palabra realmente expresan.

    As bien, hemos dicho algo acerca de lo que experimentamos como las caractersticas generales de las expresiones idiomticas, caractersticas que ahora las relacionaremos con las cinco palabras que vamos a analizar. Estas cinco palabras tienen en comn con las metforas idiomticas el hecho de que las traducciones ms obvias no son las ms convenientes. Si se eligen las traducciones ms obvias el resultado no es idiomtico. Las cinco palabras que todas han sido traducidas debidamente tienen una cosa en comn: no han sido traducidas por un equivalente sueco morfolgicamente ms similar, ms obvio, que en todos los casos de las cinco palabras escogidas existe. En cuestin de palabras aisladas, el fenmeno de hacerse un flaco servicio equivalente a no traducir idiomticamente se llama falsos amigos:

    El trmino [falsos amigos] ahora se refiere al fenmeno especfico de interferencia lingstica que consiste en que dos palabras en dos o ms lenguas naturales son grficamente o fonticamente idnticas o muy parecidas; aun as, sus significados pueden ser total o parcialmente distintos. Dicho de otra manera, falsos amigos son aquellas palabras que comparten significante pero difieren total o parcialmente en cuanto a sus significados. (Chamizo-Domnguez 2008: 127)

    Un ejemplo muchas veces observado en el discurso oral, en la interpretacin espontnea/improvisada del sueco al espaol, es la mala transferencia de la palabra sueca

  • - 32 -

    konkurrens a concurrencia. Sin embargo y por lo visto, esta correspondencia no es siempre errnea. En un contexto estrictamente econmico, segn el diccionario, concurrencia s resulta ser la palabra apropiada:

    concurrencia (Norstedts spansk-svenska lexikon)

    f1 ttiillllssttrrmmnniinngg; ppuubblliikk2 ssaammmmaannttrrffffaannddee {la ~ de varios factores} 3 ekon. kkoonnkkuurrrreennss4 hhjjllpp, bbiissttnndd {prestar su ~}

    No obstante, nos atrevemos a decir que en los contextos ms comunes konkurrens tiene que traducirse por competencia. Y que en muchos contextos incluso econmicos tambin es ms comn la palabra ms comn. En el mismo diccionario de Norstedts, pero en la parte sueco-espaola, konkurrens presenta cero potencial polismico si el fenmeno de la polisemia se mide mediante el nmero de posibles sinnimos29.

    konkurrens (Norstedts svensk-spanska lexikon)

    s competencia

    En cualquier otro contexto no econmico la traduccin apropiada sera competencia. Por ejemplo: Los tres nicos chicos de la clase no recibieron a Pedro con manos abiertas ya que no queran la competencia de otro macho.

    Somos conscientes de que los falsos amigos cuando se producen por seres humanos, la mayora de las veces se debe a la semejanza fontica entre las palabras de las dos lenguas. Son ms un fenmeno del lenguaje orado que del escrito. En la oralidad los falsos amigos son ms que nada el resultado de la homofona. La traduccin automtica, sin embargo, no interpreta los sonidos de las palabras. El fenmeno de los falsos amigos en el lenguaje escrito, por lo tanto, se debe a que en el diccionario para cada una de las cinco palabras que a continuacin analizaremos existe una palabra sueca morfolgicamente parecida. Veamos los ejemplos:

    Original:

    Una de las ms obscenas manifestaciones de esa posicin poltica, filosfica y social radicalmente enemiga de la igualdad, nos la sigue ofreciendo el sector sanitario estadounidense, negocio de dimensiones colosales, en manos de una seriede todopoderosas sociedades aseguradoras y farmacuticas, regidas por una elite sin escrpulos.

    Traduccin:

    29 Cosa que veremos ms adelante no es siempre una fiable indicacin de que la palabra no sea polismica.

  • - 33 -

    [] obscena uttryck []

    La traduccin, a nuestro parecer, es totalmente correcta. Se evita la palabra sueca manifestationerque por la semejanza formal se asociara con alguna clase de protesta.

    Original:

    [] una serie de todopoderosas sociedades aseguradoras y farmacuticas []

    Traduccin:

    [] ett antal frskringsbolag och lkemedelsfretag allsmktig []

    La traduccin es idiomtica y la ms adecuada, descartando: serie, rcka, rad, radda, samling,etc. En este caso, si el programa hubiera optado por en serie frskringsbolag no la tacharamos de incorrecta, pero por algn motivo tampoco la ms ideal. Dicho de otro modo: no sera idiomtica. Se podra sugerir espontneamente que en serie en sueco significa cantidad limitada y preferentemente connota algo despus de otro: el pueblo ha sufrido una serie de robos byn har utsatts fr en serie inbrott.

    Original:

    [] ganancias sobre la base de cuotas muy elevadas []

    Traduccin:

    [...] vinster p grundval av mycket hga avgifter

    La palabra sueca kvoter es la que morfolgicamente ms asimila la morfologa de la palabra cuotas. Sin embargo kvot en sueco connota, tal como en el espaol, un porcentaje pero sin la posibilidad de denotar lo que un porcentaje en este caso implica: lo que se paga por un seguro. Probablemente la palabra sueca ms apropiada en este cotexto sera premier30

    Original:

    [] sin ningn tipo de nociva interferencia estatal.

    Traduccin:

    30La cual si al revs a nuestro estudio se tradujera espontneamente del sueco al espaol, cayendo en la trampa

    de los falsos amigos, fcilmente se podra confundir por equivaler a premios.

  • - 34 -

    [...] utan ngon skadlig statlig inblandning.

    La traduccin es correcta e idiomtica. En este caso, contrario a los tres anteriormente vistos, el diccionario avisa de que interferens es un tecnicismo perteneciente a la fsica:

    interferencia (Norstedts spansk-svenska lexikon)

    f 1 ingripande, inblandning; hinder

    2 fys. interferens; radio. strning

    Sigamos con la palabra aplicacin, cuyo carcter polismico ya lo hemos tocado en la introduccin del trabajo:

    Original:

    [] las autoridades demcratas gobernantes han iniciado gradualmente su aplicacin.

    Traduccion:

    [] har myndigheterna brjat successivt styr demokraterna genomfrande.

    Evitando (por ejemplo): La aplicacin dej de funcionar.

    Segn quien lea la traduccin, la eleccin de un vocablo no idiomtico no causara necesariamente ninguna falta de inteligibilidad del enunciado. La preferencia arriba vista en los cinco ejemplos tienen un factor en comn: la evasin del equivalente morfolgico sueco que se basa en un lexema latn (o griego si as fuera). Esta tendencia la hemos evidenciado muchas veces en el contraste entre el espaol y el sueco, lo cual segn toda lgica depende de que el sueco es una lengua germnica y el espaol una romance. Es interesante que la mquina sea capaz de discriminar estas semejanzas formales que perfectamente hubieran podido producir un espejismo semntico no deseado.

    La mayora de los libros consultados acentan que la traduccin automtica es menos costosa y ms fructuosa si se ejecuta entre dos lenguas que pertenecen a la misma familia lingstica, beneficindose por ejemplo la traduccin automtica entre el espaol y el cataln o viceversa.Por lo tanto el trmino inteligibilidad mutua, que suele ser uno de los ms acentuados dentro de la enseanza de segundas lenguas (L231), parece ser aplicable tambin a la traduccin automtica.

    A nuestro juicio ninguno de los cinco casos vistos son falsos amigos totales. Lo son parcialmente y sin ninguna motivacin obvia. Lo son a nivel idiomtico. En el proceso de traducir, tanto las metforas idiomticas como los falsos amigos se valen como mucho con bastante desgana de los

    31 Recordando una vez ms que de ah surgi el impulso de escribir esta tesina.

  • - 35 -

    significados de las palabras en el diccionario. Ni la semejanza sinonmica ni la semejanza morfolgica son fiables. Y el programa no cae en la trampa.

    Los posibles latinismos hubieran funcionado segn la competencia lingstica de la persona quelos lea. El concepto de lo idiomtico ms bien parece tratarse de una clase de idiosincrasia lingstica32 ante palabras cuyas races provienen del latn/griego. Fiel a su tradicin, la Real Academia Sueca en la ltima edicin de su diccionario ha excluido una gran cantidad de palabras, muchas de ellas pertenecientes a la categora de latinismos, corroborando as nuestra sospecha: abbreviera, affektera, atrofieras, etc33.

    32 idiosincrasia.

    (Del gr. , temperamento particular).

    1. f. Rasgos, temperamento, carcter, etc., distintivos y propios de un individuo o de una colectividad.

    33 http://www.svenskaakademien.se/svenska_spraket/svenska_akademiens_ordlista/exempel_pa_strukna_ord

  • - 36 -

    3.2 Los verbos3.2.1

    Coincidir (+)

    Fieles a nuestra intencin de estudiar las palabras recurrentes abriremos la seccin de los verbos con la forma verbal del sustantivo coincidencia ya visto: coincidir.

    Original:

    Las [sic!] candidatos republicanos que disputan unas primarias por competir por la presidencia de Estados Unidos coinciden en su radical rechazo de la reforma sanitaria emprendida por Obama.

    Traduccin:

    De republikanska kandidaterna tvlar om en primr fr ordfrandeskapet i USA r eniga i sitt avvisande av radikala hlsovrdsreform utfrs av Obama.

    Si en cuestin del substantivo, coincidencia, la acepcin competitiva era la que denotaba casualidad, esta posibilidad en la forma verbal se ve eliminada. Pero aun as existe la posibilidad de fallar entre las acepciones a mano segn el diccionario:

    coincidir (Norstedts)

    vb itr

    1 sammanfalla, verensstmma {estas dos piezas no coinciden}

    2 sammantrffa, ske samtidigt

    3 trffa samman, stta ihop {coincidieron en el ascensor}

    4 vara verens {coincidimos en nuestrasaficiones}; todos coinciden en que... alla r verens om att

    Para constreir el problema reduciremos los componentes cotextuales hasta el mnimo necesario para activar cada una de las acepciones arriba vistas:

    A) Las piezas coinciden.

    Traduccin obtenida: Bitarna sammanfaller.

    B) Los candidatos republicanos coinciden a nivel nacional en su ataque a los demcratas.

    Traduccin obtenida: Republikanska kandidater nationellt konsekvent attackerademokrater.

  • - 37 -

    C) Los candidatos republicanos coinciden en el ascensor.

    Traduccin obtenida: Republikanska kandidater verens om hissen.

    D) Los candidatos republicanos coinciden con los demcratas.

    Traduccin obtenida: Republikanska kandidaterna hller med demokraterna.

    El resultado obtenido es que el caso A y el caso D estn correctamente traducidas, pero B y C no. La traduccin del caso B nos hace sospechar, junto con otros factores que comentaremos ms en adelante, que el programa traduce del espaol al ingls, y luego del ingls al sueco. Usando el diccionario espaol-ingls de El Mundo en lnea, vemos la siguiente acepcin que levanta tal sospecha:

    (estar de acuerdo) to agree: en ese punto coincidimos, we agreed about that

    El encadenamiento semntico sugerido es el siguiente: coincidir > estar de acuerdo ~ ser consecuente/firme en cuestin de una idea.

    Para ver si el programa aparenta tener nocin de sujeto animado alimentamos el programa con el siguiente ejemplo:

    Versin provocada:

    Los turistas coinciden.

    Traduccin:

    Turister match.

    Afortunadamente para nuestra hiptesis (secundaria) de que el programa traduce mediante el ingls, la traduccin obtenida lo evidencia lejos de cualquier duda.

    Todo parece indicar que el programa no distingue entre sujetos animados o no. Provocamos el anterior ejemplo aadiendo un cotexto desambiguador:

    Versin provocada:

    Los turistas coinciden en la opinin.

    Traduccin:

    Turister sammanfaller i yttrandet.

    Pese a que la distancia entre el sujeto y el verbo en nuestro ejemplo provocado es la mnima posible, si el programa tiene nocin de sujetos animados la palabra turistas no ejecuta el mecanismo de eleccin apropiada. Esto nos hace pensar que los turistas puede referirse tanto a un grupo concreto de turistas como a turistas en general, por ejemplo los turistas como grupo socio-econmico ms que en calidad de seres humanos concretos. Por lo tanto cambiamos la forma plural a singular y obtenemos el siguiente resultado:

  • - 38 -

    Versin provocada:

    El turista coincide.

    Traduccin:

    Den turist instmmer.

    Otra vez ms una de nuestras sospechas se realiza. Consta en este caso de que el programa s hace distincin entre diferentes clases de sujetos. Por lo tanto interesa comprobar si otro factor cotextual puede alterar la acepcin elegida cambindola a una coincidencia espacial:

    Versin provocada:

    El turista coincide con el ladrn en el ascensor.

    Traduccin:

    Den turist sammanfaller med tjuven p hissen.

    De momento no. Para facilitarle la tarea al programa sustituimos ascensor por una ciudad:

    Original (provocado):

    El turista coincide con el ladrn en Washington.

    Traduccin:

    Den turist matchar tjuven i Washington.

    Parece ser que el programa no est programado para la tarea de desambiguar tal acepcin correctamente. Habiendo notado que matchar ahora est conjugado con un sufijo sueco vlido, -ar, levanta la sospecha de que en sueco pueda existir, ms que por influencia jergonizada, el verbo matcha. Parece que tal es el caso:

    matcha (Norstedts svensk-spanska lexikon)

    vb tr o.vb itr g ihop med ir bien con,

    hacer juego con; t.ex. en spelare lanzar

    Aunque no hayamos podido concluir nada definitivamente, vemos que el diccionario no es siempre completo y que una de las acepciones de la palabra coincidencia se podra completar del siguiente modo: 1 sammanfalla, verensstmma {estas dos piezas no coinciden}, matcha. Lo que hemos observado es que cambiando el nmero del sujeto tambin cambia la acepcin interpretada del verbo, y el resultado es correcto. Aadiendo ms cotexto, el mismo cambio de nmero del sujeto vuelve a producir la interpretacin errnea.

  • - 39 -

    3.2.2

    Llevar (+)

    Original:

    Lo llevan en sus genes.

    Traduccin:

    Det r i deras gener.

    Esta frase destaca y sorprende por haber sido traducida correctamente. El verbo llevar es tan polismico que para enumerar todas las posibles acepciones necesitaramos dos o tres pginas. En el gran acopio de ejemplos que el diccionario (Norstedts) nos proporciona, en ningn sitio encontramos el equivalente aislado del verbo vara. Para descartar la posibilidad de que el contexto (en su sentido amplio) provoque la traduccin correcta alimentamos la frase en el programa totalmente independiente de las palabras que en el corpus existen alrededor de ella. El resultado sigue siendo correcto. Esto consolida la afirmacin de Domeij (2008:18) de que los programas de hoy en da no tienen en cuenta el contexto, nicamente el cotexto. Por razones de brevedad provocaremos una serie de construcciones de las que algunas requeriran otra traduccin del verbo llevar:

    Versin provocada I:

    Lo llevan consigo.

    Traduccin:

    Jag34 br.

    Versin provocada II:

    Lo llevan escondido.

    Traduccin:

    Vad r dolda.

    Versin provocada III:

    Lo llevan encima.

    Traduccin:

    De tar ver.

    34 Aunque no tenga que ver, uno se pregunta de dnde viene Jag.

  • - 40 -

    Versin provocada IV:

    Lo llevan en la guantera.

    Traduccin:

    Det r i handskfacket.

    Versin provocada V:

    Lo llevan en el pasaporte.

    Traduccin:

    Det r i passet.

    Versin provocada VI:

    Lo llevan en la sangre.

    Traduccin:

    Det r i blodet.

    En vista de estos ejemplos consta que el programa demuestra todo un arsenal de alternativas, y que las usa ms o menos debidamente. Segn Domeij (2008: 83) Google Translate se beneficia de un mtodo de traduccin llamado traduccin estadstica, lo cual implica lo siguiente:Gradualmente se han ido introduciendo conocimientos lingsticos [al programa] y se han ido mejorando [los sistemas de traduccin], pero ahora el proceso se basa en estadsticas que estn almacenadas mediante traducciones ya realizadas. (Domeij 2008: 92) Nos sorprendera mucho tanta sofisticacin para luego fallar en lo ms simple, pero quiz pueda motivar la presencia de las dems palabras que en varios de los ejemplos arriba vistos estn traducidas indebidamente.

  • - 41 -

    3.2.3

    Sealar (-)

    Hacer notar (-)

    Las dos traducciones erradas que a continuacin vamos a ilustrar las hemos procesado juntamente. El motivo por ell