strumenti per la traduzione online. by ioana valeria martinescu

A mia nonna

Mizi,

1

INDICE

Premessa …………………………………………….……5

STORIA DELLA TRADUZIONE

Introduzione……………………………………………………….7

1.1 Approccio alla traduzione automatica………………………………10

Note e Riferimenti Bibliografici. Capitolo primo …………………….12

LA TRADUZIONE AUTOMATICA

Introduzione ………………………………………………………13

2.1. Eurotra project………………………………………………………...17

2.2. Modelli di traduzione automatica…………………………………….19

Note al capitolo secondo………………………………………………….22

TRADUZIONE ASISTITA DAL COMPUTER

3.1. Strumenti C.A.T/T.M………………………………………………….24

3.2. Translation Memory (Memorie traduttive)……………………………25

3.3. La gestione della terminologia ………………………………………...26

3.4. Programmi di concordanze e corpora …………………………………28

3.5. Programmi di traduzione automatica ………………………………….292

Note al capitolo terzo ……………………………………………………...32

GOOGLE

Introduzione ………………………………………………………..33

4.1. Storia di un imperio…………………………………………………….34

4.2. Google Translate……...………………………………………………..35

4.3. Google Translator Toolkit…………………………………………......37

4.4. Funzioni e caratteristiche del traduttore online………………………38

4.5. Client for Google Translate…………………………………………....41

4.6. Google Toolbar…………………………………………………….….42

4.7. Novità per la traduzione automatica …………………………………43

4.8. Traduzione speech to speech………………………………………….45

Note al capitolo quarto …………………………………………..47

SPEECH TO SPEECH TRANSLATION

Introduzione ………………………………………………………..49

5.1. Tecnologia e ricerca ………………………………………………….49

5.1.1Come funziona Mastor IBM?..............................................................51

Note al capitolo quinto ……………………………………….…..53

HILBERT ENGINE

Introduzione ………………………………………………………54

6.1. L’invenzione…………………………………………………..55

6.2. Sviluppo ……………………………………………………...56

6.3. Prospettive nel futuro della traduzione ……………………...57

Note al capitolo sesto ……………………………………………..58

3

Conclusione Finale………………………………………...59

Bibliografia…...…………………………………………….61

4

Premessa,

Il presente elaborato si propone di analizzare la traduzione automatica come

strumento al servizio del traduttore “umano”. Oltre l'approfondimento di vari

strumenti informatici come Google Translator (capitolo quarto) sorge la domanda

filosofica relativa a come superare il muro linguistico nel contesto della

globalizzazione. Quesito che sembra trovare la risposta nelle nuove tecnologie

informatiche che promettono di offrire a breve la comunicazione diretta tra

interlocutori che – pur parlando lingue diverse - riescono a capirsi in tempo reale

attraverso l'aiuto di un semplice dispositivo (capitolo quinto).

Per dare un’immagine complessiva del tema trattato, questo lavoro è

suddiviso in sette capitoli che trattano la traduzione automatica dal novecento fino

ad oggi offrendo anche informazioni sulle scoperte di frontiera nel settore. Il primo

capitolo si apre con una breve introduzione storica per poi avvicinarsi alla nascita

della traduzione automatica nel XX secolo. Il secondo descrive il progetto Eurotra,

un reale strumento di collaborazione tra gli stati dell’Unione Europea, ideato per la

creazione di una memoria traduttiva gigantesca con cui tradurre efficacemente atti e

documenti ufficiali. Nello stesso capitolo parliamo anche di vari tentativi di creare

macchine traduttrici o programmi che non necessitano l’intervento umano nel

processo traduttivo .

Nel terzo capitolo, invece, sono stati elencati i principali strumenti

informatici di traduzione assistita dal computer, che possono servire al traduttore

5

umano per velocizzare il proprio lavoro. Vedremo esempi di come rintracciare,

usare e valutare programmi informatici quali memorie traduttive, traduttori online,

glossari e macchine “traduttrici”. Il quarto capitolo, che dà anche il nome alla tesi,

esamina le principali caratteristiche di Google Translator e presenta la storia di un

progetto che sta contribuendo a rivoluzionare la comprensione delle lingue naturali,

mettendo a disposizione degli utenti importanti strumenti online per facilitare la

traduzione di libri, documenti e siti. Spostando semplicemente il mouse sopra un

testo con Google Translator appare la traduzione nella lingua del nostro browser,

con la possibilità di scegliere tra più di novanta lingue. Nello stesso capitolo

vengono presentate alcune funzioni e caratteristiche del traduttore online e tutte le

novità proposte da Google per la traduzione automatica.

Il quinto capitolo parla della nuovissima tecnologia Speach to Speach,

raccogliendo informazioni da varie pubblicazioni scientifiche che sono state

tradotte in italiano e confrontate per dare un quadro complessivo delle reali

potenzialità di oltrepassare, anche relativamente al linguaggio parlato, il muro

esistente fra lingua e lingua. Con la Speach to Speach Translation si dà la

possibilità di comunicare istantaneamente con chiunque, attraverso l'assistenza di

un traduttore universale.

Il capitolo finale propone una sintesi e traduzione di alcune sezioni della

pubblicazione “Perspective on Performance in Business Intelligence - The Hilbert

Engine” - mai tradotta in italiano finora. Si tratta di un lavoro che discute l’uso di

una tecnologia vettoriale per lo stoccaggio e il recupero dei dati su un computer. Le

sue applicazioni nel campo della traduzione possono essere decisive nella creazione

6

di una “macchina traduttrice” che in un futuro prossimo riuscirà a sostituire almeno

in certi campi il lavoro del traduttore umano.

7

CAPITOLO 1

STORIA DELLA TRADUZIONE

“Tradurre è oggi una costante della nostra vita, un’operazione cui molti di noi, spinti da

esigenze e motivi di diversa natura, sono volontariamente o involontariamente sottoposti1”

(Jakobson, Note per una didattica sulla storia della traduzione)

Per offrire un’immagine complessiva di questo settore, occorre considerare la

storia della traduzione dalle origini fino alla seconda metà del XX secolo, quando

nacque la traduzione automatica. La traduzione è un’attività molto antica, che

veniva usata inizialmente nei rapporti politici e negli scambi commerciali. I greci

usavano l’operazione del tradurre solamente a fini pratici, mostrando disinteresse

culturale per le lingue degli altri, definiti generalmente con la parola barbaroi

(barbare). Sono presenti nella storia della traduzione alcuni termini che esprimono

la bipartizione tra la traduzione orale, come ermeneuo e ermeneus, e la traduzione

scritta come metafero (da cui il termine latino transferre), metafrazo ( tradurre,

parafrasare) e metagrafo (trascrivere, tradurre)2. In epoca romana la traduzione è

considerata principalmente un esercizio pedagogico e retorico. In questo periodo si

collocano le riflessioni più antiche a noi note sul tradurre: il “De optimo genere

oratorum” di Marco Tullio Cicerone, sorta di manifesto che celebra la forma della

8

libera traduzione. Cicerone delinea un profilo dell’oratore perfetto, che riesce con

la sua parola a “persuadere, dilettare e commuovere i suoi ascoltatori” (Bertazzoli,

2005). Sempre lui afferma di aver tradotto i due più importanti oratori (Demostene

ed Eschine) come oratore e non come interprete, differenziando quindi l’interpres

(chi traduce alla lettera) dall’orator (chi traduce come oratore/autore). Una

contrapposizione delineata da Cicerone rimarrà in tutta la storia della traduzione:

quella tra i due principali metodi di lavoro, letterale, che procede “non verbum de

verbo, sed sensum exprimere de sensu3”, e quella libera, che si propone di rendere il

senso e “l’efficacia espressiva4” delle parole:

“Ho tradotto da oratore, non già da interprete di un testo con le espressioni stesse del

pensiero, con gli stessi modi di rendere questo, con un lessico appropriato all’indole della

nostra lingua. In essi non ho creduto di rendere parola con parola, ma ho mantenuto ogni

carattere e ogni efficacia espressiva delle parole stesse” (Cicerone, De optimo genere

oratorum)5

L’intento di Cicerone è quindi quello di dare vita ad una traduzione che “non

rispetti un’equivalenza numerica perfetta” (Jacobson), bensì sia in grado di

conservare la forza comunicativa di cui godono le parole.

Anche nella visione di Heidegger la traduzione intesa come “trasferimento di

significato da una lingua all’altra”, ossia la traduzione letterale, parola per parola, è

un’idea ingenua: “non basta sostituire le parole greche con altre di altre lingue,

9

anche se queste hanno una vasta notorietà6”. Heidegger afferma che la traduzione

letterale non consente la vera fedeltà all’originale, pur dando questa impressione:

“il fatto che una traduzione sia semplicemente letterale non significa per ciò stesso

che sia anche più fedele a ciò che è detto. Una traduzione è fedele solo se le parole

parlano il linguaggio che esprime il vero senso7”. Il compito di una corretta

traduzione non è “un’ottusa fedeltà” è solo “la capacità di tradursi nel tradurre, una

capacità di lasciarsi trasportare nel rapporto col testo8”. La traduzione è un

movimento reciproco tra due lingue, “un andare-oltre e tornare-indietro da una

lingua all’altra9”, e quindi mai unidirezionale. Solo in questo modo è possibile

sentire una lingua: “dobbiamo piuttosto lasciare che le stesse parole greche ci

dicano ciò che esse nominano e trasferire la nostra capacità di ascoltare nell’ambito

del dire poetico della lingua10”

1.1 Approccio alla traduzione automatica. Con la nascita della traduzione

automatica non parliamo più “dell’artigiano traduttore11”, un’immagine che si perde

dietro lo scenario della modernità lasciando il posto a tecniche e strumenti avanzati,

che aprono nuovi orizzonti nel futuro di questo mestiere cosi antico. Come

sappiamo è solo recentemente che la traduzione e riuscita ad imporsi come

disciplina accademica e di ricerca e quindi finalmente i traduttori sono riusciti ad

ottenere l’investitura di categoria professionale. E’ importante tenere presente che

viviamo in un mondo in cui la tecnologia e la scienza riescono a superare limiti un

10

tempo impensabili, ma in cui nonostante tutto il muro linguistico resta ancora

difficile da superare: un ostacolo invisibile che continua a separare profondamente

uomini di lingue e culture diverse. Ma per quanto tempo rimarrà in piedi ancora

questo muro linguistico? E’ forse proprio la tecnologia informatica a

rappresentarne il principale nemico? Per cercare di rispondere a questa domanda

occorre prendere in considerazione innanzitutto le radici della traduzione

automatica, e quindi i primi strumenti informatici per la traduzione.

E’ nel novecento che si parla per la prima volta di “scienza della traduzione”,

con la comparsa di computer e traduttori automatici che aprono un nuovo capitolo

nella storia delle teorie traduttive. Il panorama nel mondo della traduzione cambia

radicalmente, proponendo teorie dell’attività traduttiva ispirate da modelli

matematici e computazionali, che si appoggiano sulla linguistica universale di

Noam Chomsky (il pioniere della teoria dell’innatismo linguistico e della

grammatica generativo-trasformazionale), per ambire all’ideale di una traduzione

automatica perfetta, realizzata interamente dalle macchine. Teorici dell’informatica,

linguisti, ingegneri, matematici, prendono parte a questi studi ritenendo che il

problema della traduzione si possa schematizzare in termini logici12. Un grande

entusiasmo per le potenzialità intraviste negli elaboratori elettronici e per le

nascenti teorie linguistiche portava tali studiosi a pensare che il traguardo di una

sostituzione dei traduttori umani con i computer non fosse né irraggiungibile, né

troppo lontano.

11

Note al capitolo primo.

1 JACOBSON, Note per una didattica sulla storia della traduzione. Aspetti del

linguaggio e della traduzione, trad. it. di R. Bianchi e C. Béguin2 BERTAZZOLI, RAFFAELLA, La traduzione: teorie e metodi, Carocci, 20063SAN GEROLAMO, Liber de optimo genere interpretandi, Epistola 57 a

Pammacchio, (390 ca.), in TTS, pp.63-71. “Nelle mie traduzioni dal greco in latino

non miro a rendere parola per parola, ma a riprodurre integralmente il senso

dell’originale (non verbum de verbo, sed sensum exprimere de sensu). E di questo

mio metodo ho a maestro Cicerone”.4,5MARCO TULLIO CICERONE, De optimo genere oratorum, in S. NERGAARD,

La teoria della traduzione nella storia, Bompiani, Milano 1993. G. TISSONI, Tutte

le opere di Cicerone, vol. 17, Mondadori, Milano 1973, pp. 33-356 M. HEIDEGGER, Che cosa significa pensare?, a cura di U. Ugazio e G. Vattimo,

Sugar, Milano 1979, 7M. HEIDEGGER, Sentieri interrotti, trad. it. di P. Chiodi, La Nuova Italia, Firenze

1968, p. 3008M. HEIDEGGER, Che cosa significa pensare ?, cit., p. 151.9 Ermeneutica, tradizione e traduzione in HEIDEGGER , a cura di Francesco

Cardone, fonte www.filosofico.net10 M. HEIDEGGER, Che cosa significa pensare? cit., p. 151.11 JACOBSON, Note per una didattica sulla storia della traduzione. Aspetti del

linguaggio e della traduzione, trad. it. di R. Bianchi e C. Béguin

12

http://www.filosofico.net/

12 ZANETTIN, FEDERICO (2001) “Informatica e traduzione”. In Monacelli,

Claudia (ed.) Traduzione, revisione e localizzazione nel terzo millennio: da e verso

l'inglese. Milano: Franco Angeli, 19-45.

CAPITOLO 2

LA TRADUZIONE AUTOMATICA

I primi brevetti relativi al campo della traduzione automatica risalgono alla metà

degli anni ’30 del secolo scorso, con Georges Artsrouni che propose un semplice

dizionario bilingue automatizzato che utilizzava un nastro di carta. Un’altra

proposta, venuta da Peter Troyanskii, fu più dettagliata. Essa includeva il dizionario

bilingue e un metodo per mettere in correlazione i ruoli grammaticali esistenti in

lingue diverse. Le prime proposte per la traduzione automatica usando il computer

furono avanzate da un famoso ricercatore presso la Fondazione Rockefeller,

Warren Weaver, che pubblicò nel 1949 un memorandum al riguardo. Le sue

proposte erano basate sulla teoria dell'informazione, e utilizzavano le tecniche

sviluppate durante la Seconda guerra Mondiale per la decodificazione dei messaggi

cifrati. Negli anni successivi, molte università negli Stati Uniti hanno cominciato

una seria ricerca nel campo. Il 7 gennaio 1954 a New York presso la sede di IBM

ha luogo l'esperimento di Georgetown, la prima dimostrazione pubblica di un

sistema di traduzione automatica. Una dimostrazione rilanciata dai giornali e che

all’epoca suscitò molto interesse da parte del pubblico. Il sistema utilizzato,

13

tuttavia, non era altro che un giocattolo che conosceva appena 250 parole,

soprattutto nel campo della chimica, e riusciva tradurre con cura solo quarantanove

frasi dal russo all’inglese, usando sei regole grammaticali. Ma l’esperimento

convinse l'opinione pubblica del fatto che l’avvento della traduzione automatica

fosse imminente, stimolando in particolar modo il finanziamento della ricerca, non

solo negli Stati Uniti ma in tutto il mondo13. Durante questo periodo, furono

installati molti sistemi di traduzione automatica relativi a settori specifici. La

United States Air Force utilizzò così un sistema prodotto da IBM e dalla

Washington University, mentre l'Atomic Energy Commission negli Stati Uniti e

l'Euratom in Italia utilizzarono un sistema sviluppato presso la Georgetown

University.

Un duro colpo viene dato alla ricerca in questo settore nel 1966, con la

pubblicazione della relazione ALPAC. Il rapporto – eseguito da ALPAC,

l'Automatic Language Processing Advisory Committee, un gruppo di sette

scienziati convocato nel 1964 – è stato richiesto dal governo degli Stati Uniti, e

sottolinea la mancanza di progressi compiuti. Il rapporto concluse che la traduzione

automatica era più costosa, meno accurata e più lenta in confronto alla traduzione

umana, e che, nonostante le spese, la traduzione automatica non era tale da

raggiungere la qualità di un traduttore umano nel prossimo futuro14.

Tuttavia la ricerca continua in Canada, Francia e Germania, dove vengono creati

due sistemi di traduzione automatica: Systran, sviluppato da Peter Toma e

utilizzato dalla Commissione dell'Unione Europea, e Taum-meteo, creato nel 1977

dall'Università di Montreal per tradurre le previsioni del tempo dal francese

14

all'inglese. Importanti progressi si sono verificati durante il 1980. Le esigenze

amministrative e commerciali delle comunità multilingue hanno stimolato la

domanda di traduzione, portando allo sviluppo di nuovi sistemi di traduzione

automatica come Logos (dal tedesco al francese e viceversa) e il sistema interno

creato dalla Pan-American Health Organization (dallo spagnolo all'inglese e

viceversa).

Nel 1980 avviene una vera ripresa della ricerca e della produzione di

applicazioni informatiche dovuta alla diffusione di personal computer e di

programmi di elaborazione di testo. Aziende come ALPI, Weidner, Globalink

(Nord America ed Europa), Sharp, NEC, Mitsubishi, Sanyo (Giappone) adottarono

e cominciarono a considerare necessari tali programmi. Alcuni dei progetti più

importanti furono GETA-Ariane (Grenoble), SUSY (Saarbrücken), MU (Kyoto),

ed Eurotra (l'Unione europea)15.

Nel 1983 si commercializza il primo programma di traduzione automatica

operante su personal computer. TSS, un software per il sistema operativo OS/2, è

stato realizzato da ALPS, una società statunitense produttrice di software per

applicazioni linguistiche, poi divenuta Alpnet. Fu adottato da alcune grandi società,

tra le quali l’IBM, per la propria attività di traduzione interna. L’applicazione

dell’informatica nel campo della traduzione inizia a rinnovare i propri metodi e le

proprie prospettive. L’utilizzo di strumenti informatici da parte d’istituzioni, enti e

agenzie di traduzione avviene come risposta ai crescenti bisogni del

multilinguismo. All’interno della Comunità Europea sono tradotte dai sistemi di

traduzione automatica circa 200.000 pagine di cui solo il 4% è di qualità accettabile

15

per la pubblicazione, le rimanenti vengono utilizzate come “traduzioni

indicative”.16

L'inizio degli anni ‘90 ha visto un’evoluzione vitale nella traduzione automatica

con un cambiamento radicale nella strategia di traduzione secondo le regole

grammaticali, attraverso corpora di testi ed esempi (come il Revers Program). Una

“lingua” non è più percepita come un’entità statica disciplinata da regole fisse, ma

come un corpus dinamico che cambia a seconda dell’utilizzo e degli utilizzatori,

evolvendo nel tempo e adattandosi alla realtà sociale e culturale. In tutto questo

periodo la traduzione automatica continua a progredire. Le grandi aziende

aumentano le vendite di software per il grande pubblico. Questa situazione ha

portato alla creazione di programmi di traduzione online (fra i primi, Altavista), che

offrono servizi gratuiti di posta elettronica veloce, pagine web nella lingua

desiderata, dizionari multilingue, enciclopedie e data base terminologici. Con

l’arrivo del nuovo secolo i programmi informatici creati per svolgere compiti

traduttivi si sono ulteriormente diffusi, pur rimanendo qualitativamente assai

inferiori alla traduzione umana. La traduzione automatica rappresenta ancora solo

una piccola percentuale del mercato. All'inizio degli anni ‘90 il mercato della

traduzione è il seguente (Loffler-Laurian, 1996)17:

Stato La traduzione umana T.M

Europa e Stati Uniti 300 milioni di pagine 2.5 milioni di pagine

16

Giappone150 milioni di pagine 3.5 milioni di pagine

Tabella.1. Il mercato della traduzione nel 1990

Si può notare che solo sei milioni di pagine sono state tradotte attraverso la

traduzione automatica, rispetto ai 450 milioni tradotti attraverso la traduzione

umana, quindi la traduzione automatica rappresentava solo il 1,3% del totale. È

importante ricordare che i sistemi di traduzione automatica non sono ancora in

grado di produrre un testo immediatamente utilizzabile, dal momento che

l’interpretazione di un passaggio in qualunque lingua è fortemente dipendente dal

contesto. La combinazione delle parole porta a diverse denotazioni e connotazioni.

Con la traduzione automatica non è sempre possibile rendere efficacemente il

significato del testo: l’utilità di questo strumento si limitata a situazioni concrete, ed

offre soprattutto un mezzo per risparmiare tempo (a scapito della qualità), piuttosto

che un sostituto dell’attività umana.

2.1 Eurotra Project. Portiamo avanti la nostra ricerca con Eurotra, un ambizioso

progetto di traduzione automatica istituito e finanziato dalla Commissione Europea

dalla fine degli anni ‘70 fino al 1994. Una vasta rete europea di linguisti e

informatici avviò questo progetto con la speranza di creare un sistema di traduzione

automatica (MT) per le lingue ufficiali della Comunità Europea, all’inizio sette e

poi nove. Tuttavia, col passare del tempo, le attese si attenuarono; "Fully Automatic

High Quality Translation", la traduzione automatica di alta qualità, non era più un 17

obiettivo ragionevolmente raggiungibile. Eurotra fu in realtà riconosciuto come uno

strumento per la ricerca, piuttosto che lo sviluppo di un prototipo.

Il progetto fu altamente motivato da uno dei principi fondamentali dell'Unione

Europea: quello di offrire ai cittadini la possibilità di leggere nella propria lingua

qualsiasi documento creato all’interno dell’UE, fatto che garantiva una maggiore

trasparenza. L’adesione di nuovi paesi ha prodotto un’esplosione combinatoria del

numero di coppie di lingue coinvolte, per la necessità di tradurre ogni carta,

discorso e ogni verbale delle riunioni interne. Tutti questi fattori hanno fatto dalla

traduzione un elemento dal peso drammatico nel bilancio contabile dell’U.E. Per

risolvere questo problema è stato ideato Eurotra18. Il professor Giovanni Malnati,

membro dell’Engineering Framework Group, nel progetto europeo Eurotra,

descrive l’attività svolta come: “Implementazione di un meccanismo di meta regole

ricorsive per l’analisi di fenomeni linguistici (unbounded dependency

constructions), la formalizzazione e la descrizione dell'intero formalismo e

l'ideazione e la realizzazione di un sistema di regole di preferenza multi-criterio per

la selezione di risultati linguistici intermedi nel processo di traduzione”19 . Il

progetto è stato particolare perché non si trattava di un gruppo unico di ricerca, vi

erano più gruppi distribuiti in tutti i paesi membri, organizzati piuttosto secondo la

lingua che seguendo i confini nazionali (per esempio, i gruppi di Leuven e Utrecht

hanno lavorato a stretto contatto), con la sede centrale presso la Commissione

Europea a Lussemburgo. Mentre questo ha contribuito in modo efficace allo

sviluppo culturale, ha anche dimostrato graficamente l’affermazione di Brooks

nella pubblicazione “The Mythical Man-Month” e cioè “più il numero dei gruppi

18

partecipanti è alto, più tempo è impiegato per l'amministrazione e la

comunicazione, piuttosto che per la ricerca effettiva di per sé”. Eurotra, infatti, non

è mai riuscito a offrire al mercato un prodotto finito e funzionante, cioè un sistema

di lavoro MT. Nonostante ciò, ha avuto un impatto di vasta portata a lungo termine

sulle industrie nascenti negli stati membri europei, in particolare nei paesi del sud

come Grecia, Italia, Spagna e Portogallo. Vi è almeno un sistema MT commerciale

(sviluppato da un consorzio accademico in Danimarca) derivato dalla tecnologia di

Eurotra19. È tuttora utilizzato da Google come fonte d’ispirazione del nuovissimo

programma Google Translate, che permette la partecipazione degli utenti di tutto il

mondo alla traduzione attraverso una memoria di traduzione, quindi un archivio

intelligente di tutti gli elementi che vengono tradotti.

2.2 Modelli di traduzione automatica. Per comprendere i principi essenziali

che stanno alla base della traduzione automatica, è necessario capire il

funzionamento del cervello umano. La prima fase della traduzione umana è la

comprensione completa del testo, nella lingua di origine. Questa comprensione

opera su diversi livelli: livello semantico (in cui bisogna innanzitutto comprendere

parole fuori contesto, come in un dizionario), livello sintattico (che presuppone

capire le parole in una frase) e livello pragmatico (che richiede una comprensione

complessa in situazioni e contesti). Inoltre, ci sono almeno cinque tipi di

conoscenza utilizzati nel processo di traduzione: la conoscenza della lingua di

origine (permette di capire il testo originale), la conoscenza della lingua di 19

destinazione (consente di produrre un testo coerente in quella lingua), la

conoscenza delle equivalenze (tra le lingue di partenza e di destinazione), la

conoscenza del campo “oggetto” che è generale, (entrambe aiutano a comprendere

il testo nella lingua di origine) e la conoscenza degli aspetti socio-culturali (costumi

e convenzioni della sorgente e delle culture di destinazione). Data la complessità

dei fenomeni che stanno alla base del lavoro di un traduttore umano, sarebbe

difficile pretendere che una macchina possa produrre un testo di arrivo della stessa

qualità di quella di un essere umano. Tuttavia, è chiaro che anche un traduttore

umano è raramente in grado di produrre una traduzione adeguata al primo tentativo.

In realtà il processo di traduzione si compone di due fasi: la prima è la produzione

di un testo di massima o versione preliminare nella lingua di destinazione, in cui la

maggior parte dei problemi di traduzione è risolta, ma che è lontano dall'essere

perfetto; in secondo luogo, la fase di revisione, variando dalla semplice rilettura del

testo, con piccoli aggiustamenti, a cambiamenti radicali. Si potrebbe quindi dire

che MT mira a eseguire la prima tappa di questo processo in modo automatico, cosi

che il traduttore umano può procedere direttamente con la seconda fase che

consiste nel meticoloso e impegnativo compito di revisione20.

Le prime “macchine traduttrici” funzionavano attraverso il testo che “veniva

immesso nel calcolatore che riconosceva la sequenza di parole nella lingua di

partenza21”, analizzava grammaticalmente e produceva “un testo nella lingua di

arrivo, composto da una sequenza di parole corrispondenti, attinte da un dizionario

elettronico bilingue e arrangiate in base a una serie di regole di trasformazione

grammaticale22” (i cosiddetti sistemi ad architettura di “prima generazione”). A

20

questi seguono sistemi di modelli linguistici più complessi come quelli di seconda

generazione basati su transfer e sull’interlingua.

L’intero ciclo comprende l’immissione del testo di partenza (input), l’elaborazione

e l’immissione del testo di arrivo (output). “Questa maggiore complessità teorica

(come rappresentata schematicamente in figura.1) prevede la possibilità di arrivare

alla realizzazione di sistemi in grado di gestire più coppie di lingue e direzioni di

traduzione introducendo anche una maggiore complessità gestionale23”.

Fig.1. Modelli teorici di traduzione automatica

Negli anni ’90 si diffonde un nuovo modello basato su “banche dati testuali

bilingui, anziché sull’uso di lessici bilingue e regole di trasformazione24”

Alcuni ricercatori dell’IBM hanno concepito metodi per allineare i corpora paralleli

(raccolte di testi in formato elettronico) per poi calcolare la probabilità con cui a

ciascuna frase o parola in una lingua corrisponde una frase o parola di un'altra

lingua. Un nuovo paradigma di ricerca per la traduzione automatica è stato fornito

21

dal principio dei corpora paralleli conosciuto come “traduzione automatica basata

sugli esempi” (EBMT, Exemplum Based Machine Translation) le cui applicazioni

hanno contribuito alla nascita di una nuova generazione di strumenti informatici

chiamati memorie traduttive.

Note al capitolo secondo.

11,12Traduzione propria da “Concise history of the language sciences: from the

Sumerians to the cognitivists”. Edited by E.F.K.Koerner and R.E.Asher. Oxford:

Pergamon Press, 1995. 431-445

13 Traduzione propria da Machine Translation and Computer-Assisted Translation:

a New Way of Translating? by Olivia Craciunescu, Constanza Gerding-Salas,

Susan Stringer-O'Keeffe. Volume 8, No. 3 July 2004.

14ZANETTIN, FEDERICO (2001) “Informatica e traduzione”. In Monacelli,



15,16Traduzione propria da Machine Translation and Computer-Assisted

Translation: a New Way of Translating? by Olivia Craciunescu, Constanza

Gerding-Salas, Susan Stringer-O'Keeffe. Volume 8, No. 3 July 2004.

17Traduzioni proprie da MAEGAARD, B, 1989. Perspectives in artificial

intelligence vol. 2: machine translation, NLP, databases and computer-aided

instruction. Source http://portal.acm.org/citation.cfm?id=65688

22

http://portal.acm.org/citation.cfm?id=65688

18Intervista col Professor Giovanni Malnati, online su

http://www.consorzionettuno.it

19Traduzioni proprie da MAEGAARD, B, 1989. Perspectives in artificial

intelligence vol. 2: machine translation, NLP, databases and computer-aided

instruction. Source http://portal.acm.org/citation.cfm?id=65688

20 Traduzione propria da Machine Translation and Computer-Assisted Translation:

a New Way of Translating? by Olivia Craciunescu, Constanza Gerding-Salas,

Susan Stringer-O'Keeffe. Volume 8, No. 3 July 2004.

21,22 ZANETTIN, FEDERICO (2001) “Informatica e traduzione”. In Monacelli,



23BOWKER, L, Computer-Aided Translation Technology. A practical introduction.

University of Ottawa Press, Ottawa 2002.

24ZANETTIN, FEDERICO. (2001) “Informatica e traduzione”. In Monacelli,


l'inglese. Milano: Franco Angeli, 19-45

23


http://www.consorzionettuno.it/

CAPITOLO 3.

TRADUZIONE ASSISTITA DAL COMPUTER

La meccanizzazione della traduzione è stata una dei più antichi sogni

dell'umanità. Nel ventesimo secolo è diventata una realtà, sotto forma di programmi

per il computer in grado di tradurre una grande varietà di testi da una lingua

naturale all’altra. Nonostante tutto, la traduzione è ancora lontana dall’essere

perfetta, visto che non esistono “macchine traduttrici” che al semplice tocco di

alcuni tasti riescano a capire qualsiasi testo, in qualsiasi lingua naturale, per poi

produrre una traduzione perfetta in qualsiasi altra lingua senza l'intervento umano.

Da molti la traduzione automatica viene concepita come un ideale per un futuro

lontano, anche se realizzabile in linea di principio anche attraverso la tecnologia

attuale, come potremo vedere nei capitoli successivi25.

Si possono considerare di ausilio alla traduzione tutti gli strumenti informatici

che in qualche modo elaborano il linguaggio umano, tra cui: elaboratori di testi,

software OCR (Optical Character Recognition), strumenti per il riconoscimento e

la sintesi vocale, strumenti per la ricerca e sostituzione di testo, database testuali.

24

Quando parliamo di sistemi informatici per la traduzione, ci si riferisce a quei

sistemi progettati appositamente per l'ambito traduttivo: da quelli che pretendono di

sostituire l’intervento umano, a quelli che forniscono al traduttore strumenti utili

per le attività svolte tradizionalmente, quali vari tipi di analisi sul testo di partenza

e/o di arrivo come la creazione, la gestione e la consultazione di glossari, le

ricerche in corpora linguistici e la produzione del testo di arrivo. A tali applicazioni

si fa riferimento collettivamente con il nome di CAT (Computer Aided Translation

o Computer Assisted Translation, traduzione assistita da computer). Nell'uso

comune, dall'insieme degli strumenti CAT è solitamente esclusa la traduzione

automatica (MT, Machine Translation), anche nella sua varietà assistita (HAMT,

Human Aided Machine Translation), e il termine CAT s’identifica quindi con

quella che è più propriamente detta MAHT (Machine Aided Human Translation)26.

Fig. 2 –. Terminologia specifica

25

3.1 Strumenti CAT/TM. Oggi, i più diffusi sistemi per la traduzione assistita

(MAHT) forniscono al traduttore vari strumenti come: programmi di videoscrittura,

memorie di traduzione, sistemi per la gestione di banche dati terminologiche,

programmi di concordanze, dizionari e glossari elettronici bilingue, programmi di

traduzione automatica, enciclopedie, forum, ecc. Il ruolo principale è attribuito alla

memoria di traduzione (TM, Translation Memory), tanto che il termine “strumento

TM” viene spesso usato, in modo impreciso, con il termine “strumento CAT”27.

3.2 Translation Memory. “Una memoria di traduzione è un archivio elettronico

in cui i testi di partenza in una certa lingua e i corrispondenti testi di arrivo in una o

più lingue sono memorizzati in modo parallelo” (Alessandra Muzzi 2000-2010).

Il testo è segmentato in frasi, in modo che a un segmento nella lingua di partenza,

corrisponda il proprio traducente in ciascuna delle lingue di arrivo. La memoria di

traduzione è uno strumento potente per la gestione di testi ripetitivi

(documentazione tecnica, testi legali e commerciali), garantendo coerenza stilistica

e terminologica, con brevi tempi di traduzione.

Gli strumenti per la traduzione assistita consentono di creare una memoria di

traduzione vuota e di alimentarla durante la traduzione. In questo modo le

traduzioni prodotte sono archiviate sulla memoria traduttiva. Possiamo anche

alimentare una memoria di traduzione con testi preesistenti attraverso la procedura

chiamata “allineamento”; l’unica condizione è di avere in formato elettronico sia il

testo nella lingua di partenza, sia il corrispondente testo nella lingua di arrivo.

26

L'allineamento consiste nella segmentazione dei testi di partenza e di arrivo,

definizione delle corrispondenze tra i segmenti nelle due lingue (con interventi

manuali più o meno estesi a seconda dello strumento utilizzato) e nell'inserimento

di tali segmenti allineati nel database di memoria28.

Quando si traduce utilizzando uno strumento CAT, il testo da tradurre è

segmentato e per ogni segmento il sistema controlla se esistono corrispondenze

nella memoria di traduzione. Se trova un segmento uguale (exact match,

corrispondenza esatta) o simile (fuzzy match, corrispondenza parziale) nella lingua

di partenza, presenta al traduttore il segmento corrispondente nella lingua di arrivo

(cfr. Brace 1995, Dennet 1995, Heyn 1998). Il traduttore può accettare la

traduzione suggerita ed eventualmente correggerla, oppure ignorarla e inserire una

nuova traduzione. Gli strumenti CAT ci consentono inoltre di cercare nella

memoria di traduzione singoli termini o espressioni, anche se un termine non è

presente nei glossari disponibili, sarà quindi possibile verificare il modo in cui è

stato tradotto in precedenza.

Tra i software professionali, ci sono molti strumenti che si occupano di

gestire le memorie di traduzione, però, i più utilizzati per tradurre automaticamente

le lingue straniere su Word sono: Trados e Wordfast.

Trados è un vero e proprio software, che lavora costantemente collegato a un server

per tenere aggiornate le memorie di traduzione. Questo tipo di software divide il

testo della lingua sorgente in segmenti (tag) che saranno tradotti in altrettanti tag

nella lingua target. È il programma più utilizzato nelle grandi software houses.29

27

Wordfast invece, pur essendo per certi versi abbastanza simile a Trados, non è un

software vero e proprio essendo un CAT tool, ossia uno strumento di traduzione

assistita. Si basa sempre su una memoria di traduzione ma a differenza di Trados è

caratterizzato da una licenza freeware (libera) e non ha una procedura standard

d’installazione. Dalle impostazioni di Wordfast è possibile creare nuove memorie

di traduzione, modificare quelle esistenti, verificare i documenti e cambiare la

lingua sorgente o la lingua target.

3.3 La gestione della terminologia. A differenza delle memorie di traduzione, le

risorse terminologiche non sono un concetto introdotto con l'applicazione della

tecnologia informatica al campo della traduzione. I traduttori hanno sempre

utilizzato tali risorse, sotto forma di dizionari e glossari cartacei. Con l'avvento

della rivoluzione informatica, i primi ad essere creati sono stati gli strumenti per la

gestione della terminologia. I computer hanno facilitato tale gestione, che in

precedenza avveniva mediante liste o schede, grazie all'utilizzo di applicazioni

generiche di gestione basi di dati o di applicazioni progettate in modo specifico, per

la gestione della terminologia. Pressoché tutti gli strumenti CAT/TM comprendono

componenti specifici per la gestione della terminologia. L'innovazione è costituita

dal riconoscimento terminologico automatico: “durante la traduzione, i termini

presenti sia nel testo da tradurre, sia nel glossario o nei glossari associati al

progetto, sono individuati in modo automatico e i traducenti sono presentati sullo

schermo in tempo reale”. Alcuni strumenti inseriscono automaticamente tali

termini nella traduzione; tutti mettono a disposizione metodi rapidi per la loro

28

http://www.wordfast.net/index.php?whichpage=products&lang=itit

selezione e inserimento nel testo, riducendo i tempi di digitazione e le possibilità di

refusi. (Alessandra Muzzi 2000-2010).

Un potente strumento di gestione della terminologia, prodotto da Trados, è

chiamato MultiTerm. Nelle versioni più recenti è stato introdotto MultiTerm IX,

uno strumento che rende possibili più operazioni, come l'inserimento interattivo di

termini durante la traduzione, inoltre aumenta la complessità di uno strumento che

non aveva la facilità d'uso tra i suoi punti di forza. I punti di forza di MultiTerm

sono: “La capacità di gestione di più lingue, la strutturazione in concetti e l'ampia

configurabilità degli attributi”. (Alessandra Muzzi 2000-2010).

3.4 Programmi di concordanze e corpora. Come abbiamo già accennato una

memoria traduttiva può essere interrogata da un programma appositamente creato

per ricercare segmenti di testi tradotti in precedenza che sono proposti

automaticamente come nuove traduzioni. Oltre a questa modalità d’uso, le stazioni

traduttive offrono la possibilità di interrogare la memoria traduttiva per ricercare

particolari parole o espressioni. Il risultato è sempre presentato sotto forma di

concordanze parallele e cioè segmenti nella lingua di partenza in cui vediamo il

testo ricercato. In questo modo il traduttore visiona tutte le varianti in cui una

parola è stata tradotta in vari contesti, avendo la possibilità di adattare le parole

traducenti al nuovo contesto. Possiamo affermare che i corpora paralleli non sono

altro che memorie di traduzione “ovvero insiemi di testi in due lingue in cui

ciascun testo è una traduzione di un testo nell’altra lingua30”. Solo che una memoria

29

traduttiva rappresenta un tipo particolare di corpus elettronico31 in quanto di solito

consiste in traduzioni precedentemente effettuate da un particolare traduttore o

gruppo di traduttori per un determinato progetto.

3.5 Programmi di traduzione automatica. La traduzione automatica si basa su

un software che prevede la conversione di un testo da una lingua a un'altra in

conformità con un dizionario più o meno complesso. Un software o uno strumento

online per la traduzione automatica, può rivelarsi utilissimo in situazioni in cui un

ampio volume di traduzioni sia richiesto a brevi termini di consegna e in cui la

qualità richiesta non sia troppo elevata; ad esempio: e-mail in arrivo, sessioni di

chat, pagine web o testi, quando dobbiamo avere “un’idea complessiva” di cosa è

stato scritto nel documento originale in una lingua che non siamo in grado di

comprendere32. Molti considerano i programmi di traduzione automatica la

soluzione per tutte le esigenze di traduzione. Alcune aziende che producono tali

programmi sostengono che i propri software producono traduzioni di alta qualità

che si possono utilizzare per costruire una versione multilingue dei propri

documenti o del proprio sito Web, da presentare al pubblico33. I software per la

traduzione automatica sono strumenti che cercano di definire arbitrariamente il

contesto in cui le parole sono inserite, e producono risultati che, come abbiamo già

accennato, possono contenere (e di norma contengono) errori grammaticali e

sintattici. I programmi di traduzione automatica si possono classificare in base a

due criteri: in base alla situazione ( più o meno favorevole al loro utilizzo) e in base

agli utenti a cui sono destinati. Nel 1992 è stata proposta dall’associazione per lo

30

sviluppo dell’industria elettronica giapponese una serie di parametri per la

valutazione delle metodologie e dei criteri della traduzione automatica che sotto

riportiamo nella Tabella. 2.34

Tabella .2. Metodologie e criteri di traduzione automatica. (ZANETTIN, 2001)

Parametri Situazione favorevole

alla traduzione

automatica

Situazione poco

favorevole alla

traduzione automatica

Volume di traduzioni Ampio Limitato

Difficoltà delle traduzioni Facile Difficile

Qualità richiesta Bassa Elevata

Lingue coinvolte Una coppia specificata Diverse

Argomento e dominio linguistico

Limitato Ampio

Termini di consegna Brevi Dilazionati

Disponibilità tecnologiche Avanzate Non avanzati

Organizzazione dei termini traduttivi

Precisa suddivisione Poca suddivisione

Investimenti Alto investimento iniziale;baso investimento a lungo termine

Alto investimento

Disponibilità dei dati in formato elettronico

Pronta Richiede tempo e lavoro

Risorse finanziarie e disposizione per la traduzione automatica

Limitate Non limitate

Pre-, post-editing e editing interattivo

Richiede molto tempo e lavoro

Non richiede molto tempo e lavoro

31

Note al capitolo terzo

25 LAGOUDAKI, E (2006), Translation Memory systems: Enlightening users'

perspective. Imperial College of London, online su http://transnotes.blogspot.com

26,27MUZZI, A , 2000-2010, Translation & localization services for the Italian

language, online su http://www.amtrad.it

28Software Professionali ,online su http://www.navigaweb.it

29 OSIMO, BRUNO, 2005. Traduzione e nuove tecnologie. Informatica e Internet

per traduttori. Guida pratica con glossario, Milano, Hoepli. “Raccolta di testi,

enunciati scritti e/o orali, che possono caratterizzarsi per la lingua in cui sono

codificati, per il periodo in cui sono stati prodotti o anche per l’ambito settoriale a

cui fanno riferimento”.




31 raccolte di testi costruite per fini linguistici che possono essere creati anche su

carta oppure oralmente , ma i corpora moderni sono tutti elettronici. Mirko

Tavosanis, 2008, Linguistica dei corpora.

32

http://www.navigaweb.it/

http://www.amtrad.it/

http://transnotes.blogspot.com/

32,33Traduzione automatica e traduzione gratuita, 2009. www.traduzione-

localizzazione.com




CAPITOLO 4

GOOGLE

Dando uno sguardo al sito ufficiale di Google, che propone anche una breve storia

del motore di ricerca, scopriamo che “Google”35 è un gioco di parole che richiama

la parola “Googol”: una parola che fu inventata da Milton Sirotta, nipote del

matematico americano Edward Kasner, per descrivere il numero 1 seguito da 100

zeri. Un googol è un numero molto grande. L'uso che Google fa del termine riflette

la missione del motore di ricerca: organizzare un immenso, praticamente infinito

insieme di informazioni e documenti disponibili sul web. Google nasce dall'idea

geniale di due giovani laureati statunitensi, debutta online nel 1999 ed è oggi il

motore di ricerca più popolare. I creatori di Google sono Larry Page e Sergey Brin.

Laureati rispettivamente in Scienze e Ingegneria Matematica e in Scienze

Informatiche si conoscono tra i banchi dell'università di Stanford – Paolo Alto,

California, chiamata anche “fucina cerebrale della new economy36”. Insieme

costruiscono e gestiscono il progetto di ricerca della Stanford che porta alla 33

http://www.traduzione-localizzazione.com/

http://www.traduzione-localizzazione.com/

creazione di Google. Dagli inizi del 1998 studiano una metodologia

tecnologicamente avanzata per la ricerca d’informazione su internet. Si basano su

risultati ottenuti dopo anni di ricerche, sull’estrazione di dati su scala larga e sulla

struttura dei link del World Wide Web in particolare. Stabiliscono che mediante

una complessa analisi basata su algoritmi matematici, è possibile valutare la

qualità, l'importanza e la rilevanza delle pagine web segnalate da una ricerca.

Google è il leader incontrastato del WEB. Il colosso di Mountain View domina da

quasi dieci anni numerosi ambiti tra i quali la search (ricerca online), la pubblicità

on-line (Adwords e Adsense), la posta elettronica (Gmail), la produzione di

contenuti video (YouTube), l’editoria online (Google Books e Google Edition),

nonché, appunto, il settore dei language tools37.

4.1 Breve storia di un imperio. Dal 1999 a oggi Google ha ottenuto importanti

successi commerciali. Ormai diversi anni fa American On Line, all’epoca il più

grande internet service provider del mondo che conta oggi trentaquattro milioni di

clienti e dieci milioni di visitatori quotidiani, aveva firmato un accordo che lo lega

alla tecnologia e alla database di Google, lasciandosi alle spalle Inktomi38 e

l'accordo con Overture per le postazioni a pagamento. Inoltre AOL si è assicurata i

database che le consentano di visualizzare gli AdWords di Google come i

primissimi risultati delle ricerche. A giugno 2000 Google annuncia di aver censito

oltre un miliardo di pagine web di cui 560 milioni acquisite per intero e 500 milioni

segnalate solo in base al loro indirizzo web ma non ancora analizzate nel dettaglio.

34

http://googleenterprise.blogspot.com/2009/07/google-apps-standard-edition-still-free.html

http://www.youtube.com/?gl=IT&hl=it

http://mail.google.com/

https://www.google.com/adsense/

http://adwords.google.com/

http://www.google.com/

A maggio 2001 Google riporta in vita gli archivi dei newsgroup che furono di

Deja.com. Ha comprato l'immenso patrimonio culturale e sociale, praticamente sei

anni di discussioni pubbliche tra uomini e donne di tutto il mondo (650.000.000 di

messaggi). In seguito, oltre a fornire la tecnologia di ricerca ad aziende come

Yahoo e Supereva, Google ha messo a disposizione una serie di servizi per la

ricerca interna nei siti come ad esempio per Red Hat (azienda specializzata sul

sistema operativo Linux), e in una seconda fase li ha forniti a tutti gli utenti grazie

ad un semplice form online.

4.2 Google Translate. L’azienda di Google considera la traduzione come una

parte fondamentale nel “rendere le informazioni universalmente accessibili a tutti,

in tutto il mondo39”. Nel 2004 Sergey Brin, uno dei fondatori di Google, sottopose

il contenuto di una mail, ricevuta da un sostenitore sud-coreano, al traduttore

automatico che l'azienda stessa aveva creato. Il testo in sé diceva che Google era un

ottimo motore di ricerca, ma la traduzione automatica aveva prodotto il seguente

risultato: “Le scarpe di pesce crudo a fette che la cosa desidera. Google è proprio

un bel cipollotto!”40 Brin disse allora che tutto sommato Google poteva fare di

meglio. Sei anni dopo, il servizio gratuito di traduzione online Google Translate

funzionava per cinquantadue lingue, più di qualsiasi altro omologo ed è stato usato

centinaia di milioni di volte a settimana per la traduzione di pagine web e altri

contenuti. “Google Translate è, al momento, il massimo che si può fare”, afferma

con riguardo alle traduzioni computerizzate di argomento non specialistico Alon

35

Lavie, un ricercatore associato del Language Technologies Institute della Carnegie

Mellon University. La rapida ascesa di Google nell'olimpo dei traduttori automatici

mostra di cosa è capace il colosso quando si lancia in questioni complesse.

Oggi la rete di dati che ha messo insieme per la ricerca online, se valutata nel suo

insieme, può essere considerata la memoria più grande del mondo. Ora Google sta

usando la stessa forza per ottenere il massimo anche nel campo delle tecnologie per

la traduzione automatica. “La traduzione automatica è uno dei migliori esempi per

illustrare la strategia di Google per il futuro41” dice Tim O'Reilly, fondatore ed

executive della Casa Editrice O'Reilly Media. “Non viene presa troppo sul serio,

ma Google va oltre ed ha più esperienza rispetto ad altri. Ha inoltre intenzione di

fare gli investimenti necessari ad affrontare questioni avanti rispetto al mercato

attuale”. Sempre O’Reilly afferma che la creazione di un sistema di traduzione

automatica è una delle sfide più difficili nell'intelligenza artificiale. Per adesso i

sistemi di traduzione automatica sono ben lontani dall’essere perfetti. Gli esperti

sostengono che per un computer è ancora troppo difficile dividere in parti una frase

per tradurla e ricomporla, anche se il servizio di Google è già in grado di dare il

succo di un articolo di notizie, ed è diventato una fonte di traduzioni all'impronta

immediate per milioni di persone. “Se ti basta una traduzione per sommi capi, è ciò

che fa per te” dice Philip Resnik, esperto di traduzione automatica e professore

associato di linguistica all’Università del Maryland, a College Park. “Ogni barriera

linguistica potrà essere eliminata” dice Franz Och, il ricercatore di Google.

“Chiunque potrà comunicare con chiunque altro”, afferma Och, scienziato tedesco

che ha lavorato all’Università della Southern California.

36

Mentre molti sistemi di traduzione simili a quello di Google necessitano fino

a un miliardo di parole di testo per creare un modello di lingua, Google è andata

oltre e si è spinta fino ad alcune centinaia di miliardi di combinazioni in inglese.

“Più testi si lavorano, più precisi diventano i modelli”, afferma Och. Lo sforzo è

valso la candela. Un anno dopo, Google ha vinto un concorso voluto dal Governo

per la sperimentazione di sistemi di traduzione più complicati. Google ha usato un

approccio simile - computer immensamente potenti, montagne di dati e statistiche –

per altre offerte di servizi complessi.

Nel 2007 ha lanciato l’800-GOOG-411, un servizio telefonico gratuito di

assistenza, capace di interpretare richieste vocali, che ha dato modo a Google di

raccogliere le voci di milioni di persone, con le quali il sistema ha imparato a

riconoscere in modo più preciso l'inglese parlato. Neanche un anno dopo, Google

ha presentato un sistema di ricerca vocale, simile a quelli che altre compagnie

avevano ottenuto dopo anni di studi e ricerche.

Verso la fine dell'anno scorso, Google ha introdotto un altro sistema chiamato

Goggles che analizza le foto dal cellulare e le confronta con un database che

contiene più di un miliardo d’immagini disponibili online, incluse quelle delle

strade disponibili su Street View. Och riconosce che il sistema di traduzione di

Google deve ancora migliorare, ma dice pure che la cosa procede molto

velocemente. Vedremo in seguito le caratteristiche dei più importanti strumenti di

traduzione che Google mette alla disposizione degli utenti.

37

4.3 Google Translator Toolkit. Google lancia sul mercato il 5 settembre del

2009 il Google traduttore Toolkit, un potente editore di facile uso che permette ai

traduttori di “aggiungere quel tocco umano sulla traduzione automatica42”. Ad

esempio, se un lettore di lingua araba vuole tradurre un articolo di Wikipedia

dall’inglese, si carica l'articolo nel traduttore Toolkit, si corregge la traduzione

automatica, e clicca il pulsante “pubblica”. Il Toolkit traduttore è integrato con

Wikipedia, rendendo semplice la pubblicazione di articoli tradotti. Una novità

assoluta è che, il sistema di traduzione automatica “impara” dalle sue correzioni,

creando un circolo virtuoso che può aiutare a tradurre i contenuti in quarantasette

lingue, in altre parole oltre il 98% della popolazione di Internet nel mondo.

Fig.3. Google Translator Toolkit

4.4 Funzioni e Caratteristiche del Traduttore Online. Il traduttore

automatico online è un comodo strumento per la traduzione, raggiungibile

dall’home page www.google.it cliccando sulla voce “strumenti per le lingue”

consente di eseguire traduzioni online in maniera semplice e abbastanza precisa. Il

38

http://translate.google.com/toolkit

language tool di Google offre dunque la possibilità di tradurre parole, frasi ed

anche testi più o meno complessi in diverse lingue, a partire dalla lingua da cui si

desidera tradurre.

È diviso in tre parti: la prima propone all'utente di effettuare una ricerca sul Web

partendo da una keyword nella propria lingua, onde trovare risultati su Google nella

lingua desiderata in cui detta keyword verrà tradotta, come si può osservare

nell’immagine seguente: Fig.4.

Fig.4. Google Translate.

39

La seconda, invece, consente di inserire un testo, scegliere la lingua di

partenza (quella in cui è scritto il testo) e quella di destinazione (quella in cui il

testo deve essere tradotto). Come si può osservare nell’immagine seguente: Fig.5

Fig.5. Google Translate

La terza scelta consente di inserire l'indirizzo di una pagina Web da

tradurre, di selezionare la lingua in cui la pagina è scritta e di specificare la lingua

in cui si vuole tradurre questa pagina. In tutti e tre i casi, il risultato delle traduzioni

può apparire approssimativo, ma c’è da considerare una cosa: più il testo è accurato

e senza errori ortografici più il risultato della traduzione è di buona qualità.

40

Fig.6. Google Translate

4.5 Client for Google Traslate. Parliamo ancora di traduzioni indicando un

programma da installare sul computer che permette di usare Google Translate,

senza aprire Internet Explorer o altri browser. Come già riferito prima, Google

Translate è il principale servizio online per le traduzioni dirette e immediate da una

lingua a un'altra. Esso si usa su internet, direttamente cliccando gli strumenti delle

lingue dalla pagina di partenza di Google oppure usando altri siti web che sfruttano il

traduttore di Google con traduzioni in tempo reale. Ma esiste anche un programma

efficace che permette di usare il servizio online Google Translate da desktop, senza

quindi usare un browser e in modo da integrarsi con Windows e tutti i programmi

usati. Questo programma desktop si chiama Client for Google Translate, e sfrutta il

servizio Google Translate in maniera trasparente per l’utente, anche all’interno di

applicazioni diverse (ad esempio, un programma di videoscrittura)

41

http://www.navigaweb.net/2009/10/traduzione-online-per-le-lingue.html

http://www.navigaweb.net/2009/10/traduzione-online-per-le-lingue.html

Fig.7. Client for Google Translate

Alcune impostazioni si devono configurare subito dopo l'installazione, in

particolar modo la lingua in cui si desidera tradurre, perché il testo deve essere

tradotto in automatico. Il software è configurato per rilevare automaticamente la

lingua di ciò che è scritto nella prima finestra e che l'utente vuole tradurre. Il testo

può essere selezionato con il mouse e una piccola icona G apparirà accanto. Se

l'icona o il pulsante viene premuto, l'area si estende automaticamente e si visualizza

la traduzione senza appesantire la visuale e il computer. Numerosi controlli sono

visualizzati sotto il testo tradotto, compresa la possibilità di copiare parole e frasi

negli “Appunti di Windows” o di selezionare manualmente le lingue per la

traduzione, diventa utile nel caso in cui il servizio di traduzione rileva la lingua

sbagliata. Lo stesso Google client può essere utilizzato in altre applicazioni e

finestre di altri programmi aperti previa impostazione. Di default esso s’installa con

l'opzione “avvio con Windows” in modo che si avvia da solo quando si accende il

42

computer, ma si può anche disabilitare. Il client di Google Translate è un

programma software adatto per sistemi operativi come Windows Xp, Vista e

Windows Seven43.

4.6 Google Toolbar. Google Toolbar è uno strumento che s’integra direttamente

nel browser Internet Explorer (esiste anche una versione per Firefox) e che

permette di avere a disposizione una serie di funzioni utili durante la navigazione.

La Google Toolbar offre una grande varietà di funzioni, in questa pagina

riassumeremo le principali. Nel campo di ricerca di Google, posizionata nella

toolbar stessa, appare un elenco con le ricerche più frequenti effettuate con Google,

le eventuali correzioni ortografiche, insieme alla cronologia delle ricerche di

Google Toolbar e ai segnalibri. Google Toolbar garantisce che i parametri

predefiniti di ricerca siano impostati correttamente e avverte quando spyware, o

altri programmi tentano di modificare le impostazioni di ricerca predefinite usando

altri motori di ricerca. Google Toolbar offre anche uno strumento utile per le

traduzioni, che ci dà la possibilità di tradurre da sessantasette lingue,

semplicemente selezionando “Traduci questa pagina” dal menu “Traduci” della

Toolbar. Si possono anche tradurre singole parole che si trovano in una pagina web

utilizzando la funzione “Traduttore di parole”, selezionando “Attiva traduttore di

parole” dal menu “Traduci”, basta collocare il cursore del mouse su una parola

“straniera” per poter visualizzare la traduzione.

43

Fig.8.Funzione di Google Toolbar

4.7 Novità per la traduzione automatica. A febbraio del 2010 Google fa un

passo avanti per infrangere il muro linguistico – culturale, facilitando ancora di più

la traduzione. La grande evoluzione di Google si chiama “Google Goggles”. Si

tratta di un servizio, inserito nei cellulari dotati di sistema operativo Android, che

permette di tradurre un intero testo tramite una fotografia. A chiunque capitata di

trovarsi in un luogo e di avere l'esigenza di leggere una scritta che magari è in

lingua straniera; per farlo, basta fotografare il testo e istantaneamente sullo schermo

del cellulare arriva la traduzione. Già in passato Google aveva annunciato il

servizio “Goggles” come uno strumento per reperire le informazioni tramite

fotografia. In sostanza la fotocamera del “googlefonino” è trasformata in una sorta

di scanner, mentre Goggles (che in inglese significa “occhiali”) ha la funzione

aggiunta di un OCR, ovvero di un software in grado di riconoscere il testo

anteriormente selezionato dall'utente e digitalizzarlo, e poi di tradurlo in modo

istantaneo. Ora la novità sta proprio nel supporto multilingua con relativa

traduzione, per adesso disponibile solo con il sistema operativo Android 1.6 e

successivi. Il servizio, oltre al traduttore istantaneo, consente anche di analizzare

una foto ottenendo informazioni riguardanti il soggetto: per esempio, partendo da

un’immagine di un quadro abbastanza famoso si possono avere autore, titolo,

44

museo, e altri dati utili. In più l'applicazione è in grado di identificare monumenti,

paesaggi, luoghi aziendali ed etichette di vini. “Google Images” è in grado di

riconoscere le immagini fotografate e dare le dovute spiegazioni sull'oggetto

catturato dalla fotocamera. Certamente si tratta di un grande supporto per tutti

quelli che non potendo stare di fronte a un computer, hanno bisogno d’informazioni

utili e soprattutto istantanee44.

Fig.9. Google Goggles.

4.8 Traduzione speech to speech. Visto il successo di Google Translate che

traduce documenti o pagine web in ben cinquantadue lingue, e di Google Voice che

conta già 1,4 milioni di utenti, la società di Mountain View sta lavorando a un

interprete universale da installare nel giro di due, tre anni negli smartphone, e che

45

consentirà a due persone che non parlano la stessa lingua di comunicare via

telefono in tempo reale. “Siamo convinti di poter arrivare a questo software speech-

to-speech nel giro di pochi anni” – ha detto al Sunday Times Franz Och,

responsabile dei servizi di traduzione di Google – anche se, per farlo funzionare

correttamente, “bisognerà arrivare alla perfetta combinazione fra un accurato

traduttore automatico e un sistema di riconoscimento vocale ad alta precisione ed è

proprio in questa direzione che ci stiamo muovendo”. Per stessa ammissione

dell’esperto, mentre i traduttori automatici di testo hanno fatto passi da gigante

negli ultimi anni, i sistemi di riconoscimento vocale sembrano, invece, dare

maggiori grattacapi. “Ognuno di noi ha la sua voce e il suo accento” – ha

continuato Och – ma la natura personale dei cellulari dovrebbe permettere di

aggirare questo problema. “Naturalmente, questo software diventerà tanto più

accurato quanto più sarà usato e, quindi, più dati inseriranno, migliore sarà la

qualità di traduzione” (Franz Och, 2009)45.

46

http://technology.timesonline.co.uk/tol/news/tech_and_web/personal_tech/article7017831.ece

Note al capitolo quarto.

34KOLLER, DAVID, Gennaio 2004. Origin of the name, “Google”. Stanford

University. Fonte online www.searchenginehistory.com35ROBERTO, CURCI, 2007. Risorse per Webdesigner e Webcoders. Fonte online

www.robertocurci.net36New York Times del 9 marzo 2010, a cura di Miguel Helft. Fonte online

www.tg3.rai.it37 Inktomi Corporation - società della California che ha fornito il software per i

fornitori di servizi Internet. È stata fondata nel 1996 dal professor Eric Brewer e dal

dottorando Paul Gauthier. Fonte online www.business.com38 Profilo aziendale consultabile online su http://www.google.com/corporate/.39New York Times del 9 marzo 2010, a cura di Miguel Helft. Fonte online

www.tg3.rai.it40L'azienda di Tim O’Reilly è ritenuta da molti la migliore casa editrice di

Informatica al mondo, e tanti sono i programmatori che considerano un libro

O'Reilly il libro definitivo su un certo argomento. Fonte online http://oreilly.com/41 Franz Josef Och lavora con Google dal 2004 come ricercatore scientifico, capo

gruppo della squadra di traduzione automatica. Fonte online

www.research.google.com

47

http://www.research.google.com/

http://oreilly.com/

http://www.tg3.rai.it/

http://www.nytimes.com/2010/03/09/technology/09translate.html?ref=global-home

http://www.business.com/


http://www.robertocurci.net/

http://www.searchenginehistory.com/

http://en.wikipedia.org/wiki/Stanford_University


http://graphics.stanford.edu/~dk/google_name_origin.html

42 GAVEZ, M e BHANSALI, SANJAY, 2009. Tradurre il mondo

dell’informazione con Google Translator Toolkit. Fonte online

www.googleblog.blogspot.com43 Client for Google Translate –Free Translator. Fonte online su

www.translateclient.com41 44Google Goggles – Fonte online

www.whatisgooglegoggles.com 45 The Sunday Times ,February 7, 2010. Google leaps language barrier with

translator phone, a cura di Chris Gourlay. Fonte online www.timesonline.co.uk

CAPITOLO 5

SPEECH TO SPEECH TRANSLATION

“I sistemi di traduzione Speech-to-Speech hanno il potenziale di rivoluzionare il

modo in cui le persone di tutto il mondo, che parlano lingue diverse, riescono a

comunicare l'uno con l'altro. Ci sono migliaia di lingue parlate. Immaginate di

essere in grado di comunicare istantaneamente con chiunque, attraverso l'assistenza

di un traduttore universale. “La sconfitta delle ultime barriere di comunicazione

comporterebbe un’enorme crescita nella comprensione culturale, consentendo alle

persone di accettare e convivere con le differenze dell’altro46”, dichiara la

ricercatrice Yuging Gao. Sempre lei afferma che la parte più importante della

ricerca con un compito cosi innovativo sta nell’affrontare sfide nuove. “È molto

emozionante trovare un modo per riconoscere, comprendere e tradurre lingue

attraverso tecniche avanzate47”.

48

http://www.timesonline.co.uk/

http://www.googleblog.blogspot.com/

5.1 Ricerca e tecnologia. L'obiettivo della traduzione Speech-to-Speech (S2S) è

quello di consentire la comunicazione interpersonale in tempo reale, tramite il

linguaggio naturale delle persone che non condividono un linguaggio comune. Il

traduttore automatico multilingua Speech-to-Speech (MASTOR) è il primo sistema

S2S che permette la comunicazione bidirezionale tra la coppia di lingue inglese –

mandarino. Mastor (Multilingual Automatic Speech-to speech Translator) è stato

avviato nel 2001 come un progetto di ricerca avanzato della IBM ed è stato

selezionato per essere finanziato dalla Defence Advanced Research Projects

Agency (DARPA). Mastor unisce le tecnologie di avanguardia di IBM nei seguenti

settori: riconoscimento automatico della voce, comprensione e sintesi. La stretta

dipendenza tra il riconoscimento vocale e la comprensione attenua efficacemente

gli effetti dovuti all’errato riconoscimento vocale di strutture agrammaticali

comune nel linguaggio colloquiale. La qualità della traduzione risulta altamente

affidabile in certi domini di attività. Mastor possiede attualmente la capacità

bidirezionale di tradurre tra l’inglese e il mandarino in forma libera senza vincoli,

con un vocabolario di grandi dimensioni (più di 30.000 parole per ogni lingua)

adatto a vari settori: viaggi, diagnosi medica di emergenza, protezione delle forze

di difesa e sicurezza. Funziona in tempo reale su portatile, ed è stato sviluppato

anche per palmare PDA, con un minimo degrado delle prestazioni. Entrambe le

versioni del sistema offrono ottime prestazioni, come dimostrato a febbraio e ad

agosto del 2004 a DARPA che dopo una valutazione complessa l’ha dichiarato

soddisfacente. L’IBM è stata l'unica squadra in grado di presentare un sistema di

traduzione bidirezionale speech-to-speech per PDA ottimizzato in modo da 49

richiedere una minore quantità di memoria e minimi requisiti di elaborazione per

prestazioni elevate. DARPA e la comunità tecnologica riconoscono Mastor come

una svolta nella traduzione del linguaggio parlato per la sua capacità di analizzare

l’imput vocale e produrre un output bidirezionale. La costruzione di efficaci sistemi

per la traduzione speech-to-speech è stato il sogno dei ricercatori in linguaggio

naturale per decenni. È tecnicamente molto difficile a causa della necessità di

integrare una serie di tecnologie complesse - Automatic Speech Recognition (ASR),

Natural Language Understanding (NLU), traduzione automatica (MT), Natural

Language Generation (NLG) e Text-to-Speech Sintesi (TTS) - che sono tutt'altro

che mature, tanto meno quando vengono usate insieme. Attualmente, l'unico

apparecchio per la traduzione vocale disponibile sul mercato è Phraselator, un

semplice dispositivo di traduzione unidirezionale che è stato personalizzato per

l’uso militare. Cerca tra un numero fisso di frasi in inglese e riproduce le

registrazioni vocali corrispondenti in lingue straniere, però non può gestire un

discorso bidirezionale48.

5.1.1 Come funziona Mastor IBM? Il funzionamento del nuovo software si

articola in tre momenti successivi: Mastor memorizza una frase pronunciata da uno

degli interlocutori e la converte in testo scritto, quindi esegue una traduzione di tale

frase nella lingua del secondo interlocutore e finalmente riferisce la frase tradotta

attraverso un sintetizzatore vocale. A differenza di altri prodotti simili, non richiede

l’uso di frasi già memorizzate e non deve identificare ogni parola pronunciata, ma è

50

http://adv.edintorni.net/click/?mo=T&ky=traduzione+inglese+italiano&af=3702&ct=it&rf=http%3A%2F%2Fwww.technorati.it%2Fmastor-il-traduttore-simultaneo-che-non-fa-la-traduzione-letterale-delle-parole-ma-comprende-il-concetto-della-frase%2F&re=&ts=1279800390718&hs=59003f1b35f6c51e1f1934dda390dd7a

http://assistenza.tiscali.it/magazine/042003/28042003.html

in grado di comprendere il concetto. La traduzione di Mastor, infatti, si basa

sull’analisi statistica del linguaggio: il traduttore automatico scompone la frase di

origine in un set d’idee concettuali e ripropone gli stessi concetti nella lingua

richiesta. Se, per esempio, tale frase esprime una richiesta di aiuto di carattere

medico, essa sarà tradotta sempre con un’unica frase predefinita che ne conservi il

significato, senza ricorrere ad una traduzione letterale delle singole parole che la

compongono. In tal modo, si potrà evitare l’utilizzo di corposi database, necessari

per la traduzione, e rendere più agevole l’introduzione della nuova tecnologia IBM

in dispositivi di ridotte dimensioni49. Tra le sue principali caratteristiche, abbiamo

una notevole riduzione degli errori legati a differenze di accento, utilizzo di

espressioni dialettali e interiezioni, e delle varie tonalità di voce. L’IBM ha

precisato che la tecnologia Mastor è ancora in fase di sviluppo e che è ancora

troppo presto per prevedere quando tale tecnologia potrà essere inclusa nei primi

dispositivi hardware50.

51





http://www.fantascienza.com/magazine/notizie/7418/


Fig.10. Architettura di Mastor IBM

Note al capitolo quinto

46,47,48traduzione propria dall’intervista rilasciata da Yuqing Gao, 2009, Speech-to-

Speech Translation, online su www. domino.watson.ibm.com

49Mastor: il traduttore simultaneo che non fa la traduzione letterale delle parole ma

comprende il concetto della frase, 2007, online su www.technorati.it

50traduzione propria dall’articolo Mastor, 2007, online su www.IBM.com

52

http://www.technorati.it/

http://www.technorati.it/mastor-il-traduttore-simultaneo-che-non-fa-la-traduzione-letterale-delle-parole-ma-comprende-il-concetto-della-frase/

http://www.technorati.it/mastor-il-traduttore-simultaneo-che-non-fa-la-traduzione-letterale-delle-parole-ma-comprende-il-concetto-della-frase/

CAPITOLO 6

HILBERT ENGINE

Il futuro della traduzione automatica prevede la semplificazione dei testi da

tradurre e lo sviluppo della cosiddetta “memoria di traduzione”, vale a dire la

memorizzazione di frasi ripetitive: in questo senso Internet si rivela un'opportunità

da non perdere. Secondo le previsioni, questo futuro è rappresentato da enormi

database che raggiungono velocemente ed accuratamente l’informazione con

l’aiuto della tecnologia vettoriale, sviluppata attualmente da Primentia. Inc con un 53

prodotto molto promettente chiamato Hilbert Engine. Il motore di Hilbert

Technology Inc. rappresenta un approccio radicalmente nuovo ai database di

traduzione. L'offerta si basa sulla tecnologia Hilbert Engine per l'accesso ad

altissima velocità, manipolazione, conservazione e analisi di grandi volumi di dati

strutturati e non strutturati . La tecnologia Hilbert Engine trova le sue applicazioni

per: servizi pubblici, traduzione, legge, governo, finanza, comunicazioni, trasporti,

turismo e industria Chimico-Farmaceutica.

6.1 L’invenzione. Il motore Hilbert trae le sue radici da un lavoro per la

pulizia di molti gigabyte di dati scarsamente associati. Il progetto viene proposto a

una grande azienda di consulenza che dopo molti mesi di analisi trae la conclusione

che ci sarebbero voluti mesi di “run-time” per pulire questi dati. Bjorn Gruenwald,

l'inventore del Motore Hilbert, ha avuto l'opportunità di rivedere il problema ed ha

suggerito un approccio radicalmente innovativo: analizzare tutte le colonne di una

tabella in file di singole parole e tradurre tutti i dati di queste file in numeri. Così

una banca di dati sarà completamente trasformata in una matrice di dati numerici in

un ambiente chiamato Hilbert Space. Questa struttura utilizza l’efficiente

linguaggio di programmazione chiamato Hilbert-Script (H-Script). Anche se su

questo approccio c’era inizialmente un grande scetticismo da parte dei

professionisti IT , la ditta ha scelto di procedere. La soluzione di Bjorn è stata

testata con successo, con grandi vantaggi in termini di tempo di ricerca e di accesso

ai dati. 54

Fig.11. L’architettura del CPU Hilbert

Dopo questo successo iniziale, Hilbert Engine è stato applicato per la gestione di

database nell’industria farmaceutica e nelle applicazioni di sicurezza del governo.

6.2 Sviluppo. Il tempo impiegato per lo sviluppo delle applicazioni di ricerca e

reperimento dati è più breve con il Motore Hilbert, efficienza dovuta in parte al H-

script e alla progettazione dello spazio Hilbert. Per esempio presupponiamo che

dobbiamo scegliere da un database di milioni di persone tutti i record con il valore

nome uguale a “Washington”, con capelli castani e occhi blu, che vivono in

“Philadelphia” e hanno tra i 30 e i 50 anni. Si deve specificare che questi dati non

sono stati indicizzati per campi singoli, come nome, colore dei capelli o degli

55

occhi, città o età. Con la tecnologia attuale sarebbe quasi impossibile ottenere le

risposte in meno di un secondo – ma questo è invece reso possibile dal Motore

Hilbert. Questa velocità incredibile non è limitata ai dati basilari (come un Address

Book), ma si estende anche ai dati associati51.

Fig.12. La tecnologia vettoriale

6.3 Prospective per il futuro della traduzione. L’Hilbert Engine non è

direttamente uno strumento di traduzione automatica: è piuttosto uno strumento di

ricerca veloce attraverso grandi quantità di dati. Viste le potenzialità di Hilbert

Engine e la rapidità nel rintracciare le informazioni presenti in una banca dati

possiamo ipotizzare una futura “macchina traduttrice” che riuscirà a superare la

traduzione umana offrendo velocità e accuratezza . Non è forse lontano il momento

56

in cui il muro linguistico che separa nazionalità e culture lontane sarà abbattuto

attraverso queste tecniche di avanguardia, che consentiranno a interlocutori di varie

lingue di comunicare via telefono, internet e appositi dispositivi ognuno nella sua

lingua naturale senza nessuna barriera linguistica, oppure di tradurre con un

semplice clic testi scritti in tutte le lingue del mondo, eliminando cosi per sempre

gli effetti della Torre di Babele.

Note al capitolo sesto.

51 Traduzione propria dalla pubblicazione “Perspective on Performance in Business

Intelligence- The Hilbert Engine” 2009. Hilbert Technology Inc. Le immagini

Fig.11.e Fig.12. appartengono alla stessa pubblicazione.

57

Conclusione finale

Uno degli aspetti più esaltanti del lavoro nel campo della traduzione

automatica – e dunque anche della ricerca che è stata alla base di questo lavoro di

tesi – è quello di poter prefigurare una situazione in cui il mitico muro linguistico

inizia a sciogliersi, dando luogo a una comunicazione completa tra esseri umani

parlanti lingue diverse. A testimoniare il fatto che questa possibilità inizia a non

sembrare più solo un’ipotesi irrealistica, sono i più importanti strumenti informatici

disponibili sul mercato e il loro prevedibile sviluppo futuro.

Nell’esaminare queste prospettive, ho cercato di includere in questo elaborato

anche una parte pratico-applicativa, sotto forma di riferimenti utili per rintracciare e

utilizzare in modo giusto alcuni fra i più potenti strumenti informatici per la

traduzione automatica esistenti online. Nel farlo, mi sono basata su un lavoro di

ricerca che ha richiesto anche la traduzione di varie pubblicazioni nel campo.

Sicuramente, la difficoltà principale che ho incontrato è stata quella della selezione

dei materiali da utilizzare. Mi riferisco principalmente alla scelta degli autori e

58

delle pubblicazioni più affidabili. La traduzione automatica è un argomento

estremamente complesso, ogni contributo fornisce o può fornire nuovi argomenti,

per cui mantenere la giusta strada non è mai facile.

Per capire meglio l’importanza della traduzione automatica proviamo ad analizzare

le due tabelle sotto riportate: nella prima possiamo osservare il mercato della

traduzione negli anni novanta invece la seconda rappresenta la traduzione

automatica oggi.



Europa e Stati Uniti 300 milioni di pagine 2.5 milioni di pagine

Giappone150 milioni di pagine 3.5 milioni di pagine



Europa e Stati Uniti (Unione Europea)

400 milioni di pagine 200 milioni di pagine

59

Giappone200 milioni di pagine 50 milioni di pagine


Come possiamo osservare, rispetto a vent’anni prima, nel 2010 il mercato della

traduzione automatica è radicalmente cambiato: da una percentuale di appena l’8%

di traduzioni automatiche negli anni novanta si passa al 50% nell’Unione Europea e

al 25% in Giappone. Attraverso questi datti possiamo renderci conto dell’enorme

espansione che il settore ha conosciuto negli ultimi vent’anni e formulare ipotesi

per poter immaginare come saranno i prossimi venti.

60

Bibliografia

BERTAZOLLI, La traduzione: teorie e metodi, Carocci editore, 2006

BOWKER, L.; Computer-Aided Translation Technology. A practical introduction. University of Ottawa Press, Ottawa 2002.

CHIARI, I.; Informatica e lingue naturali. Teorie e applicazioni computazionali per la ricerca sulle lingue. Aracne, Roma 2004.

HAROLD L. SOMERS: "New Paradigms" in MT: The state of play now that the dust has settled. In ESSLLI '98 Machine Translation Workshop

HAROLD L. SOMERS: Computers and translation. A translator’s guide. J. Benjamins Publishing Company, Philadelphia 2003.

HEIDEGGER, M Sentieri interrotti, trad. it. di P. Chiodi, La Nuova Italia, Firenze 1968, p. 300

HEIDEGGER, M. Che cosa significa pensare? a cura di U. Ugazio e G. Vattimo, Sugar, Milano 1979,

JACOBSON, Note per una didattica sulla storia della traduzione. Aspetti del linguaggio e della traduzione, trad. it. di R. Bianchi e C. Béguin Garzanti, Milano 2004

LAGOUDAKI, E (2006), “Translation Memory systems: Enlightening users perspective”. Imperial College London

MONACELLI, C; Traduzione, revisione e localizzazione nel terzo millennio: da e verso l'inglese. FrancoAngeli, 2001

61

MOUNIN, Teoria e storia della traduzione, Einaudi, 2006

NEGAARD, S (a cura di), Teorie contemporanee della traduzione, Bompiani, 2007 (introduzione e saggi di: Jakobson, Eco)

NERGAARD, S. La teoria della traduzione nella storia, Bompiani, Milano 1993. MARCO TULLIO CICERONE, De optimo genere oratorum,

O’HAGAN, M.; ASHWORTH, D.; Translation-mediated communication in a digital world. Facing the challenges of Globalization and Localization. Multilingual Matters, Clevedon 2002.

OSIMO, B.; Traduzione e nuove tecnologie. Informatica e Internet per traduttori, guida pratica con glossario. Hoepli, Milano 2001.

SAN GEROLAMO, Liber de optimo genere interpretandi, Epistola 57 a Pammacchio, (390 ca.), in TTS, pp.63-71.

Pubblicazioni e riviste online

Client for Google Translate –Free Translator. Fonte online su

www.translateclient.com,

Concise history of the language sciences: from the Sumerians to the cognitivists.

Edited by E.F.K.Koerner and R.E.Asher. Oxford: Pergamon Press, 1995. 431-445,

online su: www.hutchinsweb.me.uk/history.htm

CURCI, ROBERTO 2007. Risorse per Webdesigner e Webcoders. Fonte online:

www.robertocurci.net

Ermeneutica, tradizione e traduzione in Heidegger, a cura di Francesco Cardone, fonte online: www.filosofico.net

62

http://www.filosofico.net/

http://www.robertocurci.net/

http://www.translateclient.com/

GAVEZ, M e BHANSALI, SANJAY, 2009. Tradurre il mondo dell’informazione

con Google Translator Toolkit. Fonte online www.googleblog.blogspot.com

Google Goggles – Fonte online: www.whatisgooglegoggles.com

KOLLER, DAVID, Gennaio 2004. Origin of the name, “Google”. Stanford

University. Fonte online www.searchenginehistory.com

Machine Translation and Computer-Assisted Translation: a New Way of

Translating? by Olivia Craciunescu, Constanza Gerding-Salas, Susan Stringer-

O'Keeffe, 2004. Online su http://accurapid.com/journal/29computers.htm.

MAEGAARD, B, 1989. Perspectives in artificial intelligence vol. 2: machine

translation, NLP, databases and computer-aided instruction. Source


MUZZI, A, 2000-2010, Translation & localization services for the Italian

language, online su http://www.amtrad.it

New York Times del 9 marzo 2010, a cura di Miguel Helft. Fonte online

www.tg3.rai.it

Perspective on performance in Business Intelligence- The Hilbert Engine-Hilbert Technology Inc. 2004, online su: hilbertcompany.es/fileadmin/Documents/.../OV_Company_Overview.pdf

Software Professionali online su http://www.navigaweb.it

The Sunday Times, February 7, 2010. Google leaps language barrier with

translator phone, a cura di Chris Gourlay. Fonte online www.timesonline.co.uk

Traduzione automatica e traduzione gratuita, 2009. www.traduzione-

localizzazione.com

63

http://www.timesonline.co.uk/

http://www.navigaweb.it/

http://www.tg3.rai.it/


http://www.amtrad.it/


http://accurapid.com/journal/29computers.htm

http://www.searchenginehistory.com/



http://graphics.stanford.edu/~dk/google_name_origin.html

http://www.googleblog.blogspot.com/