strumenti per la traduzione online. by ioana valeria martinescu
TRANSCRIPT
A mia nonna
Mizi,
1
INDICE
Premessa …………………………………………….……5
STORIA DELLA TRADUZIONE
Introduzione……………………………………………………….7
1.1 Approccio alla traduzione automatica………………………………10
Note e Riferimenti Bibliografici. Capitolo primo …………………….12
LA TRADUZIONE AUTOMATICA
Introduzione ………………………………………………………13
2.1. Eurotra project………………………………………………………...17
2.2. Modelli di traduzione automatica…………………………………….19
Note al capitolo secondo………………………………………………….22
TRADUZIONE ASISTITA DAL COMPUTER
3.1. Strumenti C.A.T/T.M………………………………………………….24
3.2. Translation Memory (Memorie traduttive)……………………………25
3.3. La gestione della terminologia ………………………………………...26
3.4. Programmi di concordanze e corpora …………………………………28
3.5. Programmi di traduzione automatica ………………………………….292
Note al capitolo terzo ……………………………………………………...32
Introduzione ………………………………………………………..33
4.1. Storia di un imperio…………………………………………………….34
4.2. Google Translate……...………………………………………………..35
4.3. Google Translator Toolkit…………………………………………......37
4.4. Funzioni e caratteristiche del traduttore online………………………38
4.5. Client for Google Translate…………………………………………....41
4.6. Google Toolbar…………………………………………………….….42
4.7. Novità per la traduzione automatica …………………………………43
4.8. Traduzione speech to speech………………………………………….45
Note al capitolo quarto …………………………………………..47
SPEECH TO SPEECH TRANSLATION
Introduzione ………………………………………………………..49
5.1. Tecnologia e ricerca ………………………………………………….49
5.1.1Come funziona Mastor IBM?..............................................................51
Note al capitolo quinto ……………………………………….…..53
HILBERT ENGINE
Introduzione ………………………………………………………54
6.1. L’invenzione…………………………………………………..55
6.2. Sviluppo ……………………………………………………...56
6.3. Prospettive nel futuro della traduzione ……………………...57
Note al capitolo sesto ……………………………………………..58
3
Conclusione Finale………………………………………...59
Bibliografia…...…………………………………………….61
4
Premessa,
Il presente elaborato si propone di analizzare la traduzione automatica come
strumento al servizio del traduttore “umano”. Oltre l'approfondimento di vari
strumenti informatici come Google Translator (capitolo quarto) sorge la domanda
filosofica relativa a come superare il muro linguistico nel contesto della
globalizzazione. Quesito che sembra trovare la risposta nelle nuove tecnologie
informatiche che promettono di offrire a breve la comunicazione diretta tra
interlocutori che – pur parlando lingue diverse - riescono a capirsi in tempo reale
attraverso l'aiuto di un semplice dispositivo (capitolo quinto).
Per dare un’immagine complessiva del tema trattato, questo lavoro è
suddiviso in sette capitoli che trattano la traduzione automatica dal novecento fino
ad oggi offrendo anche informazioni sulle scoperte di frontiera nel settore. Il primo
capitolo si apre con una breve introduzione storica per poi avvicinarsi alla nascita
della traduzione automatica nel XX secolo. Il secondo descrive il progetto Eurotra,
un reale strumento di collaborazione tra gli stati dell’Unione Europea, ideato per la
creazione di una memoria traduttiva gigantesca con cui tradurre efficacemente atti e
documenti ufficiali. Nello stesso capitolo parliamo anche di vari tentativi di creare
macchine traduttrici o programmi che non necessitano l’intervento umano nel
processo traduttivo .
Nel terzo capitolo, invece, sono stati elencati i principali strumenti
informatici di traduzione assistita dal computer, che possono servire al traduttore
5
umano per velocizzare il proprio lavoro. Vedremo esempi di come rintracciare,
usare e valutare programmi informatici quali memorie traduttive, traduttori online,
glossari e macchine “traduttrici”. Il quarto capitolo, che dà anche il nome alla tesi,
esamina le principali caratteristiche di Google Translator e presenta la storia di un
progetto che sta contribuendo a rivoluzionare la comprensione delle lingue naturali,
mettendo a disposizione degli utenti importanti strumenti online per facilitare la
traduzione di libri, documenti e siti. Spostando semplicemente il mouse sopra un
testo con Google Translator appare la traduzione nella lingua del nostro browser,
con la possibilità di scegliere tra più di novanta lingue. Nello stesso capitolo
vengono presentate alcune funzioni e caratteristiche del traduttore online e tutte le
novità proposte da Google per la traduzione automatica.
Il quinto capitolo parla della nuovissima tecnologia Speach to Speach,
raccogliendo informazioni da varie pubblicazioni scientifiche che sono state
tradotte in italiano e confrontate per dare un quadro complessivo delle reali
potenzialità di oltrepassare, anche relativamente al linguaggio parlato, il muro
esistente fra lingua e lingua. Con la Speach to Speach Translation si dà la
possibilità di comunicare istantaneamente con chiunque, attraverso l'assistenza di
un traduttore universale.
Il capitolo finale propone una sintesi e traduzione di alcune sezioni della
pubblicazione “Perspective on Performance in Business Intelligence - The Hilbert
Engine” - mai tradotta in italiano finora. Si tratta di un lavoro che discute l’uso di
una tecnologia vettoriale per lo stoccaggio e il recupero dei dati su un computer. Le
sue applicazioni nel campo della traduzione possono essere decisive nella creazione
6
di una “macchina traduttrice” che in un futuro prossimo riuscirà a sostituire almeno
in certi campi il lavoro del traduttore umano.
7
CAPITOLO 1
STORIA DELLA TRADUZIONE
“Tradurre è oggi una costante della nostra vita, un’operazione cui molti di noi, spinti da
esigenze e motivi di diversa natura, sono volontariamente o involontariamente sottoposti1”
(Jakobson, Note per una didattica sulla storia della traduzione)
Per offrire un’immagine complessiva di questo settore, occorre considerare la
storia della traduzione dalle origini fino alla seconda metà del XX secolo, quando
nacque la traduzione automatica. La traduzione è un’attività molto antica, che
veniva usata inizialmente nei rapporti politici e negli scambi commerciali. I greci
usavano l’operazione del tradurre solamente a fini pratici, mostrando disinteresse
culturale per le lingue degli altri, definiti generalmente con la parola barbaroi
(barbare). Sono presenti nella storia della traduzione alcuni termini che esprimono
la bipartizione tra la traduzione orale, come ermeneuo e ermeneus, e la traduzione
scritta come metafero (da cui il termine latino transferre), metafrazo ( tradurre,
parafrasare) e metagrafo (trascrivere, tradurre)2. In epoca romana la traduzione è
considerata principalmente un esercizio pedagogico e retorico. In questo periodo si
collocano le riflessioni più antiche a noi note sul tradurre: il “De optimo genere
oratorum” di Marco Tullio Cicerone, sorta di manifesto che celebra la forma della
8
libera traduzione. Cicerone delinea un profilo dell’oratore perfetto, che riesce con
la sua parola a “persuadere, dilettare e commuovere i suoi ascoltatori” (Bertazzoli,
2005). Sempre lui afferma di aver tradotto i due più importanti oratori (Demostene
ed Eschine) come oratore e non come interprete, differenziando quindi l’interpres
(chi traduce alla lettera) dall’orator (chi traduce come oratore/autore). Una
contrapposizione delineata da Cicerone rimarrà in tutta la storia della traduzione:
quella tra i due principali metodi di lavoro, letterale, che procede “non verbum de
verbo, sed sensum exprimere de sensu3”, e quella libera, che si propone di rendere il
senso e “l’efficacia espressiva4” delle parole:
“Ho tradotto da oratore, non già da interprete di un testo con le espressioni stesse del
pensiero, con gli stessi modi di rendere questo, con un lessico appropriato all’indole della
nostra lingua. In essi non ho creduto di rendere parola con parola, ma ho mantenuto ogni
carattere e ogni efficacia espressiva delle parole stesse” (Cicerone, De optimo genere
oratorum)5
L’intento di Cicerone è quindi quello di dare vita ad una traduzione che “non
rispetti un’equivalenza numerica perfetta” (Jacobson), bensì sia in grado di
conservare la forza comunicativa di cui godono le parole.
Anche nella visione di Heidegger la traduzione intesa come “trasferimento di
significato da una lingua all’altra”, ossia la traduzione letterale, parola per parola, è
un’idea ingenua: “non basta sostituire le parole greche con altre di altre lingue,
9
anche se queste hanno una vasta notorietà6”. Heidegger afferma che la traduzione
letterale non consente la vera fedeltà all’originale, pur dando questa impressione:
“il fatto che una traduzione sia semplicemente letterale non significa per ciò stesso
che sia anche più fedele a ciò che è detto. Una traduzione è fedele solo se le parole
parlano il linguaggio che esprime il vero senso7”. Il compito di una corretta
traduzione non è “un’ottusa fedeltà” è solo “la capacità di tradursi nel tradurre, una
capacità di lasciarsi trasportare nel rapporto col testo8”. La traduzione è un
movimento reciproco tra due lingue, “un andare-oltre e tornare-indietro da una
lingua all’altra9”, e quindi mai unidirezionale. Solo in questo modo è possibile
sentire una lingua: “dobbiamo piuttosto lasciare che le stesse parole greche ci
dicano ciò che esse nominano e trasferire la nostra capacità di ascoltare nell’ambito
del dire poetico della lingua10”
1.1 Approccio alla traduzione automatica. Con la nascita della traduzione
automatica non parliamo più “dell’artigiano traduttore11”, un’immagine che si perde
dietro lo scenario della modernità lasciando il posto a tecniche e strumenti avanzati,
che aprono nuovi orizzonti nel futuro di questo mestiere cosi antico. Come
sappiamo è solo recentemente che la traduzione e riuscita ad imporsi come
disciplina accademica e di ricerca e quindi finalmente i traduttori sono riusciti ad
ottenere l’investitura di categoria professionale. E’ importante tenere presente che
viviamo in un mondo in cui la tecnologia e la scienza riescono a superare limiti un
10
tempo impensabili, ma in cui nonostante tutto il muro linguistico resta ancora
difficile da superare: un ostacolo invisibile che continua a separare profondamente
uomini di lingue e culture diverse. Ma per quanto tempo rimarrà in piedi ancora
questo muro linguistico? E’ forse proprio la tecnologia informatica a
rappresentarne il principale nemico? Per cercare di rispondere a questa domanda
occorre prendere in considerazione innanzitutto le radici della traduzione
automatica, e quindi i primi strumenti informatici per la traduzione.
E’ nel novecento che si parla per la prima volta di “scienza della traduzione”,
con la comparsa di computer e traduttori automatici che aprono un nuovo capitolo
nella storia delle teorie traduttive. Il panorama nel mondo della traduzione cambia
radicalmente, proponendo teorie dell’attività traduttiva ispirate da modelli
matematici e computazionali, che si appoggiano sulla linguistica universale di
Noam Chomsky (il pioniere della teoria dell’innatismo linguistico e della
grammatica generativo-trasformazionale), per ambire all’ideale di una traduzione
automatica perfetta, realizzata interamente dalle macchine. Teorici dell’informatica,
linguisti, ingegneri, matematici, prendono parte a questi studi ritenendo che il
problema della traduzione si possa schematizzare in termini logici12. Un grande
entusiasmo per le potenzialità intraviste negli elaboratori elettronici e per le
nascenti teorie linguistiche portava tali studiosi a pensare che il traguardo di una
sostituzione dei traduttori umani con i computer non fosse né irraggiungibile, né
troppo lontano.
11
Note al capitolo primo.
1 JACOBSON, Note per una didattica sulla storia della traduzione. Aspetti del
linguaggio e della traduzione, trad. it. di R. Bianchi e C. Béguin2 BERTAZZOLI, RAFFAELLA, La traduzione: teorie e metodi, Carocci, 20063SAN GEROLAMO, Liber de optimo genere interpretandi, Epistola 57 a
Pammacchio, (390 ca.), in TTS, pp.63-71. “Nelle mie traduzioni dal greco in latino
non miro a rendere parola per parola, ma a riprodurre integralmente il senso
dell’originale (non verbum de verbo, sed sensum exprimere de sensu). E di questo
mio metodo ho a maestro Cicerone”.4,5MARCO TULLIO CICERONE, De optimo genere oratorum, in S. NERGAARD,
La teoria della traduzione nella storia, Bompiani, Milano 1993. G. TISSONI, Tutte
le opere di Cicerone, vol. 17, Mondadori, Milano 1973, pp. 33-356 M. HEIDEGGER, Che cosa significa pensare?, a cura di U. Ugazio e G. Vattimo,
Sugar, Milano 1979, 7M. HEIDEGGER, Sentieri interrotti, trad. it. di P. Chiodi, La Nuova Italia, Firenze
1968, p. 3008M. HEIDEGGER, Che cosa significa pensare ?, cit., p. 151.9 Ermeneutica, tradizione e traduzione in HEIDEGGER , a cura di Francesco
Cardone, fonte www.filosofico.net10 M. HEIDEGGER, Che cosa significa pensare? cit., p. 151.11 JACOBSON, Note per una didattica sulla storia della traduzione. Aspetti del
linguaggio e della traduzione, trad. it. di R. Bianchi e C. Béguin
12
12 ZANETTIN, FEDERICO (2001) “Informatica e traduzione”. In Monacelli,
Claudia (ed.) Traduzione, revisione e localizzazione nel terzo millennio: da e verso
l'inglese. Milano: Franco Angeli, 19-45.
CAPITOLO 2
LA TRADUZIONE AUTOMATICA
I primi brevetti relativi al campo della traduzione automatica risalgono alla metà
degli anni ’30 del secolo scorso, con Georges Artsrouni che propose un semplice
dizionario bilingue automatizzato che utilizzava un nastro di carta. Un’altra
proposta, venuta da Peter Troyanskii, fu più dettagliata. Essa includeva il dizionario
bilingue e un metodo per mettere in correlazione i ruoli grammaticali esistenti in
lingue diverse. Le prime proposte per la traduzione automatica usando il computer
furono avanzate da un famoso ricercatore presso la Fondazione Rockefeller,
Warren Weaver, che pubblicò nel 1949 un memorandum al riguardo. Le sue
proposte erano basate sulla teoria dell'informazione, e utilizzavano le tecniche
sviluppate durante la Seconda guerra Mondiale per la decodificazione dei messaggi
cifrati. Negli anni successivi, molte università negli Stati Uniti hanno cominciato
una seria ricerca nel campo. Il 7 gennaio 1954 a New York presso la sede di IBM
ha luogo l'esperimento di Georgetown, la prima dimostrazione pubblica di un
sistema di traduzione automatica. Una dimostrazione rilanciata dai giornali e che
all’epoca suscitò molto interesse da parte del pubblico. Il sistema utilizzato,
13
tuttavia, non era altro che un giocattolo che conosceva appena 250 parole,
soprattutto nel campo della chimica, e riusciva tradurre con cura solo quarantanove
frasi dal russo all’inglese, usando sei regole grammaticali. Ma l’esperimento
convinse l'opinione pubblica del fatto che l’avvento della traduzione automatica
fosse imminente, stimolando in particolar modo il finanziamento della ricerca, non
solo negli Stati Uniti ma in tutto il mondo13. Durante questo periodo, furono
installati molti sistemi di traduzione automatica relativi a settori specifici. La
United States Air Force utilizzò così un sistema prodotto da IBM e dalla
Washington University, mentre l'Atomic Energy Commission negli Stati Uniti e
l'Euratom in Italia utilizzarono un sistema sviluppato presso la Georgetown
University.
Un duro colpo viene dato alla ricerca in questo settore nel 1966, con la
pubblicazione della relazione ALPAC. Il rapporto – eseguito da ALPAC,
l'Automatic Language Processing Advisory Committee, un gruppo di sette
scienziati convocato nel 1964 – è stato richiesto dal governo degli Stati Uniti, e
sottolinea la mancanza di progressi compiuti. Il rapporto concluse che la traduzione
automatica era più costosa, meno accurata e più lenta in confronto alla traduzione
umana, e che, nonostante le spese, la traduzione automatica non era tale da
raggiungere la qualità di un traduttore umano nel prossimo futuro14.
Tuttavia la ricerca continua in Canada, Francia e Germania, dove vengono creati
due sistemi di traduzione automatica: Systran, sviluppato da Peter Toma e
utilizzato dalla Commissione dell'Unione Europea, e Taum-meteo, creato nel 1977
dall'Università di Montreal per tradurre le previsioni del tempo dal francese
14
all'inglese. Importanti progressi si sono verificati durante il 1980. Le esigenze
amministrative e commerciali delle comunità multilingue hanno stimolato la
domanda di traduzione, portando allo sviluppo di nuovi sistemi di traduzione
automatica come Logos (dal tedesco al francese e viceversa) e il sistema interno
creato dalla Pan-American Health Organization (dallo spagnolo all'inglese e
viceversa).
Nel 1980 avviene una vera ripresa della ricerca e della produzione di
applicazioni informatiche dovuta alla diffusione di personal computer e di
programmi di elaborazione di testo. Aziende come ALPI, Weidner, Globalink
(Nord America ed Europa), Sharp, NEC, Mitsubishi, Sanyo (Giappone) adottarono
e cominciarono a considerare necessari tali programmi. Alcuni dei progetti più
importanti furono GETA-Ariane (Grenoble), SUSY (Saarbrücken), MU (Kyoto),
ed Eurotra (l'Unione europea)15.
Nel 1983 si commercializza il primo programma di traduzione automatica
operante su personal computer. TSS, un software per il sistema operativo OS/2, è
stato realizzato da ALPS, una società statunitense produttrice di software per
applicazioni linguistiche, poi divenuta Alpnet. Fu adottato da alcune grandi società,
tra le quali l’IBM, per la propria attività di traduzione interna. L’applicazione
dell’informatica nel campo della traduzione inizia a rinnovare i propri metodi e le
proprie prospettive. L’utilizzo di strumenti informatici da parte d’istituzioni, enti e
agenzie di traduzione avviene come risposta ai crescenti bisogni del
multilinguismo. All’interno della Comunità Europea sono tradotte dai sistemi di
traduzione automatica circa 200.000 pagine di cui solo il 4% è di qualità accettabile
15
per la pubblicazione, le rimanenti vengono utilizzate come “traduzioni
indicative”.16
L'inizio degli anni ‘90 ha visto un’evoluzione vitale nella traduzione automatica
con un cambiamento radicale nella strategia di traduzione secondo le regole
grammaticali, attraverso corpora di testi ed esempi (come il Revers Program). Una
“lingua” non è più percepita come un’entità statica disciplinata da regole fisse, ma
come un corpus dinamico che cambia a seconda dell’utilizzo e degli utilizzatori,
evolvendo nel tempo e adattandosi alla realtà sociale e culturale. In tutto questo
periodo la traduzione automatica continua a progredire. Le grandi aziende
aumentano le vendite di software per il grande pubblico. Questa situazione ha
portato alla creazione di programmi di traduzione online (fra i primi, Altavista), che
offrono servizi gratuiti di posta elettronica veloce, pagine web nella lingua
desiderata, dizionari multilingue, enciclopedie e data base terminologici. Con
l’arrivo del nuovo secolo i programmi informatici creati per svolgere compiti
traduttivi si sono ulteriormente diffusi, pur rimanendo qualitativamente assai
inferiori alla traduzione umana. La traduzione automatica rappresenta ancora solo
una piccola percentuale del mercato. All'inizio degli anni ‘90 il mercato della
traduzione è il seguente (Loffler-Laurian, 1996)17:
Stato La traduzione umana T.M
Europa e Stati Uniti 300 milioni di pagine 2.5 milioni di pagine
16
Giappone150 milioni di pagine 3.5 milioni di pagine
Tabella.1. Il mercato della traduzione nel 1990
Si può notare che solo sei milioni di pagine sono state tradotte attraverso la
traduzione automatica, rispetto ai 450 milioni tradotti attraverso la traduzione
umana, quindi la traduzione automatica rappresentava solo il 1,3% del totale. È
importante ricordare che i sistemi di traduzione automatica non sono ancora in
grado di produrre un testo immediatamente utilizzabile, dal momento che
l’interpretazione di un passaggio in qualunque lingua è fortemente dipendente dal
contesto. La combinazione delle parole porta a diverse denotazioni e connotazioni.
Con la traduzione automatica non è sempre possibile rendere efficacemente il
significato del testo: l’utilità di questo strumento si limitata a situazioni concrete, ed
offre soprattutto un mezzo per risparmiare tempo (a scapito della qualità), piuttosto
che un sostituto dell’attività umana.
2.1 Eurotra Project. Portiamo avanti la nostra ricerca con Eurotra, un ambizioso
progetto di traduzione automatica istituito e finanziato dalla Commissione Europea
dalla fine degli anni ‘70 fino al 1994. Una vasta rete europea di linguisti e
informatici avviò questo progetto con la speranza di creare un sistema di traduzione
automatica (MT) per le lingue ufficiali della Comunità Europea, all’inizio sette e
poi nove. Tuttavia, col passare del tempo, le attese si attenuarono; "Fully Automatic
High Quality Translation", la traduzione automatica di alta qualità, non era più un 17
obiettivo ragionevolmente raggiungibile. Eurotra fu in realtà riconosciuto come uno
strumento per la ricerca, piuttosto che lo sviluppo di un prototipo.
Il progetto fu altamente motivato da uno dei principi fondamentali dell'Unione
Europea: quello di offrire ai cittadini la possibilità di leggere nella propria lingua
qualsiasi documento creato all’interno dell’UE, fatto che garantiva una maggiore
trasparenza. L’adesione di nuovi paesi ha prodotto un’esplosione combinatoria del
numero di coppie di lingue coinvolte, per la necessità di tradurre ogni carta,
discorso e ogni verbale delle riunioni interne. Tutti questi fattori hanno fatto dalla
traduzione un elemento dal peso drammatico nel bilancio contabile dell’U.E. Per
risolvere questo problema è stato ideato Eurotra18. Il professor Giovanni Malnati,
membro dell’Engineering Framework Group, nel progetto europeo Eurotra,
descrive l’attività svolta come: “Implementazione di un meccanismo di meta regole
ricorsive per l’analisi di fenomeni linguistici (unbounded dependency
constructions), la formalizzazione e la descrizione dell'intero formalismo e
l'ideazione e la realizzazione di un sistema di regole di preferenza multi-criterio per
la selezione di risultati linguistici intermedi nel processo di traduzione”19 . Il
progetto è stato particolare perché non si trattava di un gruppo unico di ricerca, vi
erano più gruppi distribuiti in tutti i paesi membri, organizzati piuttosto secondo la
lingua che seguendo i confini nazionali (per esempio, i gruppi di Leuven e Utrecht
hanno lavorato a stretto contatto), con la sede centrale presso la Commissione
Europea a Lussemburgo. Mentre questo ha contribuito in modo efficace allo
sviluppo culturale, ha anche dimostrato graficamente l’affermazione di Brooks
nella pubblicazione “The Mythical Man-Month” e cioè “più il numero dei gruppi
18
partecipanti è alto, più tempo è impiegato per l'amministrazione e la
comunicazione, piuttosto che per la ricerca effettiva di per sé”. Eurotra, infatti, non
è mai riuscito a offrire al mercato un prodotto finito e funzionante, cioè un sistema
di lavoro MT. Nonostante ciò, ha avuto un impatto di vasta portata a lungo termine
sulle industrie nascenti negli stati membri europei, in particolare nei paesi del sud
come Grecia, Italia, Spagna e Portogallo. Vi è almeno un sistema MT commerciale
(sviluppato da un consorzio accademico in Danimarca) derivato dalla tecnologia di
Eurotra19. È tuttora utilizzato da Google come fonte d’ispirazione del nuovissimo
programma Google Translate, che permette la partecipazione degli utenti di tutto il
mondo alla traduzione attraverso una memoria di traduzione, quindi un archivio
intelligente di tutti gli elementi che vengono tradotti.
2.2 Modelli di traduzione automatica. Per comprendere i principi essenziali
che stanno alla base della traduzione automatica, è necessario capire il
funzionamento del cervello umano. La prima fase della traduzione umana è la
comprensione completa del testo, nella lingua di origine. Questa comprensione
opera su diversi livelli: livello semantico (in cui bisogna innanzitutto comprendere
parole fuori contesto, come in un dizionario), livello sintattico (che presuppone
capire le parole in una frase) e livello pragmatico (che richiede una comprensione
complessa in situazioni e contesti). Inoltre, ci sono almeno cinque tipi di
conoscenza utilizzati nel processo di traduzione: la conoscenza della lingua di
origine (permette di capire il testo originale), la conoscenza della lingua di 19
destinazione (consente di produrre un testo coerente in quella lingua), la
conoscenza delle equivalenze (tra le lingue di partenza e di destinazione), la
conoscenza del campo “oggetto” che è generale, (entrambe aiutano a comprendere
il testo nella lingua di origine) e la conoscenza degli aspetti socio-culturali (costumi
e convenzioni della sorgente e delle culture di destinazione). Data la complessità
dei fenomeni che stanno alla base del lavoro di un traduttore umano, sarebbe
difficile pretendere che una macchina possa produrre un testo di arrivo della stessa
qualità di quella di un essere umano. Tuttavia, è chiaro che anche un traduttore
umano è raramente in grado di produrre una traduzione adeguata al primo tentativo.
In realtà il processo di traduzione si compone di due fasi: la prima è la produzione
di un testo di massima o versione preliminare nella lingua di destinazione, in cui la
maggior parte dei problemi di traduzione è risolta, ma che è lontano dall'essere
perfetto; in secondo luogo, la fase di revisione, variando dalla semplice rilettura del
testo, con piccoli aggiustamenti, a cambiamenti radicali. Si potrebbe quindi dire
che MT mira a eseguire la prima tappa di questo processo in modo automatico, cosi
che il traduttore umano può procedere direttamente con la seconda fase che
consiste nel meticoloso e impegnativo compito di revisione20.
Le prime “macchine traduttrici” funzionavano attraverso il testo che “veniva
immesso nel calcolatore che riconosceva la sequenza di parole nella lingua di
partenza21”, analizzava grammaticalmente e produceva “un testo nella lingua di
arrivo, composto da una sequenza di parole corrispondenti, attinte da un dizionario
elettronico bilingue e arrangiate in base a una serie di regole di trasformazione
grammaticale22” (i cosiddetti sistemi ad architettura di “prima generazione”). A
20
questi seguono sistemi di modelli linguistici più complessi come quelli di seconda
generazione basati su transfer e sull’interlingua.
L’intero ciclo comprende l’immissione del testo di partenza (input), l’elaborazione
e l’immissione del testo di arrivo (output). “Questa maggiore complessità teorica
(come rappresentata schematicamente in figura.1) prevede la possibilità di arrivare
alla realizzazione di sistemi in grado di gestire più coppie di lingue e direzioni di
traduzione introducendo anche una maggiore complessità gestionale23”.
Fig.1. Modelli teorici di traduzione automatica
Negli anni ’90 si diffonde un nuovo modello basato su “banche dati testuali
bilingui, anziché sull’uso di lessici bilingue e regole di trasformazione24”
Alcuni ricercatori dell’IBM hanno concepito metodi per allineare i corpora paralleli
(raccolte di testi in formato elettronico) per poi calcolare la probabilità con cui a
ciascuna frase o parola in una lingua corrisponde una frase o parola di un'altra
lingua. Un nuovo paradigma di ricerca per la traduzione automatica è stato fornito
21
dal principio dei corpora paralleli conosciuto come “traduzione automatica basata
sugli esempi” (EBMT, Exemplum Based Machine Translation) le cui applicazioni
hanno contribuito alla nascita di una nuova generazione di strumenti informatici
chiamati memorie traduttive.
Note al capitolo secondo.
11,12Traduzione propria da “Concise history of the language sciences: from the
Sumerians to the cognitivists”. Edited by E.F.K.Koerner and R.E.Asher. Oxford:
Pergamon Press, 1995. 431-445
13 Traduzione propria da Machine Translation and Computer-Assisted Translation:
a New Way of Translating? by Olivia Craciunescu, Constanza Gerding-Salas,
Susan Stringer-O'Keeffe. Volume 8, No. 3 July 2004.
14ZANETTIN, FEDERICO (2001) “Informatica e traduzione”. In Monacelli,
Claudia (ed.) Traduzione, revisione e localizzazione nel terzo millennio: da e verso
l'inglese. Milano: Franco Angeli, 19-45.
15,16Traduzione propria da Machine Translation and Computer-Assisted
Translation: a New Way of Translating? by Olivia Craciunescu, Constanza
Gerding-Salas, Susan Stringer-O'Keeffe. Volume 8, No. 3 July 2004.
17Traduzioni proprie da MAEGAARD, B, 1989. Perspectives in artificial
intelligence vol. 2: machine translation, NLP, databases and computer-aided
instruction. Source http://portal.acm.org/citation.cfm?id=65688
22
18Intervista col Professor Giovanni Malnati, online su
http://www.consorzionettuno.it
19Traduzioni proprie da MAEGAARD, B, 1989. Perspectives in artificial
intelligence vol. 2: machine translation, NLP, databases and computer-aided
instruction. Source http://portal.acm.org/citation.cfm?id=65688
20 Traduzione propria da Machine Translation and Computer-Assisted Translation:
a New Way of Translating? by Olivia Craciunescu, Constanza Gerding-Salas,
Susan Stringer-O'Keeffe. Volume 8, No. 3 July 2004.
21,22 ZANETTIN, FEDERICO (2001) “Informatica e traduzione”. In Monacelli,
Claudia (ed.) Traduzione, revisione e localizzazione nel terzo millennio: da e verso
l'inglese. Milano: Franco Angeli, 19-45.
23BOWKER, L, Computer-Aided Translation Technology. A practical introduction.
University of Ottawa Press, Ottawa 2002.
24ZANETTIN, FEDERICO. (2001) “Informatica e traduzione”. In Monacelli,
Claudia (ed.) Traduzione, revisione e localizzazione nel terzo millennio: da e verso
l'inglese. Milano: Franco Angeli, 19-45
23
CAPITOLO 3.
TRADUZIONE ASSISTITA DAL COMPUTER
La meccanizzazione della traduzione è stata una dei più antichi sogni
dell'umanità. Nel ventesimo secolo è diventata una realtà, sotto forma di programmi
per il computer in grado di tradurre una grande varietà di testi da una lingua
naturale all’altra. Nonostante tutto, la traduzione è ancora lontana dall’essere
perfetta, visto che non esistono “macchine traduttrici” che al semplice tocco di
alcuni tasti riescano a capire qualsiasi testo, in qualsiasi lingua naturale, per poi
produrre una traduzione perfetta in qualsiasi altra lingua senza l'intervento umano.
Da molti la traduzione automatica viene concepita come un ideale per un futuro
lontano, anche se realizzabile in linea di principio anche attraverso la tecnologia
attuale, come potremo vedere nei capitoli successivi25.
Si possono considerare di ausilio alla traduzione tutti gli strumenti informatici
che in qualche modo elaborano il linguaggio umano, tra cui: elaboratori di testi,
software OCR (Optical Character Recognition), strumenti per il riconoscimento e
la sintesi vocale, strumenti per la ricerca e sostituzione di testo, database testuali.
24
Quando parliamo di sistemi informatici per la traduzione, ci si riferisce a quei
sistemi progettati appositamente per l'ambito traduttivo: da quelli che pretendono di
sostituire l’intervento umano, a quelli che forniscono al traduttore strumenti utili
per le attività svolte tradizionalmente, quali vari tipi di analisi sul testo di partenza
e/o di arrivo come la creazione, la gestione e la consultazione di glossari, le
ricerche in corpora linguistici e la produzione del testo di arrivo. A tali applicazioni
si fa riferimento collettivamente con il nome di CAT (Computer Aided Translation
o Computer Assisted Translation, traduzione assistita da computer). Nell'uso
comune, dall'insieme degli strumenti CAT è solitamente esclusa la traduzione
automatica (MT, Machine Translation), anche nella sua varietà assistita (HAMT,
Human Aided Machine Translation), e il termine CAT s’identifica quindi con
quella che è più propriamente detta MAHT (Machine Aided Human Translation)26.
Fig. 2 –. Terminologia specifica
25
3.1 Strumenti CAT/TM. Oggi, i più diffusi sistemi per la traduzione assistita
(MAHT) forniscono al traduttore vari strumenti come: programmi di videoscrittura,
memorie di traduzione, sistemi per la gestione di banche dati terminologiche,
programmi di concordanze, dizionari e glossari elettronici bilingue, programmi di
traduzione automatica, enciclopedie, forum, ecc. Il ruolo principale è attribuito alla
memoria di traduzione (TM, Translation Memory), tanto che il termine “strumento
TM” viene spesso usato, in modo impreciso, con il termine “strumento CAT”27.
3.2 Translation Memory. “Una memoria di traduzione è un archivio elettronico
in cui i testi di partenza in una certa lingua e i corrispondenti testi di arrivo in una o
più lingue sono memorizzati in modo parallelo” (Alessandra Muzzi 2000-2010).
Il testo è segmentato in frasi, in modo che a un segmento nella lingua di partenza,
corrisponda il proprio traducente in ciascuna delle lingue di arrivo. La memoria di
traduzione è uno strumento potente per la gestione di testi ripetitivi
(documentazione tecnica, testi legali e commerciali), garantendo coerenza stilistica
e terminologica, con brevi tempi di traduzione.
Gli strumenti per la traduzione assistita consentono di creare una memoria di
traduzione vuota e di alimentarla durante la traduzione. In questo modo le
traduzioni prodotte sono archiviate sulla memoria traduttiva. Possiamo anche
alimentare una memoria di traduzione con testi preesistenti attraverso la procedura
chiamata “allineamento”; l’unica condizione è di avere in formato elettronico sia il
testo nella lingua di partenza, sia il corrispondente testo nella lingua di arrivo.
26
L'allineamento consiste nella segmentazione dei testi di partenza e di arrivo,
definizione delle corrispondenze tra i segmenti nelle due lingue (con interventi
manuali più o meno estesi a seconda dello strumento utilizzato) e nell'inserimento
di tali segmenti allineati nel database di memoria28.
Quando si traduce utilizzando uno strumento CAT, il testo da tradurre è
segmentato e per ogni segmento il sistema controlla se esistono corrispondenze
nella memoria di traduzione. Se trova un segmento uguale (exact match,
corrispondenza esatta) o simile (fuzzy match, corrispondenza parziale) nella lingua
di partenza, presenta al traduttore il segmento corrispondente nella lingua di arrivo
(cfr. Brace 1995, Dennet 1995, Heyn 1998). Il traduttore può accettare la
traduzione suggerita ed eventualmente correggerla, oppure ignorarla e inserire una
nuova traduzione. Gli strumenti CAT ci consentono inoltre di cercare nella
memoria di traduzione singoli termini o espressioni, anche se un termine non è
presente nei glossari disponibili, sarà quindi possibile verificare il modo in cui è
stato tradotto in precedenza.
Tra i software professionali, ci sono molti strumenti che si occupano di
gestire le memorie di traduzione, però, i più utilizzati per tradurre automaticamente
le lingue straniere su Word sono: Trados e Wordfast.
Trados è un vero e proprio software, che lavora costantemente collegato a un server
per tenere aggiornate le memorie di traduzione. Questo tipo di software divide il
testo della lingua sorgente in segmenti (tag) che saranno tradotti in altrettanti tag
nella lingua target. È il programma più utilizzato nelle grandi software houses.29
27
Wordfast invece, pur essendo per certi versi abbastanza simile a Trados, non è un
software vero e proprio essendo un CAT tool, ossia uno strumento di traduzione
assistita. Si basa sempre su una memoria di traduzione ma a differenza di Trados è
caratterizzato da una licenza freeware (libera) e non ha una procedura standard
d’installazione. Dalle impostazioni di Wordfast è possibile creare nuove memorie
di traduzione, modificare quelle esistenti, verificare i documenti e cambiare la
lingua sorgente o la lingua target.
3.3 La gestione della terminologia. A differenza delle memorie di traduzione, le
risorse terminologiche non sono un concetto introdotto con l'applicazione della
tecnologia informatica al campo della traduzione. I traduttori hanno sempre
utilizzato tali risorse, sotto forma di dizionari e glossari cartacei. Con l'avvento
della rivoluzione informatica, i primi ad essere creati sono stati gli strumenti per la
gestione della terminologia. I computer hanno facilitato tale gestione, che in
precedenza avveniva mediante liste o schede, grazie all'utilizzo di applicazioni
generiche di gestione basi di dati o di applicazioni progettate in modo specifico, per
la gestione della terminologia. Pressoché tutti gli strumenti CAT/TM comprendono
componenti specifici per la gestione della terminologia. L'innovazione è costituita
dal riconoscimento terminologico automatico: “durante la traduzione, i termini
presenti sia nel testo da tradurre, sia nel glossario o nei glossari associati al
progetto, sono individuati in modo automatico e i traducenti sono presentati sullo
schermo in tempo reale”. Alcuni strumenti inseriscono automaticamente tali
termini nella traduzione; tutti mettono a disposizione metodi rapidi per la loro
28
selezione e inserimento nel testo, riducendo i tempi di digitazione e le possibilità di
refusi. (Alessandra Muzzi 2000-2010).
Un potente strumento di gestione della terminologia, prodotto da Trados, è
chiamato MultiTerm. Nelle versioni più recenti è stato introdotto MultiTerm IX,
uno strumento che rende possibili più operazioni, come l'inserimento interattivo di
termini durante la traduzione, inoltre aumenta la complessità di uno strumento che
non aveva la facilità d'uso tra i suoi punti di forza. I punti di forza di MultiTerm
sono: “La capacità di gestione di più lingue, la strutturazione in concetti e l'ampia
configurabilità degli attributi”. (Alessandra Muzzi 2000-2010).
3.4 Programmi di concordanze e corpora. Come abbiamo già accennato una
memoria traduttiva può essere interrogata da un programma appositamente creato
per ricercare segmenti di testi tradotti in precedenza che sono proposti
automaticamente come nuove traduzioni. Oltre a questa modalità d’uso, le stazioni
traduttive offrono la possibilità di interrogare la memoria traduttiva per ricercare
particolari parole o espressioni. Il risultato è sempre presentato sotto forma di
concordanze parallele e cioè segmenti nella lingua di partenza in cui vediamo il
testo ricercato. In questo modo il traduttore visiona tutte le varianti in cui una
parola è stata tradotta in vari contesti, avendo la possibilità di adattare le parole
traducenti al nuovo contesto. Possiamo affermare che i corpora paralleli non sono
altro che memorie di traduzione “ovvero insiemi di testi in due lingue in cui
ciascun testo è una traduzione di un testo nell’altra lingua30”. Solo che una memoria
29
traduttiva rappresenta un tipo particolare di corpus elettronico31 in quanto di solito
consiste in traduzioni precedentemente effettuate da un particolare traduttore o
gruppo di traduttori per un determinato progetto.
3.5 Programmi di traduzione automatica. La traduzione automatica si basa su
un software che prevede la conversione di un testo da una lingua a un'altra in
conformità con un dizionario più o meno complesso. Un software o uno strumento
online per la traduzione automatica, può rivelarsi utilissimo in situazioni in cui un
ampio volume di traduzioni sia richiesto a brevi termini di consegna e in cui la
qualità richiesta non sia troppo elevata; ad esempio: e-mail in arrivo, sessioni di
chat, pagine web o testi, quando dobbiamo avere “un’idea complessiva” di cosa è
stato scritto nel documento originale in una lingua che non siamo in grado di
comprendere32. Molti considerano i programmi di traduzione automatica la
soluzione per tutte le esigenze di traduzione. Alcune aziende che producono tali
programmi sostengono che i propri software producono traduzioni di alta qualità
che si possono utilizzare per costruire una versione multilingue dei propri
documenti o del proprio sito Web, da presentare al pubblico33. I software per la
traduzione automatica sono strumenti che cercano di definire arbitrariamente il
contesto in cui le parole sono inserite, e producono risultati che, come abbiamo già
accennato, possono contenere (e di norma contengono) errori grammaticali e
sintattici. I programmi di traduzione automatica si possono classificare in base a
due criteri: in base alla situazione ( più o meno favorevole al loro utilizzo) e in base
agli utenti a cui sono destinati. Nel 1992 è stata proposta dall’associazione per lo
30
sviluppo dell’industria elettronica giapponese una serie di parametri per la
valutazione delle metodologie e dei criteri della traduzione automatica che sotto
riportiamo nella Tabella. 2.34
Tabella .2. Metodologie e criteri di traduzione automatica. (ZANETTIN, 2001)
Parametri Situazione favorevole
alla traduzione
automatica
Situazione poco
favorevole alla
traduzione automatica
Volume di traduzioni Ampio Limitato
Difficoltà delle traduzioni Facile Difficile
Qualità richiesta Bassa Elevata
Lingue coinvolte Una coppia specificata Diverse
Argomento e dominio linguistico
Limitato Ampio
Termini di consegna Brevi Dilazionati
Disponibilità tecnologiche Avanzate Non avanzati
Organizzazione dei termini traduttivi
Precisa suddivisione Poca suddivisione
Investimenti Alto investimento iniziale;baso investimento a lungo termine
Alto investimento
Disponibilità dei dati in formato elettronico
Pronta Richiede tempo e lavoro
Risorse finanziarie e disposizione per la traduzione automatica
Limitate Non limitate
Pre-, post-editing e editing interattivo
Richiede molto tempo e lavoro
Non richiede molto tempo e lavoro
31
Note al capitolo terzo
25 LAGOUDAKI, E (2006), Translation Memory systems: Enlightening users'
perspective. Imperial College of London, online su http://transnotes.blogspot.com
26,27MUZZI, A , 2000-2010, Translation & localization services for the Italian
language, online su http://www.amtrad.it
28Software Professionali ,online su http://www.navigaweb.it
29 OSIMO, BRUNO, 2005. Traduzione e nuove tecnologie. Informatica e Internet
per traduttori. Guida pratica con glossario, Milano, Hoepli. “Raccolta di testi,
enunciati scritti e/o orali, che possono caratterizzarsi per la lingua in cui sono
codificati, per il periodo in cui sono stati prodotti o anche per l’ambito settoriale a
cui fanno riferimento”.
30 ZANETTIN, FEDERICO (2001) “Informatica e traduzione”. In Monacelli,
Claudia (ed.) Traduzione, revisione e localizzazione nel terzo millennio: da e verso
l'inglese. Milano: Franco Angeli, 19-45.
31 raccolte di testi costruite per fini linguistici che possono essere creati anche su
carta oppure oralmente , ma i corpora moderni sono tutti elettronici. Mirko
Tavosanis, 2008, Linguistica dei corpora.
32
32,33Traduzione automatica e traduzione gratuita, 2009. www.traduzione-
localizzazione.com
34 ZANETTIN, FEDERICO (2001) “Informatica e traduzione”. In Monacelli,
Claudia (ed.) Traduzione, revisione e localizzazione nel terzo millennio: da e verso
l'inglese. Milano: Franco Angeli, 19-45.
CAPITOLO 4
Dando uno sguardo al sito ufficiale di Google, che propone anche una breve storia
del motore di ricerca, scopriamo che “Google”35 è un gioco di parole che richiama
la parola “Googol”: una parola che fu inventata da Milton Sirotta, nipote del
matematico americano Edward Kasner, per descrivere il numero 1 seguito da 100
zeri. Un googol è un numero molto grande. L'uso che Google fa del termine riflette
la missione del motore di ricerca: organizzare un immenso, praticamente infinito
insieme di informazioni e documenti disponibili sul web. Google nasce dall'idea
geniale di due giovani laureati statunitensi, debutta online nel 1999 ed è oggi il
motore di ricerca più popolare. I creatori di Google sono Larry Page e Sergey Brin.
Laureati rispettivamente in Scienze e Ingegneria Matematica e in Scienze
Informatiche si conoscono tra i banchi dell'università di Stanford – Paolo Alto,
California, chiamata anche “fucina cerebrale della new economy36”. Insieme
costruiscono e gestiscono il progetto di ricerca della Stanford che porta alla 33
creazione di Google. Dagli inizi del 1998 studiano una metodologia
tecnologicamente avanzata per la ricerca d’informazione su internet. Si basano su
risultati ottenuti dopo anni di ricerche, sull’estrazione di dati su scala larga e sulla
struttura dei link del World Wide Web in particolare. Stabiliscono che mediante
una complessa analisi basata su algoritmi matematici, è possibile valutare la
qualità, l'importanza e la rilevanza delle pagine web segnalate da una ricerca.
Google è il leader incontrastato del WEB. Il colosso di Mountain View domina da
quasi dieci anni numerosi ambiti tra i quali la search (ricerca online), la pubblicità
on-line (Adwords e Adsense), la posta elettronica (Gmail), la produzione di
contenuti video (YouTube), l’editoria online (Google Books e Google Edition),
nonché, appunto, il settore dei language tools37.
4.1 Breve storia di un imperio. Dal 1999 a oggi Google ha ottenuto importanti
successi commerciali. Ormai diversi anni fa American On Line, all’epoca il più
grande internet service provider del mondo che conta oggi trentaquattro milioni di
clienti e dieci milioni di visitatori quotidiani, aveva firmato un accordo che lo lega
alla tecnologia e alla database di Google, lasciandosi alle spalle Inktomi38 e
l'accordo con Overture per le postazioni a pagamento. Inoltre AOL si è assicurata i
database che le consentano di visualizzare gli AdWords di Google come i
primissimi risultati delle ricerche. A giugno 2000 Google annuncia di aver censito
oltre un miliardo di pagine web di cui 560 milioni acquisite per intero e 500 milioni
segnalate solo in base al loro indirizzo web ma non ancora analizzate nel dettaglio.
34
A maggio 2001 Google riporta in vita gli archivi dei newsgroup che furono di
Deja.com. Ha comprato l'immenso patrimonio culturale e sociale, praticamente sei
anni di discussioni pubbliche tra uomini e donne di tutto il mondo (650.000.000 di
messaggi). In seguito, oltre a fornire la tecnologia di ricerca ad aziende come
Yahoo e Supereva, Google ha messo a disposizione una serie di servizi per la
ricerca interna nei siti come ad esempio per Red Hat (azienda specializzata sul
sistema operativo Linux), e in una seconda fase li ha forniti a tutti gli utenti grazie
ad un semplice form online.
4.2 Google Translate. L’azienda di Google considera la traduzione come una
parte fondamentale nel “rendere le informazioni universalmente accessibili a tutti,
in tutto il mondo39”. Nel 2004 Sergey Brin, uno dei fondatori di Google, sottopose
il contenuto di una mail, ricevuta da un sostenitore sud-coreano, al traduttore
automatico che l'azienda stessa aveva creato. Il testo in sé diceva che Google era un
ottimo motore di ricerca, ma la traduzione automatica aveva prodotto il seguente
risultato: “Le scarpe di pesce crudo a fette che la cosa desidera. Google è proprio
un bel cipollotto!”40 Brin disse allora che tutto sommato Google poteva fare di
meglio. Sei anni dopo, il servizio gratuito di traduzione online Google Translate
funzionava per cinquantadue lingue, più di qualsiasi altro omologo ed è stato usato
centinaia di milioni di volte a settimana per la traduzione di pagine web e altri
contenuti. “Google Translate è, al momento, il massimo che si può fare”, afferma
con riguardo alle traduzioni computerizzate di argomento non specialistico Alon
35
Lavie, un ricercatore associato del Language Technologies Institute della Carnegie
Mellon University. La rapida ascesa di Google nell'olimpo dei traduttori automatici
mostra di cosa è capace il colosso quando si lancia in questioni complesse.
Oggi la rete di dati che ha messo insieme per la ricerca online, se valutata nel suo
insieme, può essere considerata la memoria più grande del mondo. Ora Google sta
usando la stessa forza per ottenere il massimo anche nel campo delle tecnologie per
la traduzione automatica. “La traduzione automatica è uno dei migliori esempi per
illustrare la strategia di Google per il futuro41” dice Tim O'Reilly, fondatore ed
executive della Casa Editrice O'Reilly Media. “Non viene presa troppo sul serio,
ma Google va oltre ed ha più esperienza rispetto ad altri. Ha inoltre intenzione di
fare gli investimenti necessari ad affrontare questioni avanti rispetto al mercato
attuale”. Sempre O’Reilly afferma che la creazione di un sistema di traduzione
automatica è una delle sfide più difficili nell'intelligenza artificiale. Per adesso i
sistemi di traduzione automatica sono ben lontani dall’essere perfetti. Gli esperti
sostengono che per un computer è ancora troppo difficile dividere in parti una frase
per tradurla e ricomporla, anche se il servizio di Google è già in grado di dare il
succo di un articolo di notizie, ed è diventato una fonte di traduzioni all'impronta
immediate per milioni di persone. “Se ti basta una traduzione per sommi capi, è ciò
che fa per te” dice Philip Resnik, esperto di traduzione automatica e professore
associato di linguistica all’Università del Maryland, a College Park. “Ogni barriera
linguistica potrà essere eliminata” dice Franz Och, il ricercatore di Google.
“Chiunque potrà comunicare con chiunque altro”, afferma Och, scienziato tedesco
che ha lavorato all’Università della Southern California.
36
Mentre molti sistemi di traduzione simili a quello di Google necessitano fino
a un miliardo di parole di testo per creare un modello di lingua, Google è andata
oltre e si è spinta fino ad alcune centinaia di miliardi di combinazioni in inglese.
“Più testi si lavorano, più precisi diventano i modelli”, afferma Och. Lo sforzo è
valso la candela. Un anno dopo, Google ha vinto un concorso voluto dal Governo
per la sperimentazione di sistemi di traduzione più complicati. Google ha usato un
approccio simile - computer immensamente potenti, montagne di dati e statistiche –
per altre offerte di servizi complessi.
Nel 2007 ha lanciato l’800-GOOG-411, un servizio telefonico gratuito di
assistenza, capace di interpretare richieste vocali, che ha dato modo a Google di
raccogliere le voci di milioni di persone, con le quali il sistema ha imparato a
riconoscere in modo più preciso l'inglese parlato. Neanche un anno dopo, Google
ha presentato un sistema di ricerca vocale, simile a quelli che altre compagnie
avevano ottenuto dopo anni di studi e ricerche.
Verso la fine dell'anno scorso, Google ha introdotto un altro sistema chiamato
Goggles che analizza le foto dal cellulare e le confronta con un database che
contiene più di un miliardo d’immagini disponibili online, incluse quelle delle
strade disponibili su Street View. Och riconosce che il sistema di traduzione di
Google deve ancora migliorare, ma dice pure che la cosa procede molto
velocemente. Vedremo in seguito le caratteristiche dei più importanti strumenti di
traduzione che Google mette alla disposizione degli utenti.
37
4.3 Google Translator Toolkit. Google lancia sul mercato il 5 settembre del
2009 il Google traduttore Toolkit, un potente editore di facile uso che permette ai
traduttori di “aggiungere quel tocco umano sulla traduzione automatica42”. Ad
esempio, se un lettore di lingua araba vuole tradurre un articolo di Wikipedia
dall’inglese, si carica l'articolo nel traduttore Toolkit, si corregge la traduzione
automatica, e clicca il pulsante “pubblica”. Il Toolkit traduttore è integrato con
Wikipedia, rendendo semplice la pubblicazione di articoli tradotti. Una novità
assoluta è che, il sistema di traduzione automatica “impara” dalle sue correzioni,
creando un circolo virtuoso che può aiutare a tradurre i contenuti in quarantasette
lingue, in altre parole oltre il 98% della popolazione di Internet nel mondo.
Fig.3. Google Translator Toolkit
4.4 Funzioni e Caratteristiche del Traduttore Online. Il traduttore
automatico online è un comodo strumento per la traduzione, raggiungibile
dall’home page www.google.it cliccando sulla voce “strumenti per le lingue”
consente di eseguire traduzioni online in maniera semplice e abbastanza precisa. Il
38
language tool di Google offre dunque la possibilità di tradurre parole, frasi ed
anche testi più o meno complessi in diverse lingue, a partire dalla lingua da cui si
desidera tradurre.
È diviso in tre parti: la prima propone all'utente di effettuare una ricerca sul Web
partendo da una keyword nella propria lingua, onde trovare risultati su Google nella
lingua desiderata in cui detta keyword verrà tradotta, come si può osservare
nell’immagine seguente: Fig.4.
Fig.4. Google Translate.
39
La seconda, invece, consente di inserire un testo, scegliere la lingua di
partenza (quella in cui è scritto il testo) e quella di destinazione (quella in cui il
testo deve essere tradotto). Come si può osservare nell’immagine seguente: Fig.5
Fig.5. Google Translate
La terza scelta consente di inserire l'indirizzo di una pagina Web da
tradurre, di selezionare la lingua in cui la pagina è scritta e di specificare la lingua
in cui si vuole tradurre questa pagina. In tutti e tre i casi, il risultato delle traduzioni
può apparire approssimativo, ma c’è da considerare una cosa: più il testo è accurato
e senza errori ortografici più il risultato della traduzione è di buona qualità.
40
Fig.6. Google Translate
4.5 Client for Google Traslate. Parliamo ancora di traduzioni indicando un
programma da installare sul computer che permette di usare Google Translate,
senza aprire Internet Explorer o altri browser. Come già riferito prima, Google
Translate è il principale servizio online per le traduzioni dirette e immediate da una
lingua a un'altra. Esso si usa su internet, direttamente cliccando gli strumenti delle
lingue dalla pagina di partenza di Google oppure usando altri siti web che sfruttano il
traduttore di Google con traduzioni in tempo reale. Ma esiste anche un programma
efficace che permette di usare il servizio online Google Translate da desktop, senza
quindi usare un browser e in modo da integrarsi con Windows e tutti i programmi
usati. Questo programma desktop si chiama Client for Google Translate, e sfrutta il
servizio Google Translate in maniera trasparente per l’utente, anche all’interno di
applicazioni diverse (ad esempio, un programma di videoscrittura)
41
Fig.7. Client for Google Translate
Alcune impostazioni si devono configurare subito dopo l'installazione, in
particolar modo la lingua in cui si desidera tradurre, perché il testo deve essere
tradotto in automatico. Il software è configurato per rilevare automaticamente la
lingua di ciò che è scritto nella prima finestra e che l'utente vuole tradurre. Il testo
può essere selezionato con il mouse e una piccola icona G apparirà accanto. Se
l'icona o il pulsante viene premuto, l'area si estende automaticamente e si visualizza
la traduzione senza appesantire la visuale e il computer. Numerosi controlli sono
visualizzati sotto il testo tradotto, compresa la possibilità di copiare parole e frasi
negli “Appunti di Windows” o di selezionare manualmente le lingue per la
traduzione, diventa utile nel caso in cui il servizio di traduzione rileva la lingua
sbagliata. Lo stesso Google client può essere utilizzato in altre applicazioni e
finestre di altri programmi aperti previa impostazione. Di default esso s’installa con
l'opzione “avvio con Windows” in modo che si avvia da solo quando si accende il
42
computer, ma si può anche disabilitare. Il client di Google Translate è un
programma software adatto per sistemi operativi come Windows Xp, Vista e
Windows Seven43.
4.6 Google Toolbar. Google Toolbar è uno strumento che s’integra direttamente
nel browser Internet Explorer (esiste anche una versione per Firefox) e che
permette di avere a disposizione una serie di funzioni utili durante la navigazione.
La Google Toolbar offre una grande varietà di funzioni, in questa pagina
riassumeremo le principali. Nel campo di ricerca di Google, posizionata nella
toolbar stessa, appare un elenco con le ricerche più frequenti effettuate con Google,
le eventuali correzioni ortografiche, insieme alla cronologia delle ricerche di
Google Toolbar e ai segnalibri. Google Toolbar garantisce che i parametri
predefiniti di ricerca siano impostati correttamente e avverte quando spyware, o
altri programmi tentano di modificare le impostazioni di ricerca predefinite usando
altri motori di ricerca. Google Toolbar offre anche uno strumento utile per le
traduzioni, che ci dà la possibilità di tradurre da sessantasette lingue,
semplicemente selezionando “Traduci questa pagina” dal menu “Traduci” della
Toolbar. Si possono anche tradurre singole parole che si trovano in una pagina web
utilizzando la funzione “Traduttore di parole”, selezionando “Attiva traduttore di
parole” dal menu “Traduci”, basta collocare il cursore del mouse su una parola
“straniera” per poter visualizzare la traduzione.
43
Fig.8.Funzione di Google Toolbar
4.7 Novità per la traduzione automatica. A febbraio del 2010 Google fa un
passo avanti per infrangere il muro linguistico – culturale, facilitando ancora di più
la traduzione. La grande evoluzione di Google si chiama “Google Goggles”. Si
tratta di un servizio, inserito nei cellulari dotati di sistema operativo Android, che
permette di tradurre un intero testo tramite una fotografia. A chiunque capitata di
trovarsi in un luogo e di avere l'esigenza di leggere una scritta che magari è in
lingua straniera; per farlo, basta fotografare il testo e istantaneamente sullo schermo
del cellulare arriva la traduzione. Già in passato Google aveva annunciato il
servizio “Goggles” come uno strumento per reperire le informazioni tramite
fotografia. In sostanza la fotocamera del “googlefonino” è trasformata in una sorta
di scanner, mentre Goggles (che in inglese significa “occhiali”) ha la funzione
aggiunta di un OCR, ovvero di un software in grado di riconoscere il testo
anteriormente selezionato dall'utente e digitalizzarlo, e poi di tradurlo in modo
istantaneo. Ora la novità sta proprio nel supporto multilingua con relativa
traduzione, per adesso disponibile solo con il sistema operativo Android 1.6 e
successivi. Il servizio, oltre al traduttore istantaneo, consente anche di analizzare
una foto ottenendo informazioni riguardanti il soggetto: per esempio, partendo da
un’immagine di un quadro abbastanza famoso si possono avere autore, titolo,
44
museo, e altri dati utili. In più l'applicazione è in grado di identificare monumenti,
paesaggi, luoghi aziendali ed etichette di vini. “Google Images” è in grado di
riconoscere le immagini fotografate e dare le dovute spiegazioni sull'oggetto
catturato dalla fotocamera. Certamente si tratta di un grande supporto per tutti
quelli che non potendo stare di fronte a un computer, hanno bisogno d’informazioni
utili e soprattutto istantanee44.
Fig.9. Google Goggles.
4.8 Traduzione speech to speech. Visto il successo di Google Translate che
traduce documenti o pagine web in ben cinquantadue lingue, e di Google Voice che
conta già 1,4 milioni di utenti, la società di Mountain View sta lavorando a un
interprete universale da installare nel giro di due, tre anni negli smartphone, e che
45
consentirà a due persone che non parlano la stessa lingua di comunicare via
telefono in tempo reale. “Siamo convinti di poter arrivare a questo software speech-
to-speech nel giro di pochi anni” – ha detto al Sunday Times Franz Och,
responsabile dei servizi di traduzione di Google – anche se, per farlo funzionare
correttamente, “bisognerà arrivare alla perfetta combinazione fra un accurato
traduttore automatico e un sistema di riconoscimento vocale ad alta precisione ed è
proprio in questa direzione che ci stiamo muovendo”. Per stessa ammissione
dell’esperto, mentre i traduttori automatici di testo hanno fatto passi da gigante
negli ultimi anni, i sistemi di riconoscimento vocale sembrano, invece, dare
maggiori grattacapi. “Ognuno di noi ha la sua voce e il suo accento” – ha
continuato Och – ma la natura personale dei cellulari dovrebbe permettere di
aggirare questo problema. “Naturalmente, questo software diventerà tanto più
accurato quanto più sarà usato e, quindi, più dati inseriranno, migliore sarà la
qualità di traduzione” (Franz Och, 2009)45.
46
Note al capitolo quarto.
34KOLLER, DAVID, Gennaio 2004. Origin of the name, “Google”. Stanford
University. Fonte online www.searchenginehistory.com35ROBERTO, CURCI, 2007. Risorse per Webdesigner e Webcoders. Fonte online
www.robertocurci.net36New York Times del 9 marzo 2010, a cura di Miguel Helft. Fonte online
www.tg3.rai.it37 Inktomi Corporation - società della California che ha fornito il software per i
fornitori di servizi Internet. È stata fondata nel 1996 dal professor Eric Brewer e dal
dottorando Paul Gauthier. Fonte online www.business.com38 Profilo aziendale consultabile online su http://www.google.com/corporate/.39New York Times del 9 marzo 2010, a cura di Miguel Helft. Fonte online
www.tg3.rai.it40L'azienda di Tim O’Reilly è ritenuta da molti la migliore casa editrice di
Informatica al mondo, e tanti sono i programmatori che considerano un libro
O'Reilly il libro definitivo su un certo argomento. Fonte online http://oreilly.com/41 Franz Josef Och lavora con Google dal 2004 come ricercatore scientifico, capo
gruppo della squadra di traduzione automatica. Fonte online
www.research.google.com
47
42 GAVEZ, M e BHANSALI, SANJAY, 2009. Tradurre il mondo
dell’informazione con Google Translator Toolkit. Fonte online
www.googleblog.blogspot.com43 Client for Google Translate –Free Translator. Fonte online su
www.translateclient.com41 44Google Goggles – Fonte online
www.whatisgooglegoggles.com 45 The Sunday Times ,February 7, 2010. Google leaps language barrier with
translator phone, a cura di Chris Gourlay. Fonte online www.timesonline.co.uk
CAPITOLO 5
SPEECH TO SPEECH TRANSLATION
“I sistemi di traduzione Speech-to-Speech hanno il potenziale di rivoluzionare il
modo in cui le persone di tutto il mondo, che parlano lingue diverse, riescono a
comunicare l'uno con l'altro. Ci sono migliaia di lingue parlate. Immaginate di
essere in grado di comunicare istantaneamente con chiunque, attraverso l'assistenza
di un traduttore universale. “La sconfitta delle ultime barriere di comunicazione
comporterebbe un’enorme crescita nella comprensione culturale, consentendo alle
persone di accettare e convivere con le differenze dell’altro46”, dichiara la
ricercatrice Yuging Gao. Sempre lei afferma che la parte più importante della
ricerca con un compito cosi innovativo sta nell’affrontare sfide nuove. “È molto
emozionante trovare un modo per riconoscere, comprendere e tradurre lingue
attraverso tecniche avanzate47”.
48
5.1 Ricerca e tecnologia. L'obiettivo della traduzione Speech-to-Speech (S2S) è
quello di consentire la comunicazione interpersonale in tempo reale, tramite il
linguaggio naturale delle persone che non condividono un linguaggio comune. Il
traduttore automatico multilingua Speech-to-Speech (MASTOR) è il primo sistema
S2S che permette la comunicazione bidirezionale tra la coppia di lingue inglese –
mandarino. Mastor (Multilingual Automatic Speech-to speech Translator) è stato
avviato nel 2001 come un progetto di ricerca avanzato della IBM ed è stato
selezionato per essere finanziato dalla Defence Advanced Research Projects
Agency (DARPA). Mastor unisce le tecnologie di avanguardia di IBM nei seguenti
settori: riconoscimento automatico della voce, comprensione e sintesi. La stretta
dipendenza tra il riconoscimento vocale e la comprensione attenua efficacemente
gli effetti dovuti all’errato riconoscimento vocale di strutture agrammaticali
comune nel linguaggio colloquiale. La qualità della traduzione risulta altamente
affidabile in certi domini di attività. Mastor possiede attualmente la capacità
bidirezionale di tradurre tra l’inglese e il mandarino in forma libera senza vincoli,
con un vocabolario di grandi dimensioni (più di 30.000 parole per ogni lingua)
adatto a vari settori: viaggi, diagnosi medica di emergenza, protezione delle forze
di difesa e sicurezza. Funziona in tempo reale su portatile, ed è stato sviluppato
anche per palmare PDA, con un minimo degrado delle prestazioni. Entrambe le
versioni del sistema offrono ottime prestazioni, come dimostrato a febbraio e ad
agosto del 2004 a DARPA che dopo una valutazione complessa l’ha dichiarato
soddisfacente. L’IBM è stata l'unica squadra in grado di presentare un sistema di
traduzione bidirezionale speech-to-speech per PDA ottimizzato in modo da 49
richiedere una minore quantità di memoria e minimi requisiti di elaborazione per
prestazioni elevate. DARPA e la comunità tecnologica riconoscono Mastor come
una svolta nella traduzione del linguaggio parlato per la sua capacità di analizzare
l’imput vocale e produrre un output bidirezionale. La costruzione di efficaci sistemi
per la traduzione speech-to-speech è stato il sogno dei ricercatori in linguaggio
naturale per decenni. È tecnicamente molto difficile a causa della necessità di
integrare una serie di tecnologie complesse - Automatic Speech Recognition (ASR),
Natural Language Understanding (NLU), traduzione automatica (MT), Natural
Language Generation (NLG) e Text-to-Speech Sintesi (TTS) - che sono tutt'altro
che mature, tanto meno quando vengono usate insieme. Attualmente, l'unico
apparecchio per la traduzione vocale disponibile sul mercato è Phraselator, un
semplice dispositivo di traduzione unidirezionale che è stato personalizzato per
l’uso militare. Cerca tra un numero fisso di frasi in inglese e riproduce le
registrazioni vocali corrispondenti in lingue straniere, però non può gestire un
discorso bidirezionale48.
5.1.1 Come funziona Mastor IBM? Il funzionamento del nuovo software si
articola in tre momenti successivi: Mastor memorizza una frase pronunciata da uno
degli interlocutori e la converte in testo scritto, quindi esegue una traduzione di tale
frase nella lingua del secondo interlocutore e finalmente riferisce la frase tradotta
attraverso un sintetizzatore vocale. A differenza di altri prodotti simili, non richiede
l’uso di frasi già memorizzate e non deve identificare ogni parola pronunciata, ma è
50
in grado di comprendere il concetto. La traduzione di Mastor, infatti, si basa
sull’analisi statistica del linguaggio: il traduttore automatico scompone la frase di
origine in un set d’idee concettuali e ripropone gli stessi concetti nella lingua
richiesta. Se, per esempio, tale frase esprime una richiesta di aiuto di carattere
medico, essa sarà tradotta sempre con un’unica frase predefinita che ne conservi il
significato, senza ricorrere ad una traduzione letterale delle singole parole che la
compongono. In tal modo, si potrà evitare l’utilizzo di corposi database, necessari
per la traduzione, e rendere più agevole l’introduzione della nuova tecnologia IBM
in dispositivi di ridotte dimensioni49. Tra le sue principali caratteristiche, abbiamo
una notevole riduzione degli errori legati a differenze di accento, utilizzo di
espressioni dialettali e interiezioni, e delle varie tonalità di voce. L’IBM ha
precisato che la tecnologia Mastor è ancora in fase di sviluppo e che è ancora
troppo presto per prevedere quando tale tecnologia potrà essere inclusa nei primi
dispositivi hardware50.
51
Fig.10. Architettura di Mastor IBM
Note al capitolo quinto
46,47,48traduzione propria dall’intervista rilasciata da Yuqing Gao, 2009, Speech-to-
Speech Translation, online su www. domino.watson.ibm.com
49Mastor: il traduttore simultaneo che non fa la traduzione letterale delle parole ma
comprende il concetto della frase, 2007, online su www.technorati.it
50traduzione propria dall’articolo Mastor, 2007, online su www.IBM.com
52
CAPITOLO 6
HILBERT ENGINE
Il futuro della traduzione automatica prevede la semplificazione dei testi da
tradurre e lo sviluppo della cosiddetta “memoria di traduzione”, vale a dire la
memorizzazione di frasi ripetitive: in questo senso Internet si rivela un'opportunità
da non perdere. Secondo le previsioni, questo futuro è rappresentato da enormi
database che raggiungono velocemente ed accuratamente l’informazione con
l’aiuto della tecnologia vettoriale, sviluppata attualmente da Primentia. Inc con un 53
prodotto molto promettente chiamato Hilbert Engine. Il motore di Hilbert
Technology Inc. rappresenta un approccio radicalmente nuovo ai database di
traduzione. L'offerta si basa sulla tecnologia Hilbert Engine per l'accesso ad
altissima velocità, manipolazione, conservazione e analisi di grandi volumi di dati
strutturati e non strutturati . La tecnologia Hilbert Engine trova le sue applicazioni
per: servizi pubblici, traduzione, legge, governo, finanza, comunicazioni, trasporti,
turismo e industria Chimico-Farmaceutica.
6.1 L’invenzione. Il motore Hilbert trae le sue radici da un lavoro per la
pulizia di molti gigabyte di dati scarsamente associati. Il progetto viene proposto a
una grande azienda di consulenza che dopo molti mesi di analisi trae la conclusione
che ci sarebbero voluti mesi di “run-time” per pulire questi dati. Bjorn Gruenwald,
l'inventore del Motore Hilbert, ha avuto l'opportunità di rivedere il problema ed ha
suggerito un approccio radicalmente innovativo: analizzare tutte le colonne di una
tabella in file di singole parole e tradurre tutti i dati di queste file in numeri. Così
una banca di dati sarà completamente trasformata in una matrice di dati numerici in
un ambiente chiamato Hilbert Space. Questa struttura utilizza l’efficiente
linguaggio di programmazione chiamato Hilbert-Script (H-Script). Anche se su
questo approccio c’era inizialmente un grande scetticismo da parte dei
professionisti IT , la ditta ha scelto di procedere. La soluzione di Bjorn è stata
testata con successo, con grandi vantaggi in termini di tempo di ricerca e di accesso
ai dati. 54
Fig.11. L’architettura del CPU Hilbert
Dopo questo successo iniziale, Hilbert Engine è stato applicato per la gestione di
database nell’industria farmaceutica e nelle applicazioni di sicurezza del governo.
6.2 Sviluppo. Il tempo impiegato per lo sviluppo delle applicazioni di ricerca e
reperimento dati è più breve con il Motore Hilbert, efficienza dovuta in parte al H-
script e alla progettazione dello spazio Hilbert. Per esempio presupponiamo che
dobbiamo scegliere da un database di milioni di persone tutti i record con il valore
nome uguale a “Washington”, con capelli castani e occhi blu, che vivono in
“Philadelphia” e hanno tra i 30 e i 50 anni. Si deve specificare che questi dati non
sono stati indicizzati per campi singoli, come nome, colore dei capelli o degli
55
occhi, città o età. Con la tecnologia attuale sarebbe quasi impossibile ottenere le
risposte in meno di un secondo – ma questo è invece reso possibile dal Motore
Hilbert. Questa velocità incredibile non è limitata ai dati basilari (come un Address
Book), ma si estende anche ai dati associati51.
Fig.12. La tecnologia vettoriale
6.3 Prospective per il futuro della traduzione. L’Hilbert Engine non è
direttamente uno strumento di traduzione automatica: è piuttosto uno strumento di
ricerca veloce attraverso grandi quantità di dati. Viste le potenzialità di Hilbert
Engine e la rapidità nel rintracciare le informazioni presenti in una banca dati
possiamo ipotizzare una futura “macchina traduttrice” che riuscirà a superare la
traduzione umana offrendo velocità e accuratezza . Non è forse lontano il momento
56
in cui il muro linguistico che separa nazionalità e culture lontane sarà abbattuto
attraverso queste tecniche di avanguardia, che consentiranno a interlocutori di varie
lingue di comunicare via telefono, internet e appositi dispositivi ognuno nella sua
lingua naturale senza nessuna barriera linguistica, oppure di tradurre con un
semplice clic testi scritti in tutte le lingue del mondo, eliminando cosi per sempre
gli effetti della Torre di Babele.
Note al capitolo sesto.
51 Traduzione propria dalla pubblicazione “Perspective on Performance in Business
Intelligence- The Hilbert Engine” 2009. Hilbert Technology Inc. Le immagini
Fig.11.e Fig.12. appartengono alla stessa pubblicazione.
57
Conclusione finale
Uno degli aspetti più esaltanti del lavoro nel campo della traduzione
automatica – e dunque anche della ricerca che è stata alla base di questo lavoro di
tesi – è quello di poter prefigurare una situazione in cui il mitico muro linguistico
inizia a sciogliersi, dando luogo a una comunicazione completa tra esseri umani
parlanti lingue diverse. A testimoniare il fatto che questa possibilità inizia a non
sembrare più solo un’ipotesi irrealistica, sono i più importanti strumenti informatici
disponibili sul mercato e il loro prevedibile sviluppo futuro.
Nell’esaminare queste prospettive, ho cercato di includere in questo elaborato
anche una parte pratico-applicativa, sotto forma di riferimenti utili per rintracciare e
utilizzare in modo giusto alcuni fra i più potenti strumenti informatici per la
traduzione automatica esistenti online. Nel farlo, mi sono basata su un lavoro di
ricerca che ha richiesto anche la traduzione di varie pubblicazioni nel campo.
Sicuramente, la difficoltà principale che ho incontrato è stata quella della selezione
dei materiali da utilizzare. Mi riferisco principalmente alla scelta degli autori e
58
delle pubblicazioni più affidabili. La traduzione automatica è un argomento
estremamente complesso, ogni contributo fornisce o può fornire nuovi argomenti,
per cui mantenere la giusta strada non è mai facile.
Per capire meglio l’importanza della traduzione automatica proviamo ad analizzare
le due tabelle sotto riportate: nella prima possiamo osservare il mercato della
traduzione negli anni novanta invece la seconda rappresenta la traduzione
automatica oggi.
Tabella.1. Il mercato della traduzione nel 1990
Stato La traduzione umana T.M
Europa e Stati Uniti 300 milioni di pagine 2.5 milioni di pagine
Giappone150 milioni di pagine 3.5 milioni di pagine
Tabella.2. Il mercato della traduzione nel 2010
Stato La traduzione umana T.M
Europa e Stati Uniti (Unione Europea)
400 milioni di pagine 200 milioni di pagine
59
Giappone200 milioni di pagine 50 milioni di pagine
Tabella.2. Il mercato della traduzione nel 2010
Come possiamo osservare, rispetto a vent’anni prima, nel 2010 il mercato della
traduzione automatica è radicalmente cambiato: da una percentuale di appena l’8%
di traduzioni automatiche negli anni novanta si passa al 50% nell’Unione Europea e
al 25% in Giappone. Attraverso questi datti possiamo renderci conto dell’enorme
espansione che il settore ha conosciuto negli ultimi vent’anni e formulare ipotesi
per poter immaginare come saranno i prossimi venti.
60
Bibliografia
BERTAZOLLI, La traduzione: teorie e metodi, Carocci editore, 2006
BOWKER, L.; Computer-Aided Translation Technology. A practical introduction. University of Ottawa Press, Ottawa 2002.
CHIARI, I.; Informatica e lingue naturali. Teorie e applicazioni computazionali per la ricerca sulle lingue. Aracne, Roma 2004.
HAROLD L. SOMERS: "New Paradigms" in MT: The state of play now that the dust has settled. In ESSLLI '98 Machine Translation Workshop
HAROLD L. SOMERS: Computers and translation. A translator’s guide. J. Benjamins Publishing Company, Philadelphia 2003.
HEIDEGGER, M Sentieri interrotti, trad. it. di P. Chiodi, La Nuova Italia, Firenze 1968, p. 300
HEIDEGGER, M. Che cosa significa pensare? a cura di U. Ugazio e G. Vattimo, Sugar, Milano 1979,
JACOBSON, Note per una didattica sulla storia della traduzione. Aspetti del linguaggio e della traduzione, trad. it. di R. Bianchi e C. Béguin Garzanti, Milano 2004
LAGOUDAKI, E (2006), “Translation Memory systems: Enlightening users perspective”. Imperial College London
MONACELLI, C; Traduzione, revisione e localizzazione nel terzo millennio: da e verso l'inglese. FrancoAngeli, 2001
61
MOUNIN, Teoria e storia della traduzione, Einaudi, 2006
NEGAARD, S (a cura di), Teorie contemporanee della traduzione, Bompiani, 2007 (introduzione e saggi di: Jakobson, Eco)
NERGAARD, S. La teoria della traduzione nella storia, Bompiani, Milano 1993. MARCO TULLIO CICERONE, De optimo genere oratorum,
O’HAGAN, M.; ASHWORTH, D.; Translation-mediated communication in a digital world. Facing the challenges of Globalization and Localization. Multilingual Matters, Clevedon 2002.
OSIMO, B.; Traduzione e nuove tecnologie. Informatica e Internet per traduttori, guida pratica con glossario. Hoepli, Milano 2001.
SAN GEROLAMO, Liber de optimo genere interpretandi, Epistola 57 a Pammacchio, (390 ca.), in TTS, pp.63-71.
Pubblicazioni e riviste online
Client for Google Translate –Free Translator. Fonte online su
www.translateclient.com,
Concise history of the language sciences: from the Sumerians to the cognitivists.
Edited by E.F.K.Koerner and R.E.Asher. Oxford: Pergamon Press, 1995. 431-445,
online su: www.hutchinsweb.me.uk/history.htm
CURCI, ROBERTO 2007. Risorse per Webdesigner e Webcoders. Fonte online:
www.robertocurci.net
Ermeneutica, tradizione e traduzione in Heidegger, a cura di Francesco Cardone, fonte online: www.filosofico.net
62
GAVEZ, M e BHANSALI, SANJAY, 2009. Tradurre il mondo dell’informazione
con Google Translator Toolkit. Fonte online www.googleblog.blogspot.com
Google Goggles – Fonte online: www.whatisgooglegoggles.com
KOLLER, DAVID, Gennaio 2004. Origin of the name, “Google”. Stanford
University. Fonte online www.searchenginehistory.com
Machine Translation and Computer-Assisted Translation: a New Way of
Translating? by Olivia Craciunescu, Constanza Gerding-Salas, Susan Stringer-
O'Keeffe, 2004. Online su http://accurapid.com/journal/29computers.htm.
MAEGAARD, B, 1989. Perspectives in artificial intelligence vol. 2: machine
translation, NLP, databases and computer-aided instruction. Source
http://portal.acm.org/citation.cfm?id=65688
MUZZI, A, 2000-2010, Translation & localization services for the Italian
language, online su http://www.amtrad.it
New York Times del 9 marzo 2010, a cura di Miguel Helft. Fonte online
www.tg3.rai.it
Perspective on performance in Business Intelligence- The Hilbert Engine-Hilbert Technology Inc. 2004, online su: hilbertcompany.es/fileadmin/Documents/.../OV_Company_Overview.pdf
Software Professionali online su http://www.navigaweb.it
The Sunday Times, February 7, 2010. Google leaps language barrier with
translator phone, a cura di Chris Gourlay. Fonte online www.timesonline.co.uk
Traduzione automatica e traduzione gratuita, 2009. www.traduzione-
localizzazione.com
63