tetra iii - uibk.ac.at · globalizzazione e traduzione aumento esponenziale del mercato...
TRANSCRIPT
TeTra 3 dati, formati e programmi aperti 4TeTra 3 dati, formati e programmi aperti 4TeTra 3 dati, formati e strumenti aperti 4
panoramica
1) traduzione 2.0 - cambiamenti
2) formati aperti
3) strumenti aperti
4) risorse aperte
TeTra 3 dati, formati e programmi aperti 5TeTra 3 dati, formati e programmi aperti 5TeTra 3 dati, formati e strumenti aperti 5
traduzione
● tendenze:
– digitalizzazione
– globalizzazione
– tecnologizzazione
TeTra 3 dati, formati e programmi aperti 6TeTra 3 dati, formati e programmi aperti 6TeTra 3 dati, formati e strumenti aperti 6
digitalizzazione
● testi digitalirivoluzione nella possibilità di copiare, trasportare,ricerca e riutilizzo
● umanistica digitaleapplicazione di strumenti computazionali alla ricerca umanisticae l‘uso sistematico di risorse digitali nelle discipline umanistiche
TeTra 3 dati, formati e programmi aperti 7TeTra 3 dati, formati e programmi aperti 7TeTra 3 dati, formati e strumenti aperti 7
globalizzazione e traduzione
● aumento esponenziale del mercato
● possibilità di cooperazione su scala mondiale
● progetti di traduzione
● esigenze di:qualità, tempestività, professionalità e convenienza
TeTra 3 dati, formati e programmi aperti 8TeTra 3 dati, formati e programmi aperti 8TeTra 3 dati, formati e strumenti aperti 8
tecnologizzazione
● traduzione assistita
● impiego di ‘Translation Environment Tools‘ (TenT)
● professionalità: la traduzione professionale ed istituzionale si deinisce anche attraverso l‘impiego di adeguati strumenti tecnologici“bisogno di guadagnarequalche quattrinello“ (Terracini 1957)
TeTra 3 dati, formati e programmi aperti 9TeTra 3 dati, formati e strumenti aperti 99
dataication
● trasformazione in un’economia data-driven alimentata dalle molteplici fonti di big data (ad esempio social media, settore privato, pubblica amministrazione)
● dataication: "the idea that more and more businesses are dependent on their data for their business"
TeTra 3 dati, formati e programmi aperti 10TeTra 3 dati, formati e strumenti aperti 1010
la traduzione
● deinizione semplice:trasposizione inalizzata di un testo di partenza (tp) in una lingua in un testo di arrivo (ta) in un‘altra
● deinizione ampia:"jede konventionalisierte, interlinguale und transkulturelle Interaktion [...], die in einer Kultur als zulässig erachtet wird"
"ogni interazione interlinguale e transculturale convenzionalizzata [...] che si ritiene ammissibile in una determinata cultura“ (Prunc 1997: 108)
TeTra 3 dati, formati e programmi aperti 11TeTra 3 dati, formati e strumenti aperti 1111
‘dataication‘ della traduzione
● traduzione = produzione di un testo di arrivo + dati
● dati = (segmenti del) testo di partenza + (segmenti del) testo di arrivo + relazioni di equivalenza
+segmento tp segmento taequivale an°
segmento tp segmento ta
segmento tp segmento ta
segmento tp segmento ta
segmento tp segmento ta
equivale a
equivale a
equivale a
equivale a
n°
n°
n°
n°
TeTra 3 dati, formati e programmi aperti 12TeTra 3 dati, formati e strumenti aperti 1212
‘dataication‘ della traduzione
+
ta
output
dati
tp
input
dati
processotraduttivo+ {}
TeTra 3 dati, formati e programmi aperti 13TeTra 3 dati, formati e strumenti aperti 1313
dati (traduzione)
● livelli linguistici
– a livello lessicale dati lessicograici e terminologici➢
– a livello sintattico memorie di traduzione➢
– a livello testuale corpora paralleli➢
TeTra 3 dati, formati e programmi aperti 14TeTra 3 dati, formati e strumenti aperti 1414
Schlitzsperre briglia a fessura
● a livello lessicale/terminologico
● a livello sintattico
● a livello testuale
Eliminate gender disparity in primary and secondary education, preferably by 2005, and in all levels of education no later than 2015.
Das Geschlechtergefälle in der Grund- und Sekundarschulbildung beseitigen, vorzugsweise bis 2005 und auf allen Bildungsebenen bis spätestens 2015.
difesa degli argini nei bacini montani
MDG dell' ONU
TeTra 3 dati, formati e programmi aperti 15TeTra 3 dati, formati e strumenti aperti 1515
dati traduttivi - considerazioni
● depersonalizzazione della igura del traduttore
● riutilizzo delle traduzioni, e quindiaumento dell‘eicienza e della produttività
● traduzione automatica statistica (SMT)Google translate, Microsoft Translator …
● ...
TeTra 3 dati, formati e programmi aperti 16TeTra 3 dati, formati e strumenti aperti 1616
‘dataication‘ della traduzione
● traduzione =
– remix (rigenerazione creativa) in base a
– dati (dati traduttivi) e
– input (scopo del ta, parametri dellacommissione)
● traduzione =
– trasformazione del tp +– selezione, recombinazione,
adattamento di dati
TeTra 3 dati, formati e programmi aperti 17TeTra 3 dati, formati e strumenti aperti 1717
concezione aggiornata della traduzione (processo)
la qualità della traduzione = f (qualità dei dati traduttivi)“gigo” (acronimo di garbage in, garbage out)
traduzione = applicazione e produzione di dati traduttivi nel caso concreto in funzione di determinati criteri
traduzione =
TeTra 3 dati, formati e programmi aperti 18TeTra 3 dati, formati e strumenti aperti 1818
formati aperti
il formato dei dati digitali si deinisce "aperto" quando ne viene resa pubblica, mediante esaustiva documentazione, la sintassi, la semantica, il contesto operativo e le modalità di utilizzo. Tali informazioni, unitamente ad una guida all’uso del formato, orientata alla lettura da parte dell’utilizzatore, devono essere presenti in uno o più documenti rilasciati dall’ente proponente lo standard.
http://www.digitpa.gov.it/formati-aperti
TeTra 3 dati, formati e programmi aperti 19TeTra 3 dati, formati e strumenti aperti 1919
formati aperti: vantaggi
● dati accessibili e perenni
● indipendenza da software speciici
● assenza di dati nascosti (trasparenza)
● interoperabilità
● assenza di virus
www.openformats.org
TeTra 3 dati, formati e programmi aperti 21TeTra 3 dati, formati e strumenti aperti 2121
formati aperti adatti alla memorizzazione delle traduzioni
● formati standardizzati idonei a registrare segmenti di testo equivalenti in due o più lingue
– TermBase Exchange Format (TBX)
– Translation Memory Exchange Format (TMX)
– XML Localization Interchange File Format (XLIFF)
– GNU gettext PO
TeTra 3 dati, formati e programmi aperti 22TeTra 3 dati, formati e strumenti aperti 2222
formati aperti: diferenze strutturali
TeTra 3 dati, formati e programmi aperti 23TeTra 3 dati, formati e strumenti aperti 2323
strumenti aperti
● software libero (free software)
● software open source
in contrapposizione al software proprietario e commerciale
}codice sorgente aperto+ licenze aperte
TeTra 3 dati, formati e programmi aperti 24TeTra 3 dati, formati e strumenti aperti 2424
open source vs software proprietariodiferenze strutturali
● molteplicità di progetti
● funzionalità ristretta
● licenza libera
● aggiornamenti irregolari
● supporto da parte della comunità degli utenti
● molteplicità di progetti
● funzionalità ristretta
● licenza libera
● aggiornamenti irregolari
● supporto da parte della comunità degli utenti
● applicazioni complesse
● funzionalità completa
● licenza commerciale
● aggiornamenti regolari
● supporto commerciale
open source software proprietario
TeTra 3 dati, formati e programmi aperti 25TeTra 3 dati, formati e strumenti aperti 2525
strumenti aperti: le ragioni
● necessità di strumenti aperti per poter
– accedere
– leggere e modiicare
– pubblicare i dati aperti
– ridistribuire e difondere gli strumenti assieme ai dati
● senza vincoli
– giuridici
– economici
– ...
TeTra 3 dati, formati e programmi aperti 26TeTra 3 dati, formati e strumenti aperti 2626
situazione mercato
Anaphraseus
Okapi
Jubler
TinyTm
ambito'open source'
BiText2TMX
Sun OLT Virtaal
OmegaT
OpenTMSFOLTGaupol
Lokalizer
ambito commerciale
SDL/Trados
Across
Star Transit
MemoQ
Heartsome
DéjàVu
Rainbow
Wordfast
TransolutionForeignDesk
Pootle
KBabel
PO-EditTranslate Toolkit
Catalyst
TeTra 3 dati, formati e programmi aperti 27TeTra 3 dati, formati e strumenti aperti 2727
supporto per formati di testo
● Open Document● Microsoft Oice XML● (X)HTML ● HTML Help Compiler (HCC)● DocBook ● File di solo testo● Java bundle.properties● .po monolingua● INI (formato "codice=value")● XLIFF (Okapi, sdlxlif)● MediaWiki (Wikipedia)
● OpenDocument● Microsoft Oice (2000-2003,
2007)● (X)HTML● DocBook ● RTF● XML● Adobe FrameMaker 8.0/9.0● Adobe InDesign CS4● XLIFF● DITA● W3C ITS.
OmegaT SDL-Trados
TeTra 3 dati, formati e programmi aperti 28TeTra 3 dati, formati e strumenti aperti 2828
supporto formati aperti
● completo:– TMX
● parziale:– XLIFF (Okapi, sdlxlif)
– PO
● mancante:– SRX
● completo:– TMX
● parziale:– XLIFF (sdlxlif)
● mancante:– SRX
OmegaT SDL-Trados
TeTra 3 dati, formati e programmi aperti 29TeTra 3 dati, formati e strumenti aperti 2929
le nostre proposte
● strumenti aperti per la traduzione assistitaUSBTrans (ambiente Windows)http://homepage.uibk.ac.at/~c61302/fsftrans.html
● desktop completamente open sourceper la traduzione assistita tuxtrans (Linux)http://www.tuxtrans.org
TeTra 3 dati, formati e programmi aperti 30TeTra 3 dati, formati e programmi aperti 3030
TeTra 3 dati, formati e programmi aperti 30TeTra 3 dati, formati e strumenti aperti 30
dati aperti
TeTra 3 dati, formati e programmi aperti 31TeTra 3 dati, formati e programmi aperti 3131
TeTra 3 dati, formati e programmi aperti 31TeTra 3 dati, formati e strumenti aperti 31
dati aperti: condizioni fondamentali
● riutilizzo e ridistribuzione: libero utilizzo per tutti gli scopi anche quelli originariamente non previsti dal produttore
● disponibilità e accesso liberi:(prezzo, licenza, log-in ...)
● possibilità di elaborazione e modiicazione:I dati devono essere disponibili in un formato utile e modiicabile
vedasi:http://www.opendefinition.orghttp://opendatahandbook.org/it/
TeTra 3 dati, formati e programmi aperti 32TeTra 3 dati, formati e programmi aperti 3232
TeTra 3 dati, formati e programmi aperti 32TeTra 3 dati, formati e strumenti aperti 32
dati aperti: ragioni● le opere dell'ingegno inanziate (a fondo perduto) con
soldi pubblici e le opere di pubblico dominio siano:
– pubblicamente accessibili (facilmente reperibili su Internet);
– universalmente accessibili (accessibili anche per i diversamente abili);
– liberamente fruibili (non occorre pagare per: leggere un testo, vedere un'immagine, ascoltare una musica);
– legalmente fruibili (l'utente è certo di poter scaricare un ile nella piena legalità);
– ottimamente fruibili (qualità digitale idonea a garantire una buona visualizzazione e/o un buon ascolto).
citato da: scarichiamoli.org
TeTra 3 dati, formati e programmi aperti 33TeTra 3 dati, formati e programmi aperti 3333
TeTra 3 dati, formati e programmi aperti 33TeTra 3 dati, formati e strumenti aperti 33
i dati aperti nel mondo
● World Map of Open Government Data Initiativeshttps://maps.google.com/maps/ms?ie=UTF8&oe=UTF8&msa=0&msid=105833408128032902805.00048bfbba4ecb314e822
● European Union Open Data Portalhttp://open-data.europa.eu
● I dati aperti della PAhttp://www.dati.gov.it
● governo USAhttp://www.whitehouse.gov/open
● open data in Austriahttp://www.data.gv.at/
● open data nei comuni della Germaniahttp://opendata-kommunen.de/
● ...
TeTra 3 dati, formati e programmi aperti 34TeTra 3 dati, formati e programmi aperti 3434
TeTra 3 dati, formati e programmi aperti 34TeTra 3 dati, formati e strumenti aperti 34
http://www.epsiplatform.eu/content/european-psi-scoreboard
Direttiva 2013/37/UE del Parlamento europeo e del Consiglio, del 26 giugno 2013 , che modiica la direttiva 2003/98/CE relativa al riutilizzo dell’informazione del settore pubblico
TeTra 3 dati, formati e programmi aperti 35TeTra 3 dati, formati e programmi aperti 35TeTra 3 dati, formati e strumenti aperti 35
le traduzioni come dati aperti?
● le traduzioni eseguite nelle strutture pubbliche a inanziamento pubblico fanno parte del patrimonio informativo pubblico (PSI)
● e rientrano dunque nell'ambito dei dati aperti● in generale con il termine degli Open Translation Data
intendiamo tutti i dati liberamente accessibili che memorizzino traduzioni in un formato aperto speciico
TRANSLATION
TeTra 3 dati, formati e programmi aperti 36TeTra 3 dati, formati e programmi aperti 36TeTra 3 dati, formati e strumenti aperti 36
Open Translation Dataquestione terminologica
● dati traduttivi aperti?● dati aperti della traduzione?● dati aperti nell'ambito della traduzione?● risorse traduttive aperte?● …?
TeTra 3 dati, formati e programmi aperti 37TeTra 3 dati, formati e programmi aperti 37TeTra 3 dati, formati e strumenti aperti 37
● Open Data Euskadi http://opendata.euskadi.net/w79-contdata/es/contenidos/ds_recursos_linguisticos/memorias_traduccion/es_izo/memorias_traduccion_izo.html
Memorias de traducción del Servicio Oicial de Traductores
● United Nations General Assembly Resolutionshttp://www.uncorpora.org/
● ECDC-TM European Centre for Disease Prevention and Control' (ECDC)http://ipsc.jrc.ec.europa.eu/?id=782
● JRC DGT
Open Translation Data: esempi
23/02/2013 3823/02/2013 3823/02/2013 dati, formati e strumenti aperti 38
DGT-TMX
● Direzione Generale della Traduzionehttp://open-data.europa.eu/en/data/dataset/dgt-translation-memory traduzione completa del diritto europeo (acquis communautaire) nelle lingue uiciali dell'UE
● suddiviso per annate 2004-2012 e ile trimestrali
● estrazione della combinazione di lingue preferite con TMExtractjava -jar TMXtract.jar DE IT /home/c61302/temp/DGT-deit.tmx
TeTra 3 dati, formati e programmi aperti 39TeTra 3 dati, formati e programmi aperti 39TeTra 3 dati, formati e strumenti aperti 39
Open Translation Data: ragioni
● eicienza delle traduzioni (riutilizzo)● aumento della consistenza delle traduzioni● divulgazione delle traduzioni uiciali● enfatizzazione del ruolo della traduzione● supporto, accelerazione e controllo della pianiicazione
linguistica e terminologica● ...
23/02/2013 4023/02/2013 4023/02/2013 dati, formati e strumenti aperti 40
esempio: Prov. Aut. di BolzanoSito ufficiale all‘interno della Rete Civica con la legislazione completa nelle 3 lingue ufficiali:
23/02/2013 4123/02/2013 4123/02/2013 dati, formati e strumenti aperti 41
esempio: Prov. Aut. di Bolzano● premesse:
– testi tradotti e pubblicati
– traduzioni eseguite con l‘ausilio di memorie di traduzioni
– supporto del formato TMX
formato multilingue TMX
| Esporta in TMX |
23/02/2013 4223/02/2013 4223/02/2013 dati, formati e strumenti aperti 42
sintesi
● formati e dati aperti sono imprescindibili
● l‘uso di strumenti aperti nella traduzione è possibile ed auspicabile
● tutte le traduzioni uiciali e pubbliche dovrebbero essere disponibili come dati aperti
● gli Open Translation Data portano dei vantaggi pratici cospicui, nonchè aumentono il riconoscimento e la presenza in pubblico dei traduttori
TeTra 3 dati, formati e programmi aperti 43TeTra 3 dati, formati e programmi aperti 43TeTra 3 dati, formati e strumenti aperti 43
sito web:
http://www.petersandrini.net
http://uibk.academia.edu/PeterSandrini