uta seewald-heeg — hochschule anhalt (fh) equivalences 01 neuenburg, 19. mai 2001
DESCRIPTION
Translation-Memory-Technologie: Konzepte, ihre Realisierungen in kommerziellen Produkten und Entscheidungshilfen für den Einsatz konkreter Systeme. Uta Seewald-Heeg — Hochschule Anhalt (FH) EQUIVALENCES 01 Neuenburg, 19. Mai 2001. Translation-Memory-Technologie. - PowerPoint PPT PresentationTRANSCRIPT
Translation-Memory-Technologie:Konzepte, ihre Realisierungen in
kommerziellen Produkten und Entscheidungshilfen für den Einsatz
konkreter Systeme
Uta Seewald-Heeg — Hochschule Anhalt (FH)EQUIVALENCES 01
Neuenburg, 19. Mai 2001
1 Konzepte der Translation-Memory-Technologie
Recycling bestehender Übersetzungen Komponenten von Translation-Memory-
Systemen2 Kommerzielle Produkte
Produktpalette Systemeigenschaften
Terminologieverwaltung Retrieval im Referenzmaterial
3 Entscheidungshilfen für den Einsatz konkreter Systeme
Translation-Memory-Technologie
Konzepte der Translation-Memory-Konzepte der Translation-Memory-TechnologieTechnologie
RecyclingRecycling bestehender bestehender ÜbersetzungenÜbersetzungen
TraditionellerÜbersetzungsprozess
Quelltext-Dokument 1
Zieltext-Dokument 1
• Übersetzen• Nachschlagen/Recherchieren von
Terminologie• In Wörterbüchern• In Terminologiedatenbanken• Auf WWW-Seiten
• Suchen bereits erstellter Übersetzungen
• Im Ablagesystem• Auf Disketten• Im Dateisystem des Computers
Quelltext-Dokument 2
Quelltext-Dokument n
...
Zieltext-Dokument 2
Zieltext-Dokument n
...
Recycling bestehender Übersetzungen Übersetzungsprozess mit Translation Memory
Quelltext-Dokument
Zieltext-Dokument
Pre-processing• Extraktion der Formatinformation• Abgleich der Quelltext-Sätze mit
dem Referenzmaterial (Matches)
Post-processing• Zusammenführen der
übersetzten Sätze mit der Formatinformation
• Speichern der Satzpaare im TM
• Übersetzen• Überprüfen der Matches
Konzepte der Translation-Memory-Konzepte der Translation-Memory-TechnologieTechnologie
Komponenten vonKomponenten vonTranslation-Memory-SystemenTranslation-Memory-Systemen
Translation Memory (TM)Übersetzungsspeicher
• Multilinguales Text-/Satzarchiv
• Synchronisierte quellsprachige und übersetzte Textsegmente (Sätze), die als Referenzmaterial dienen
• Retrieval erfolgt in der Regel mit fuzzy logic
CAT
Komponenten vonTranslation-Memory-Systemen
11Datenbank-
Verwaltungs-programm
22Terminologie-
programm
33Text-/
Dokumenten-programm
44Alignment-programm
55Import-/Export-Filter
11Datenbank-
Verwaltungs-programm
• Suche nach gespeicherten Übersetzungen mit Fuzzy-Match-Verfahren
• Perfect Match: Segment im zu übersetzenden Dokument und im TM stimmen zu 100 % überein
• Full Match: Das Segment im zu übersetzenden Dokument und im TM stimmen bis auf Ersetzungsklassen wie Zahlen, Monatsnamen überein
• Fuzzy Match: Textsegmente, die Abweichung zum zu übersetzenden Segment aufweisen
• Eingriff bei Fehlern oder globalen terminologischen Änderungen an Satzpaaren
• Morphologische Analyse
• Linguistisches Tagging
22Terminologie-
programm
• Möglichkeit des Imports elektronisch gespeicherter Glossare
• Translation Manager (IBM) wird mit Terminologie-Wörterbuch ausgeliefert, andere Firmen (Trados, Star) bieten Terminologie-Wörterbücher zusätzlich an
• einige Programme sind sehr komplex (Fuzzy-Match-Algorithmen ermöglichen Suche nach Wörtern mit derselben Wurzel)
• Möglichkeit, nach einzelnen Wörtern im TM zu suchen (in den meisten Programmen)
• Morphologische Analyse
• Eintragsmodelle• TM-Schnittstelle• Workflow
33Text-/
Dokumenten-programm
• Programm, in dem die Übersetzung angefertigt wird
• häufig: 2 parallel angeordnete Fenster (AT - ZT)
• oft: 1 weiteres Fenster, das Einheiten des TM anzeigt
• meistens: Fenster des Terminologieprogramms
• z.T. recht primitive Textverarbeitungsmöglichkeiten, einige Programme erlauben nur „copy and paste“, andere volle Formatierungsmöglichkeiten
44Alignment-programm • Möglichkeit, bestehende Texte und Übersetzungen
in die Datenbank einzulesen• Texte werden in Segmente (meist Sätze) zerlegt• Zuordnung von Textstellen (Sätzen) durch
Verwendung von statistischen und/oder inhaltlichen Kriterien
• Nachbearbeitung in der Regel erforderlich
• große Unterschiede zwischen den angebotenen Programmen
• Star Transit: stark automatisiert (zeitsparend)• Trados WinAlign: halbautomatisch; mit graphischer
Alignierfunktion; ermöglicht, Alignment-Probleme schnell und einfach zu beheben
• in der Regel: zusätzliche Kosten bei der Anschaffung
55Import-/Export-Filter
• Einige Programme sind mit einer reichen Auswahl an Filtern ausgestattet (Déjà Vu, SDLX, IBM)
• Andere Programme bieten Filter zu Aufpreis an (Star Transit, Trados TWB)
• Alle Programme sind standardmäßig mit einem Filter für MS Word ausgestattet
Eignung vonTranslation-Memory-Systemen
• Texte liegen maschinenlesbar vor
• Große Textmengen mit hohem Anteil an Wiederholungen (Sätze, syntaktische Strukturen, Terminologie) innerhalb eines Textes sowie relativ zum vorhandenen Referenzmaterial
• Umfangreiche Terminologie
• Sicherstellen der terminologischen Konsistenz
• Wenige große Kunden (schnellere Amortisierung)
KKommerzielle Produkteommerzielle Produkte
ProduktpaletteProduktpalette
Translation Memory-Systeme• Déjà Vu von Atril
• EPTAS TM von ALPNET Technologyhttp://www.epp.de/
• SDLX von SDL
• Transit von STAR
• Translation Manager von IBM
• Translator's Workbench von Trados
• ZeresTrans von Zereshttp://hermes.zeres.de/
• TRANS Suite 2000 von Cypresofthttp://www.cypresoft.com/
TM-Technologie in MÜ-Systemen
• Personal Translator Office plus 2001(Linguatec)
• T1 (Langenscheidt)
KKommerzielle Produkteommerzielle Produkte
Systemeigenschaften:Systemeigenschaften:TerminologieverwaltungTerminologieverwaltung
Trados MultiTerm Trados MultiTerm ‘‘9595
Trados MultiTerm ’95
http://www.trados.com /(Testversion für 30 Tage)
• Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden
• Einträge können kreuzreferenziert werden• Suche in beliebigen Sprachrichtungen
möglich• Suche mit Wildcards und Fuzzy Match
MultiTerm ’95Fuzzy Searching
MultiTerm ’95Einbinden graphischer Elemente
TermStar von StarTermStar von Star
TermStar von Star
• Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden
• Einträge können kreuzreferenziert werden
• Suche in beliebigen Sprachrichtungen möglich
• Unterschiedliche Eintragsmodi verfügbar
TermStar
Kreuzreferenzen
Wahl verschiedener Layouts für die Bildschirmansicht möglich
TermStar
Kreuzreferenzen
Integration grafischer Elemente
KKommerzielle Produkteommerzielle Produkte
Systemeigenschaften:Systemeigenschaften:Retrieval im ReferenzmaterialRetrieval im Referenzmaterial
Trados Translator's WorkbenchTrados Translator's Workbench
Trados Translator's WorkbenchTrados Translator's Workbench
• Workbench-Editor = Textverarbeitungsprogramm(MS Word oder Word Perfect) oder TagEditor, T-Tagger oder S-Tagger
• Bei Intergartion in Textverarbeitung hohe Benutzerfreundlichkeit
• Einführung einer neuen Version: Trados 5
Trados Translator‘s WorkbenchEdition 3
Trados Translator‘s WorkbenchEdition 3
Trados Translator‘s WorkbenchEdition 3
Trados Translator‘s Workbench
Trados Translator‘s Workbench
TRADOS Translator‘s Workbench
Term einfügen
Trados Translator‘s Workbench
Konkordanzsuche
Trados Translator‘s Workbench
Trados Translator‘s Workbench
TransIt von StarTransIt von Star
• Translation Memory von Star basiert nicht auf einer Datenbank, sondern auf einem sogenannten Assoziativen Netzwerk
• Ermöglicht sehr schnellen Zugriff und Laufzeit auch bei großen Datenmengen
Transit von Star
Transit von StarAnlegen eines Projektes
Der Benutzer erhält Hilfestellung durch sogenannte Wizards
(Programm-Assistenten).
Transit von StarTransit-Editor (Version 3.0)
Fuzzy-Index
Fenster
Wörter-buch-
Fenster
Notiz- Fenster
Ziel-text-
Fenster
TransIt von StarVersion 3
TransIt von StarVersion 3
Transit von Star
SDLX von SDLSDLX von SDL
• SDL – eines der grössten Lokalisierungsunternehmen in Groß Britannien
• SDLX – Weiterentwicklung von Amptran
• SDLX setzt sich aus einer Reihe von Einzelprogrammen zusammen
SDLX — Version 2.0
SDLXVersion 3.5
SDLX
SDLX
SDLX
SDLX
Übernahme der Übersetzung eines
Fuzzy-Matches
Übernahme eines 100%-Matches
Déjà Vu Interactive von AtrilDéjà Vu Interactive von Atril
• Déjà Vu vor allem bei freiberuflich tätigen Übersetzern verbreitet(Produktumfang, Anschaffungskosten)
• Umfasst eigenes Alignment-Werkzeug, Terminologie-Programm, Wörterbücher zur Rechtschreibprüfung und Dokumentenfilter
Déjà Vu InteractiveVersion 3.0.18
Déjà Vu Interactive
FuzzinessJe niedriger der Wert ist, desto weniger Entsprechungen werden angezeigt.Mit dem Schieberegler lässt sich ein Wert im Bereich von 0 (nur genau übereinstimmende Entsprechungen) bis 9 wählen.
Minimum number of words in a sentence Sätze mit weniger Wörtern werden in den Datenbanken von Déjà Vu nicht gespeichert. Mit dem Schieberegler kann ein Wert im Bereich von 1 bis 9 gewählt werden.
Déjà Vu Interactive
„Vorübersetzung“
IBM — TranslationManager
• „Mutter“ aller TM-Systeme
• Von IBM zur Unterstützung der eigenen Lokalisierungs-bedürfnisse entwickelt
• Hat seine anfängliche Position als Marktführer verloren (langsame Entwicklung, wenig Marketing)
• Einziges Programm, das mit Alignment-Tool, erweiterbarem Wörterbuch und Filtern für die gängigsten Textverarbeitungs-programme ausgeliefert wird
• In mancher Hinsicht das einfachste Programm, allerdings ohne besonderes Interface (nicht sehr benutzerfreundlich)
IBM — TranslationManager Filter
• MS Word• WordPerfect• Ami Pro• HTML• RTF• Ventura Publisher• Interleaf• FrameBuilder• BookMaster• IPF (Information Presentation Facility)
• ASCII
AlleFormat-
Informationen bleiben während
der Übersetzung erhalten, so dass Original und
Übersetzung dasgleiche Layout
haben.
IBM — TranslationManagerVersion 2.6.1
Übersetzungsvorschlägeaus dem TM
IBM — TranslationManager
Aktives Segment
copy & paste
IBM — TranslationManager
Übernahme eines Eintrags aus dem Wörterbuch mit
Ctrl + a
IBM Translation Manager
Nachschlagen im TM
IBM Translation ManagerGlobale Änderungen im TM
Vergleich derRetrievalleistung
ReferenzsatzThis chapter is an introductionto X11 operations.
Testsatz TWB TransIt SDLX DejaVu TManager
1
1
5
5
7
7
This chapter is a brief introductionto X11 operations.
Chapter 2 of this manual is anintroduction to X11 operations.
See the introductionto X11 operations.
X11 operations are introduced inthis chapter.
Chapter 2 is an introductionto X11 operations.
X11 is introduced inthis chapter.
81 %
86 %
70 %
76 %
86 %
68 %
74 %
81 %
59 %
53 % 44 % 48 %
< 30 % 52 % 23 %
< 30 % 44 % 23 %
Eigene Forschungenzum Retrieval in TMs
• Anreicherung des Referenzmaterials mit linguistischem Wissen durch Shallow Parsing.
• XML-basierter Ansatz zum linguistischen Retrieval im Translation-Memory.
• Berücksichtigung struktureller (Textebene) und syntaktischer Eigenschaften (Satzebene) von Texten.
• Retrievalergebnisse intuitiv plausibler.
EntscheidungshilfenEntscheidungshilfenfür den Einsatz konkreter Systemefür den Einsatz konkreter Systeme
Parameter zur Auswahl einesTM-Systems (I)
„Whenever I want to buy a pair of shoes I try them on and consider whether I feel comfortable wearing them, and whether they fit my needs. I will buy different shoes for different purposes: playing professional football, walking, or staying at home. I draw the possible scenario for using my future shoes and I buy accordingly.“
[Celia Ross in: Language International 12/2000,36]
Parameter zur Auswahl einesTM-Systems (II)
EAGLES-Arbeitsgruppe "Assessment and evaluation“• ISO-Norm 9126• Adäquatheits-Evaluation
– Benutzerprofil– Aufgabenbereich– Leistungsmerkmale des TM-Systems
• Prüf-/Qualitätskriterien:– Funktionalität (functionality)– Zuverlässigkeit (reliability)– Brauchbarkeit (usability)– Leistungsfähigkeit (efficiency)– Wartbarkeit (maintainability)– Portierbarkeit (portability)
Parameter zur Auswahl einesTM-Systems (III)
• Übersetzungsvolumen• Textsorten • Textsorten-Eigenschaften hinsichtlich
– Idiomatizität– Terminologie
• Erfordernis von Konsistenz zwischen den Übersetzungen• Dateiformate• Sprachen bzw. Sprachpaare• Benutzung anderer Übersetzungshilfen und
Notwendigkeit, diese in das TM zu integrieren• Einsatz in einem Team oder als Einzelarbeitsplatz• Wiederverwendbarkeit von TM-Material in anderen
Umgebungen• Umfang der verfügbaren Zeit zum Erlernen eines neuen
Werkzeugs
Parameter zur Auswahl eines TM-Systems Anschaffungskosten
• Trados Translator‘s Workbenchhttp://www.Trados.com/US$/EUR 595 zzgl. Versandkoten und MWSt
• TranIt von Starhttp://www.star-ag.ch/Transit und TermStar Smart 3.0: EUR 695
• DéjàVu von Atrilhttp://www.atril.com/EUR 841,50 zzgl. MwSt
• SDLX von SDLhttp://www.sdlintl.com/products/sdlx/nav/main.htmUS$ 50
• IBM Translation Managerhttp://www-4.ibm.com/software/ad/translat/tm/
Resümee
Jedes der vorgestellten Translation-Memory-Systeme erfordert eine Einarbeitung, um sie effizienzsteigernd einzusetzen.
Terminologie-Verwaltungssysteme bieten nennenswerte Erleichterung bei der Erstellung und Pflege von Terminologie.
Sowohl Terminologie-Verwaltungssysteme als auch Transaltion-Memory-Systeme tragen zur Konsistenz der Übersetzungen bei.
Für effiziente Auftragsbearbeitung gibt es bei großen Textmengen mit hohem Anteil an Wiederholungen zu TMs keine Alternative.
Vielen Dank für Ihre Aufmerksamkeit!
Uta Seewald-Heeg [email protected]