Funktionsprinzip von Translation-Memory-Systemen
Translation-Memory-Systeme (TMS) wurden bereits Anfang der 1980er Jahre entwickelt und gehören heute zum Standardwerkzeug der Übersetzungsbranche. Das Grundprinzip ist einfach: Das System importiert die Texte und zerlegt sie dabei in Segmente. Ein Segment entspricht in der Regel einem Satz. Der Übersetzer übersetzt den Text Satz für Satz und das System speichert zweisprachige Satzpaare.
Sobald das System eine Wiederholung innerhalb des Dokuments oder in einem bereits übersetzten Satz aus dem Übersetzungsspeicher („Translation Memory“) erkennt, schlägt es diese dem Übersetzer vor.
Das funktioniert auch bei fast identischen Sätzen, bspw. bei Sätzen, die sich nur in einem Wort voneinander unterscheiden. In diesem Fall spricht man von „Fuzzy Match“.
Das System hebt den Unterschied hervor, und der Übersetzer kann die Übersetzung entsprechend anpassen. TMS eignen sich daher sehr gut für die Übersetzung von Dokumenten, die regelmäßig aktualisiert werden.
Die Großen …
Es gibt eine Handvoll bekannter TMS wie SDL Trados Studio, Transit NXT, MemoQ oder Across, welche eine Vielzahl von Funktionen und Filter besitzen. Sie leisten sehr viel, kosten dementsprechend mehr und werden von der Mehrheit professioneller Übersetzer und Unternehmen eingesetzt.
… und die Kleinen
Doch neben diesen „Großen“ gibt es seit Jahrzehnten viele kleinere Systeme, die durchaus ausgereift und ebenso leistungsfähig sind. Viele wurden ursprünglich von Übersetzern mit einem Hang zum Programmieren entwickelt. Sie besitzen viele Filter und Funktionen, die manchmal sogar in größeren Systemen fehlen. Einige dieser Systeme heißen Wordfast, MetaTexis, Heartsome Translation Studio oder OmegaT.
OmegaT läuft auf Windows-, Apple- und Linux-Betriebssystemen
Wir möchten hier OmegaT vorstellen, ein in Java geschriebenes kostenloses TMS, das sowohl auf Microsoft als auch auf Macintosh OS X und Linux läuft.
Alle wichtigen Komponenten sind vorhanden
OmegaT enthält zunächst alle wichtigen Komponenten eines TMS:
- Einen Editor für die Eingabe der Übersetzung
- Ein Fenster für die Anzeige von Treffern aus dem Translation Memory
- Ein Fenster für die Anzeige von übereinstimmenden Einträgen aus dem Wörterbuch
OmegaT kann Dateien unterschiedlicher Formate importieren, von denen sogar das eine oder andere bei den „großen“ TMS-Anbietern fehlt. Neben den Standardformaten wie Microsoft Office findet man unter anderem:
- TYPO3-LocManager-Dateien
- LaTeX-Dateien
- XLIFF-Dateien
- XHTML-Dateien
- DocBook-Dateien
Es fehlen einige Import-Filter
Es fehlen Filter zu Standard-DTP-Systemen wie InDesign oder FrameMaker. Der XLIFF-Filter unterstützt reines XLIFF, kann also „Dialekte“ wie SDL Studio SDLXLIFF nicht importieren.
Arbeitsweise
OmegaT arbeitet wie die meisten anderen TMS mit Projekten. Der Anwender legt sein Projekt an und konfiguriert es. In ein Projekt lassen sich mehrere Dokumente importieren und übersetzen. Dabei werden die einzelnen Dateien der Reihe nach übersetzt.
Nach dem Import kann der Übersetzer eine Statistik sehen, in der die Anzahl der Segmente, der Wörter und der Zeichen nach den traditionellen Kategorien (Wiederholungen, Treffer, Fuzzy Matches) aufgegliedert ist.
Der Übersetzer übersetzt den Text Satz für Satz. OmegaT hebt das aktive Segment grün hervor und kopiert optional den Ausgangstext gleich darunter. Der Übersetzer überschreibt den kopierten Satz, der mit einem Tag wie <Segment 0001> endet. Sobald ein Satz übersetzt ist, drückt der Übersetzer die ENTER-Taste und seine Übersetzung landet im Übersetzungsspeicher. Wenn das Projekt weitere identische Segmente enthält, übersetzt es sie im Hintergrund automatisch.
OmegaT bietet die Möglichkeit, auf Wunsch mehrere Übersetzungsalternativen zu speichern, was in manchen Situationen (z. B. Übersetzung von Softwareoberflächen oder kontextabhängige Übersetzungen) erforderlich sein kann.
Treffer aus dem Translation Memory erscheinen im TM-Fenster. Bei Fuzzy Matches werden die Unterschiede standardmäßig blau hervorgehoben. Den gewünschten Treffer kann der Übersetzer per Tastenkombination übernehmen.
Terminologiefunktion mit Manko
Für das aktive Segment zeigt OmegaT auch Treffer aus dem Glossar. Somit weiß der Übersetzer, welche Terminologie er einsetzen muss. Die Terminologiefunktion verfügt jedoch über keine linguistische Intelligenz und erkennt Flexionen nicht. Das ist ein deutliches Manko.
Externe Plug-ins
Über externe Plug-ins wie das Tokenizer-Plugin kann man dies aber beheben. Mit der Suchfunktion kann der Übersetzer im Ausgangsdokument, in der Übersetzung, in Notizen oder im Translation Memory suchen. Dabei kann er reguläre Ausdrücke verwenden. Die fertige Übersetzung erzeugt er über die Exportfunktion.
TMX-Standard als Translation-Memory-Format
Als Translation-Memory-Format verwendet OmegaT den TMX-Standard, d. h. es kann TMs aus anderen Systemen importieren. OmegaT speichert die TMX-Datei in mehreren Formaten, nämlich in einer neutralen Version und in einer mit eigenen Tags angereicherten Version.
Einbindung maschineller Übersetzungssysteme
Wie bei allen gängigen TMS ist es bei OmegaT auch möglich, maschinelle Übersetzungssysteme wie Google Translate v2 oder Microsoft Translator einzubinden.
Fazit: Trotz Mankos sinnvolle Alternative
Natürlich fehlen bei einem einfachen Programm wie OmegaT manche Funktionen, die die großen Systeme anbieten. So kann man Segmente nicht zusammenfassen oder trennen. Das Setzen des Segmentstatus ist nicht möglich. Auch das Filtern der Segmente im Editor nach bestimmten Kriterien funktioniert nicht.
Nichtsdestotrotz bieten Werkzeuge wie OmegaT eine sinnvolle Alternative zu den „großen“ Tools. Unternehmen, die ein geringes Budget haben und nur gelegentlich übersetzen bzw. Übersetzungsstatistiken haben möchten, können es einsetzen. Oder Übersetzer, die sich aus Kostengründen die größeren TMS nicht leisten können bzw. lieber auf einem Mac-Computer arbeiten möchten.
[Text: D.O.G. Dokumentation ohne Grenzen GmbH. Quelle: D.O.G. News 1/2014. Wiedergabe mit freundlicher Genehmigung von Dr. François Massion. Bild: OmegaT.]