Alignment: Altübersetzungen sinnvoll wiederverwerten

Beispiel für eine problematische Zuordnung beim Alignment

Bei manchem Übersetzungsprojekt ist bereits ein Großteil der benötigten Übersetzung vorhanden. Sie liegt als Referenzmaterial vor, aber nicht in einer von Translation-Memory-Systemen verwertbaren Form (z. B. als PDF-Datei). Optimal ist das natürlich nicht. Zum einen entstehen noch einmal Kosten für dieselbe Übersetzung. Zum anderen wird wohl kein Übersetzer bei jedem einzelnen Satz in zwei Referenzdokumenten (Original und Übersetzung) nachschlagen, was darin steht. So ist es nicht verwunderlich, dass bereits übersetzte Sätze oder Termini im neuen Übersetzungsprojekt auf einmal ganz anders lauten.

Für solche Fälle kann das sogenannte Alignment Abhilfe schaffen. Was passiert beim Alignment? Theoretisch erfolgt dieser Prozess in drei Etappen. Zuerst liest ein Alignment-Programm oder ein Alignment-Modul von Translation-Memory-Systemen (TMS) jeweils den Originaltext und seine Übersetzung ein. Es zerlegt dabei diese in einzelne Segmente. Ein Segment ist eine (konfigurierbare) Übersetzungseinheit, meistens ein Satz. In einem zweiten Schritt ordnet es die Segmente den jeweiligen Sprachen mit Hilfe interner Algorithmen zu. In einem dritten Schritt prüft ein sprachkundiger Lektor, ob die Satzpaare korrekt zueinander passen.

Viele stellen sich das Alignment als eine problemlose Angelegenheit vor: Es gibt einen Text in Deutsch mit 100 Sätzen und eine Übersetzung mit 100 Sätzen. Das Programm verknüpft also die Sätze automatisch der Reihe nach und „das war’s“! In der Praxis laufen die Uhren aber anders. Bei fast jedem Projekt entstehen Alignment-Fehler, die unterschiedliche Ursachen haben können. Das Ergebnis sind dann Segmentpaare, die inhaltlich nicht zueinander passen und bei einer automatischen Wiederverwendung schwere Fehler verursachen können.

Warum passiert so etwas? Im Wesentlichen findet man folgende Situationen:

Der Text wurde nicht übersetzungsgerecht geschrieben. Ein deutscher Satz wurde beispielsweise durch Auflistungspunkte getrennt (die Absatzmarken sind ein wesentliches Segmentierungskriterium für die Übersetzungsprogramme). Im Gegensatz zu vielen Sprachen steht im Deutschen das Verb oft am Ende des Satzes. Dem Verb wird dann entweder nichts oder ein komplett anderer Ausdruck zugewiesen.

Weitere Ursache für Alignment-Fehler: Der Text ist falsch segmentiert. Die wichtigsten Abkürzungen sind in einer Standardkonfiguration hinterlegt. Damit wissen die gängigsten Alignment-Tools, dass „usw.“ eine Abkürzung ist und dass nach dem Punkt + Leerzeichen der Satz weitergeht. Schwieriger ist es dann, wenn die Abkürzung tatsächlich am Satzende steht oder wenn weniger gebräuchliche Abkürzungen in einem Dokument vorkommen. Der betroffene Satz wird fälschlicherweise getrennt und die Zuordnung zur anderen Sprache verschiebt sich. Alignment- bzw. Zuordnungsfehler tauchen auch auf, wenn die Formatierung von Original- und Zieldokument sich unterscheidet. Eine Überschrift wird in einem Dokument als Überschriftsebene_2 formatiert, im anderen Dokument ist sie nur fett geschrieben.

Sprachliche Faktoren spielen ebenfalls eine Rolle. Der Übersetzer möchte den Stil des Originaltextes optimieren und macht aus einem langen deutschen Satz zwei kürzere englische Sätze. Bei anderen Texten nimmt sich der Übersetzer mehr Freiheit und lässt sogar komplette Sätze aus. Auch können infolge unterschiedlicher Versionen des Dokumentinhaltes komplette Absätze fehlen und dadurch das Alignment durcheinanderbringen.

Bevor Lektoren das Alignment überarbeiten, lohnt es sich, vorerst ein Grobalignment zu erstellen. Damit kann man erkennen, auf welche Faktoren falsche Zuordnungen zurückzuführen sind. Manchmal genügen neue Einstellungen am Programm wie beispielsweise das Hinzufügen von Abkürzungen in die Abkürzungsliste, die Änderung von Formaterkennungsoptionen oder der Import einer zweisprachigen Wortliste zur Optimierung der Zuordnung der Sätze in beiden Sprachen. Auch kann eine Nachformatierung der Referenzdokumente (z. B. mit Formatvorlagen für Überschriften) die automatischen Alignment-Ergebnisse wesentlich verbessern.

Wenn das Alignment eher als Terminologiequelle dienen soll, lässt sich der Aufwand mit einer absatzweisen Segmentierung der Texte reduzieren. Größere Segmente reduzieren das Fehlerpotenzial.

Sollte das Alignment-Ergebnis schließlich vorliegen, ist die Reise noch nicht zu Ende. Es kommt in der Praxis durchaus vor, dass die sprachliche Qualität des Alignments zu wünschen übrig lässt. Der Übersetzer soll sich laut Anweisung an die Terminologie des Referenzmaterials halten. Aber was ist, wenn für ein Wort mehrere mögliche Übersetzungen zur Verfügung stehen, wie am Praxisbeispiel „spacer = Abstandshalter / Abstandhalter / Distanzstück“ ersichtlich? Ebenfalls kann es vorkommen, dass die Referenzübersetzung nicht professionell geprüft wurde und sich Zahlenfehler bzw. inhaltliche Fehler eingeschlichen haben. Dann hätte man mit viel Aufwand das Ganze verschlimmbessert.

Es empfiehlt sich also, erst nach einer Qualitätsprüfung das Alignment-Ergebnis freizugeben. Dabei hilft eine spezialisierte Qualitätssicherungssoftware wie ErrorSpy (auch online zugänglich). Eine weitere Sicherheitsmaßnahme besteht darin, die Ergebnisse aus einem Alignment-Prozess mit einem Attribut und entsprechenden Abzugspunkten in der Übersetzungsdatenbank zu versehen. Somit wäre ein Treffer mit einem Segment aus dem Alignment-Prozess für das Übersetzungssystem nicht mehr eine identische Übersetzung, sondern beispielsweise eine zu 95 Prozent ähnliche Übersetzung, die der Übersetzer nochmals ganz genau unter die Lupe nehmen soll, bevor er sie einsetzt.

Lohnt sich der Aufwand überhaupt? Das Alignment verursacht je nach technischer und sprachlicher Qualität des Materials Kosten, die zwischen 25 und 50 Prozent der Kosten einer Neuübersetzung liegen. Wenn entsprechend viel im Referenzmaterial enthalten ist, kann sich das Alignment im Vergleich zu einer Neuübersetzung oder zur manuellen Übernahme einzelner Passagen aus Altdokumenten lohnen. Umso interessanter ist es, wenn es sich dabei um Inhalte handelt, die in der Zukunft öfters wiederverwendet werden.

[Text: D.O.G. GmbH. Quelle: D.O.G. news 4/2011; Wiedergabe mit freundlicher Genehmigung von Dr. François Massion. Bild: D.O.G.]