Maschinelle Übersetzung: Reicht die Qualität inzwischen für einen Einsatz auf breiter Basis?

Noch kann man nicht mit gutem Gewissen behaupten, dass maschinelles Übersetzen (MÜ) die Mutter aller Lösungen ist, wenn es um professionelle Übersetzungen geht. Aber der MÜ-Geist ist aus der Flasche befreit und wird sich nicht mehr einfach zurücksperren lassen.

Unumstritten ist, dass MÜ in den letzten Jahren Fortschritte gemacht hat. Reichen aber die neuen MÜ-Verfahren bereits aus, um maschinelles Übersetzen, ergänzt um Post-Editing, als Standardverfahren für die Übersetzung technischer Dokumentationen zu etablieren?

Erst Wort für Wort, dann regelbasiert, dann mit statistischen Verfahren, dann alles zusammen

Die ersten maschinellen Übersetzungssysteme aus den 1950er Jahren arbeiteten Wort für Wort. Später wurden sie regelbasiert. Computerlinguisten versuchten, die Modelle der jeweiligen Sprachen so abzubilden, dass die Rechner sie verstehen und sozusagen zueinander „konvertieren“ konnten. Die anfänglichen Ergebnisse waren für den täglichen Einsatz allerdings nicht ausreichend, sodass Jahrzehnte der Zurückhaltung folgten.

Dank besserer Übersetzungsergebnisse konnten wir seit Anfang des Jahrhunderts eine Wiederbelebung des maschinellen Übersetzens beobachten. Zum einen haben regelbasierte Systeme ihre Regeln und Wörterbücher optimiert. Zum anderen haben statistische MÜ-Systeme teils mit EU-Unterstützung kontinuierlich Fortschritte gemacht.

Ein wachsender Bestand an trainierten Daten und das tägliche Mitwirken einer „Crowd“ bei öffentlichen Systemen (wie Google), tragen ihr Übriges zur Akzeptanz von MÜ bei.

Statistische Systeme arbeiten daran, Elemente „linguistischer Intelligenz“ (Morphologie, Syntax und Semantik) zu berücksichtigen, um besser zu werden, während regelbasierte Systeme statistische Algorithmen einbinden.

Open-Source-Lösung Moses und Microsoft Translator Hub

Mehrere der am Markt vertretenen MÜ-Systeme basieren auf der Open-Source-Technologie von Moses. „Out-of-the-box“ ist Moses lediglich ein untrainiertes System, das nur IT-Spezialisten installieren können und das mithilfe von Linguisten und Programmierern trainiert werden kann. Das Training ist komplex und anspruchsvoll.

Weitere Systeme wie der Microsoft Translator Hub verwenden eine eigene Technologie und Algorithmen auf der Basis statistischer und linguistischer Verfahren.

Wie bei Moses nutzt eine Mehrheit der am Markt verfügbaren MÜ-Systeme statistische Modelle gepaart mit Regeln für die Auswahl des richtigen Übersetzungsvorschlags. Sie zerlegen Texte in Sätze und diese Sätze in Wortgruppen und Wörter. Eine Art Entscheidungsbaum bewertet die Güte der verschiedenen Kombinationen aus Wörtern und Wortgruppen.

Ergebnis hängt von Umfang und Qualität der statistischen Daten ab

Die Qualität der Ergebnisse hängt vom Umfang und von der Qualität der abgespeicherten statistischen Daten ab. Stil und Fachterminologie aus den Trainingsdaten sollen möglichst eng mit den zu übersetzenden Texten übereinstimmen.

Ein weiterer Faktor ist die technische, sprachliche und linguistische Beschaffenheit der zu übersetzenden Texte. Manche Fachgebiete haben eine komplexe und umfangreiche Terminologie, manche Sprachen wie z. B. Russisch haben eine anspruchsvolle Morphologie und Syntax.

Das folgende Zufallsbeispiel mit einem einmalig trainierten statistischen MÜ-System vermittelt einen ersten Eindruck der potenziellen Fehler von MÜ-Systemen:

Deutsch
Wenn Sie Workflows definiert haben, können Sie sie nun starten. Die vorgesehenen Bearbeiter werden in der Reihenfolge der einzelnen Aufgaben gefragt und haben die Möglichkeit, die Aufgabe anzunehmen oder abzulehnen. Sobald eine Aufgabe abgeschlossen ist, ändert sich ihr Status, und der Bearbeiter der nächsten Aufgabe wird automatisch angefragt. Der Terminologiemanager hat jederzeit den Überblick über den Status seines bzw. seiner aktiven Workflows.

Englisch (maschinell übersetzt)
If you have defined workflow, you can now start it. The scheduled editor will be prompted in the order of the individual item and have the possibility to add the item or to accept. As soon as an item is completed, their status changes, and the next item editor is asked automatically. The terminology Manager has at any time an overview of the status of or its active workflow.

Typische Fehler maschineller Übersetzungssysteme

Der Platz fehlt hier für eine ausführliche Topologie der potenziellen Fehler durch MÜ. Statistische MÜ-Systeme machen zum Teil andere Fehler als regelbasierte MÜ-Systeme, die weniger oft Wörter auslassen bzw. hinzufügen und (auch in ihren Fehlern) konsistent sind. Einige wichtige Fehlertypen, von denen mehrere Sinnfehler sind, lassen sich wie folgt zusammenstellen:

Falsche Termini. Das ist durch eine Erweiterung der Trainingsdaten meist lösbar.
Falsche Übersetzung allgemeinsprachlicher Wörter.
Missverständnis der Satzstruktur.
Grammatikalische Fehler, fehlende bzw. hinzugefügte Wörter. Einige Fehler haben damit zu tun, dass statistische MÜ-Systeme Satzsegmente aneinanderreihen.
Wörtliche Übersetzungen.

Typischer Ablauf eine MÜ-Projekts

Ein typisches MÜ-Projekt läuft wie folgt ab:

Erstes Training des Systems mit Satzpaaren bzw. mit einsprachigen Texten. Microsoft empfiehlt bspw. eine Mindestmenge von 10.000 Sätzen.
Auswertung der ersten Übersetzungsergebnisse und Optimierung der Regeln. Dies kann bei Bedarf einige Male iterativ erfolgen.
Produktiver Einsatz des Systems und regelmäßige Pflege der Bestände und Regeln.

Für das Trainieren des Systems werden automatisch übersetzte Texte mit einer durch Fachübersetzer erstellten Version verglichen. Für die regelmäßige Verfolgung der Qualität von maschinellen Übersetzungssystemen wurden Metriken entwickelt wie das verbreitete BLEU.

PEMT – Post-Editing of Machine Translation

In den letzten Jahren konnte man beobachten, dass Übersetzer in verschiedenen Foren und Plattformen für sogenannte PEMT-Aufträge gesucht werden. PEMT steht für Post-Editing of Machine Translation.

Grenzen der Wirtschaftlichkeit

Es gibt Grenzen bei der Wirtschaftlichkeit von PEMT. Man kann allgemein davon ausgehen, dass, wenn mehr als 20 % von der Übersetzung korrigiert wird, es wirtschaftlicher ist, den Text direkt mithilfe von Translation-Memory-Systemen (TMS) zu übersetzen.

Es ist bei PEMT-Aufträgen wichtig, genau festzulegen, was und wie korrigiert werden soll. Da die posteditierten Texte aufgrund von Wirtschaftlichkeitsüberlegungen nur eingeschränkt optimiert werden, erreichen sie in der Regel die sprachliche und stilistische Qualität von Humanübersetzungen nicht. Sie sind für Dokumente mit höheren Qualitätsansprüchen nicht geeignet.

TAUS-Empfehlungen zur Produktion brauchbarer Übersetzungen

Auf der TAUS-Webseite stehen Empfehlungen für die Produktion von Übersetzungen, die „gut genug“ sind: „‚Gut genug‘ bedeutet verständlich (…), genau (…). Der Text klingt, als ob er von einem Computer generiert wurde, die Syntax ist möglicherweise etwas ungewöhnlich, die Grammatik mag nicht perfekt sein, aber die Botschaft ist korrekt.“

Wären die finanziellen Vorteile von MÜ so eindeutig, würden heute fast alle professionellen Nutzer damit arbeiten. Noch fehlen aber die praxiserprobten Argumente trotz allen schönen Grafiken, die man bei Präsentationen kommerzieller Anbieter finden kann. Das liegt daran, dass die Bedingungen für einen wirtschaftlich interessanten Einsatz dieser Technologie auf einen zu kleinen Nutzerkreis zutreffen.

Kosten der maschinellen Übersetzung

Kosten entstehen für folgende Aufgaben bzw. Positionen:

Installation des Systems.
Einrichtung des Systems (Training, Aufbau der Trainingsdaten).
Pflege des Systems (Optimierung der Regeln, Erweiterung der Trainingsdaten).
Nacheditieren der Übersetzungen.

Für die Installation des Systems haben interessierte Unternehmen die Möglichkeit, es selbst zu tun oder webbasierte Plattformen und Dienstleister zu nutzen. Ein Großteil dieser Kosten entsteht getrennt für jedes Sprachpaar.

Translation-Memory-Systeme haben zur Kostensenkung beigetragen

Translation-Memory-Systeme (und übrigens auch Content-Management-Systeme auf der Autorenseite) haben bereits wesentlich zu einer Reduzierung der Übersetzungskosten beigetragen. Nur die Texte, die mithilfe von Translation-Memory-Systemen noch nicht effizient übersetzt werden können, sind beim Kosten- / Nutzen-Vergleich in die Waagschale zu legen.

Natürlich geht es bei der Einführung von MÜ nicht immer nur ums Geld. Andere Aspekte wie das zeitnahe Produzieren von Übersetzungen (z. B. als Unterstützung des technischen Supports) sind ebenfalls Entscheidungsfaktoren.

Es ist schwierig, finanziell ein Szenario darzustellen, das allgemeingültig ist. Um beispielsweise laufende jährliche MÜ-Kosten in einer Sprachkombination in Höhe von 10.000 Euro wettzumachen, müsste man bei einem Kostenvorteil von 0,05 Euro pro Wort im Jahr 1.000 Seiten außerhalb des üblichen Verfahrens mit Translation-Memorys maschinell übersetzen.

Was oft verschwiegen wird oder unbekannt ist: Die Qualität wäre auch nicht ganz identisch mit der humaner Übersetzer, da man aus Effizienzgründen bei PEMT Abstriche macht (zum Beispiel im Hinblick auf den Satzbau, die Wortwahl und den Stil).

Zukunft der MÜ-Systeme ist offen

Wann MÜ-Systeme als selbständige Lösung auf breiter Basis in den Bereich der traditionellen technischen Übersetzungen Einzug finden, ist eine offene Frage.

Viel wichtiger für alle, die sich mit Kosten und Qualität von Übersetzungen befassen, ist die aktuelle Entwicklung. Bereits heute ist MÜ-Technologie in Translation-Memory-Systemen integriert und wird rege verwendet. Wenn der Übersetzer keine Übersetzung im Translation-Memory findet, erhält er Vorschläge von einem MÜ-System. Aus Kostengründen verwendet ein Teil dieser Übersetzer untrainierte Systeme, die deutlich mehr Fehler liefern.

Diese Entwicklung stellt viele etablierte Konzepte auf den Prüfstand. Man kann heute nicht mehr davon ausgehen, dass Übersetzungen aus Translation-Memorys ausschließlich durch Menschen produziert wurden. Wie will man mit zwar korrekten aber stilistisch und sprachlich nicht gerade gelungenen Übersetzungen umgehen? Wie will man bei scheinbar richtigen Sätzen Sinnfehler aufspüren und vermeiden, dass sie sich über TMS fortpflanzen?

Das sind einige der aktuellen Fragen, die in den nächsten Jahren stärker an Bedeutung gewinnen werden. Dienstleister, die ein solides Qualitätssicherungsverfahren haben und nach dem Vier-Augen-Prinzip arbeiten, bieten für Auftraggeber eine größere Sicherheit.

Weiterführende Links

Moses: www.statmt.org/moses

[Text: D.O.G. GmbH. Quelle: D.O.G. news 2/2015. Wiedergabe mit freundlicher Genehmigung von Dr. François Massion.]