Neue Technologien zur Unterstützung beim Post-Editing – Forschungsprojekt MMPE abgeschlossen

MMPE-Arbeitsplatz — Erweiterte Interaktionsmodalitäten beim Editieren wie das Durchstreichen oder handschriftliche Ergänzen per Stift oder Sprachbefehle unterstützen die Übersetzer beim Post-Editing. – Bild: DFKI

Die Qualität maschineller Übersetzung hat sich in den letzten Jahren deutlich verbessert. Übersetzer verlagern ihre Tätigkeit immer öfter zum Post-Editing maschineller Übersetzungen. Das spart Zeit, reduziert Fehler, verändert aber die Art der Interaktion mit dem Text.

Wie Post-Editing technologisch unterstützt werden kann, untersuchte ein interdisziplinäres Forscherteam des DFKI im Projekt MMPE (Multi-modal and Language Technology based Post-Editing Support for Machine Translation). MMPE unter der Leitung von Prof. Dr. Antonio Krüger und Prof. Dr. Josef van Genabith wurde von der Deutschen Forschungsgemeinschaft (DFG) über einen Zeitraum von dreieinhalb Jahren gefördert und endete am 31.12.2020.

Post-Editing verschiebt Fokus von Übersetzungsarbeiten

Post-Editing (PE) kombiniert die Vorteile von Künstlicher Intelligenz und menschlicher Intelligenz, verschiebt aber auch den Fokus von Übersetzungsarbeiten: Anstatt Text zu erzeugen, korrigieren Übersetzer Fehler in ansonsten hilfreichen Vorschlägen in der Zielsprache. Häufig wiederkehrende Fehler der maschinellen Übersetzung (MÜ) zu verbessern ist ermüdend, schwer zu findende oder komplexe Fehler zu beheben, macht die Tätigkeit kognitiv anspruchsvoll.

„Während die KI gut darin ist, schnell Übersetzungsentwürfe vorzuschlagen, kann nur ein Mensch mit fundierten Kenntnissen der Ausgangs- und Zielsprache lexikalische und semantische Nuancen analysieren und sicherstellen, dass die Bedeutung der Übersetzung identisch ist“, umreißt Projektleiter Prof. Dr. Josef van Genabith die Vorteile.

Übersetzungsumgebung mit multimodalen Eingaben entwickelt

Die Wissenschaftler aus den Forschungsbereichen Kognitive Assistenzsysteme unter der Leitung von Prof. Dr. Antonio Krüger sowie Sprachtechnologie und Multilingualität unter der Leitung von Prof. Josef van Genabith haben untersucht, wie Übersetzungsumgebungen multimodale Eingaben unterstützen können und kognitive Aspekte des Post-Editing berücksichtigt werden können. Außerdem befassten sie sich mit der Frage, wie Automatisches Post-Editing hilft, immer wiederkehrende Fehler zu vermeiden.

Das Team erstellte eine Übersetzungsumgebung in einem benutzerzentrierten Designprozess. Die Umgebung ermöglicht es, Text durchzustreichen oder handschriftlich zu ergänzen, Wörter per Drag & Drop neu zu ordnen oder Sprachbefehle zur Editierung zu verwenden.

Eine Evaluierung mit professionellen Übersetzerinnen zeigt, dass diese Interaktionsmodalitäten gute Erweiterungen zu Maus und Tastatur sind, wobei sich Stift- und Touch-Eingabe für Lösch- und Neuordnungsaufgaben als geeignet erwiesen, während Sprachbefehle und multimodale Kombinationen von Auswählen und Sprechen gut für Ersetzungen und Einfügungen funktionieren.

Post-Editing verändert kognitive Dimension des Übersetzens

Post-Editing verändert aber auch die kognitive Dimension des Übersetzens. Es erfordert nicht nur ein Gespür für den Satz in der Originalsprache, sondern auch für die fehleranfällige Ausgabe der maschinellen Übersetzung, den umgebenden Kontext sowie die Leserschaft und deren kulturellen Hintergrund. Robuste Ansätze zur automatischen Abschätzung dieser veränderten kognitiven Belastung (Cognitive Load, CL) beim Post-Editing ermöglichen ein besseres Verständnis dafür, ob und wann maschinelles Übersetzen den Arbeitsprozess eher unterstützt oder behindert.

Übersetzungsumgebung an die kognitive Belastung anpassen

Das Projektteam hat daher ein Sensor-Framework entwickelt, das eine breite Palette physiologischer und verhaltensbezogener Daten verwendet, um die wahrgenommene kognitive Belastung abzuschätzen, und hat es in mehreren Studien getestet. Dabei konnte gezeigt werden, dass multimodale Messungen von Augen-, Herz- und Haut-basierten Daten verwendet werden können, um die Übersetzungsumgebungen an die kognitive Belastung anzupassen.

Prof. Dr. Josef van Genabith – Bild: DFKI

Deep-Learning-Architekturen für automatisches Post-Editing (APE)

Bei der maschinellen Übersetzung treten nicht nur tatsächliche Fehler auf, die MÜ trifft mitunter auch immer wieder dieselben lexikalischen oder stilistischen Entscheidungen, mit denen der Übersetzer möglicherweise nicht einverstanden ist. Im gesamten Text sind dann ähnliche Modifikationen erforderlich.

Die Wissenschaftler haben daher verschiedene Deep-Learning-Architekturen für das automatische Post-Editing (APE) untersucht, die die Ausgabe jedes Black-Box-MÜ-Systems an eine bestimmte Domäne oder einen bestimmten Stil anpassen können. Anstatt übersetzen zu lernen, lernen APE-Systeme aus wiederkehrenden menschlichen Korrekturen und wenden sie auf Vorschläge der maschinellen Übersetzung für neue Texte an.

Die internationale Sichtbarkeit der in dem Projekt erzielten wissenschaftlichen Ergebnisse ist durch herausragende Publikationen, z. B. auf der Conference on Human Factors in Computing Systems (CHI), dem Annual Meeting of the Association for Computational Linguistics (ACL), der Conference on Computational Linguistics (COLING) oder im Machine Translation Journal dokumentiert.

Weiterführende Links

MMPE-Projektseite beim DFKI: mmpe.dfki.de
Das MMPE-Projekt ist jetzt als Open Source auf Github verfügbar.

DFKI Saarbrücken