Oksana Mikitisin: Warum Pre-Editing bei maschineller Übersetzung unerlässlich ist

Künstliche Intelligenz
Seit selbstlernende, künstliche neuronale Netze eingesetzt werden können, hat die maschinelle Übersetzung große Fortschritte erzielt. - Bild: fotomek / Fotolia
Oksana Mikitisin
Oksana Mikitisin – Bild: Transline

Das Übersetzen von Texten mithilfe künstlicher Intelligenz hält zunehmend Einzug in den Alltag der Übersetzungsbranche. Kein Wunder, verspricht die maschinelle Übersetzung doch Zeitgewinn und gesteigerte Effizienz. Diese Vorteile stellen sich allerdings nur ein, wenn man mit Ausgangstexten arbeitet, die dafür geeignet sind.

Wie man Texte optimal für eine effiziente maschinelle Übersetzung vorbereitet und welche Stolpersteine dabei auszuräumen sind, darüber informiert Oksana Mikitisin von der Transline Deutschland GmbH auf der tekom-Jahrestagung in Stuttgart.

Pre-Editing: Texte müssen für maschinelle Übersetzung vorbereitet werden

Eine gute Arbeitsvorbereitung ist entscheidend für das Resultat. Denn obwohl die sogenannte neuronale maschinelle Übersetzung immer besser wird, stößt die künstliche Intelligenz schnell an ihre Grenzen, wenn der Ausgangstext nicht auf ihre Eigenheiten und Anforderungen zugeschnitten ist. In einem praxisnahen Tutorial erklärt Mikitisin, Spezialistin für maschinelle Übersetzung bei Transline, worauf es beim „Pre-Editing“ ankommt. Anhand konkreter Beispiele zeigt sie auf, wie unzulänglich editierte Texte zu fehlerhaften Übersetzungen durch die Maschine führen können.

So wirken sich etwa Rechtschreib- oder Grammatikfehler beim Einsatz maschineller Übersetzungssysteme unmittelbar auf das Endprodukt aus. Den falsch geschriebenen Begriff „Farbtemperatureinsatellung“ beispielsweise interpretiert ein von Mikitisin getestetes Programm mit „Colour temperature satellite“. Die Maschine ist nicht in der Lage, das „a“ in „einsatellung“ als Schreibfehler zu erkennen. „Basis für einen qualitativ guten Output ist daher eine gründliche Rechtschreibprüfung“, so die Expertin.

Abkürzungen als Stolperfalle

Auch Abkürzungen erweisen sich immer wieder als Stolperfallen für den Computer. Im besten Fall erkennt das Programm gängige Abkürzungen und überträgt sie korrekt in die andere Sprache – oder es übernimmt sie 1:1 aus dem Ausgangstext. Doch selbst beim aktuellen Beispiel DSGVO, dem deutschen Kürzel für die Europäische Datenschutzgrundverordnung, die im Englischen mit GDPR (General Data Protection Regulation) abgekürzt wird, bietet die von Oksana Mikitisin getestete Engine die korrekte englische Abkürzung nicht an.

Wie ernst der Computer seine Aufgabe nimmt, wird deutlich, wenn man Eigennamen nicht ausdrücklich von der Übersetzung ausklammert. Aus der Anschrift „Große Bahnstraße“ wird so unversehens „Great railroad“.

Besser kurze Sätze und keine komplexen Partizipialkonstruktionen

Schwierigkeiten haben Übersetzungsmaschinen generell mit langen, verschachtelten Sätzen. Sind komplexe Satzgebilde schon in der Ausgangssprache gelegentlich eine Zumutung für den Leser, so ist der Computer damit schlicht überfordert. Und wenn er die Zusammenhänge nicht erkennt, liefert er unter Umständen einfach falsche Aussagen – mitunter eingekeilt in ein Satzungetüm, das die Arbeit des Post-Editors unnötig erschwert. Der Rat von Oksana Mikitisin lautet deshalb: „Arbeiten Sie mit kurzen Sätzen und vermeiden Sie komplexe Partizipialkonstruktionen, dann verbessert sich der Output erheblich.“

Mission impossible: Mehrdeutigkeiten erkennen

Besonders bei mehrdeutigen Begriffen zeigt sich, dass eine Übersetzungsmaschine in der Regel unfähig ist, Bedeutungen aus dem Kontext zu erschließen. „Eine Holzschraube kann zum Beispiel eine Schraube für Holz oder eine Schraube aus Holz sein, die Messung kann den Vorgang oder das Ergebnis bezeichnen.“ Was gemeint ist, wird nur aus dem Kontext ersichtlich.

Gibt man der Maschine beispielsweise den Satz „Dieser Bereich wird zur Verhütung von Straftaten durch die Polizei videoüberwacht“, dann kann es sein, dass die maschinell erstellte englische Version lautet: „This area is video-monitored to prevent criminal offences by the police.“ Was sich schon im Ausgangstext nur durch Mitdenken beziehungsweise aus dem Zusammenhang erschließt, nämlich dass die Polizei überwacht und nicht etwa potenziell Straftaten begeht – der Maschine fehlt dafür jegliches Verständnis.

Oft sind es Passivkonstruktionen und substantivierte Verben, die solche Missverständnisse provozieren. So bringt etwa ein Ausgangssatz wie „Die Polizei überwacht diesen Bereich per Video, um Straftaten zu verhindern“ sicher bessere Ergebnisse.

Solche und viele Beispiele mehr, angereichert mit Handlungsempfehlungen, machen das tekom-Tutorial von Oksana Mikitisin zu einer Veranstaltung für Praktiker, deren Besuch sich lohnt. Denn, so die Expertin: „Die Maschine liefert nur gute Übersetzungsergebnisse, wenn sie gut aufbereitetes Textmaterial bekommt. Nur dann hält sich der Aufwand für den Post-Editor in vertretbaren Grenzen, und die erhofften Kosten- und Zeitvorteile lassen sich tatsächlich erzielen.“

Für die maschinelle Übersetzung hat man bei Transline spezielle Prozesse geschaffen, um Aufwand und Kosten zu verringern und möglichst gute Ergebnisse zu generieren. Unternehmen, die mit Maschinenübersetzung arbeiten wollen, werden zuvor eingehend beraten.

Tutorial auf tekom-Jahrestagung

  • Oksana Mikitisin, Transline Deutschland GmbH:
    „Optimieren Sie Ihre Texte für maschinelle Übersetzungssysteme“
    Tutorial für Praktiker
    Donnerstag, 15. November 2018, 08:45 bis 10:30 Uhr, Raum C7.2

Transline auf tekom-Messe mit eigenem Stand vertreten

Die Transline-Gruppe ist auf der tekom-Jahrestagung mit einem eigenen Stand vertreten. Interessierte Besucher können sich hier an den drei Messetagen zu allen Themen rund um Übersetzungen fachkundig beraten lassen. Mit dabei ist das Transline-Unternehmen Wordflow, das auf Übersetzungsdienstleistungen rund um SAP spezialisiert ist. Topthemen in diesem Jahr sind SAP, Machine Translation und Post-Editing.

Am zweiten Messetag, Mittwoch 14. November, können Gäste bei Transline (Stand 2/C08) ab 16:00 Uhr den Tag bei einem Feierabendbier ausklingen lassen. Wer kein Bier mag, für den sind Most oder auch nicht-alkoholische Getränke im Angebot.

Mehr zum Thema auf UEPO.de

[Text: Transline.]

Leipziger Buchmesse 2024