Software zur Autorenunterstützung – So optimieren Sie die Qualität maschineller Übersetzungen

Teamwork am Computer
Software zur Autorenunterstützung erleichtert sowohl die Arbeit technischer Redakteure bei der Texterstellung als auch die von Übersetzern beim Pre- und Postediting von Texten, die für die maschinelle Übersetzung aufbereitet werden. - Bild: bnenin / Fotolia

Die maschinelle Übersetzung beschäftigt Sprachdienstleister und Redakteure gleichermaßen. Kein Wunder, denn DeepL & Co. liefern mittlerweile sehr beeindruckende Ergebnisse. Der gleichnamige Hersteller mit Sitz in Köln hat sich auf die Entwicklung von künstlicher Intelligenz für Sprachen spezialisiert.

Laut Pressemitteilung des Unternehmens läuft „DeepLs künstliche Intelligenz auf einem Supercomputer in Island, der 5.1 petaFLOPS (5.100.000.000.000.000 Operationen pro Sekunde) ausführen kann, genug Leistung, um eine Million Wörter in weniger als einer Sekunde zu übersetzen. Das DeepL-Team nutzt diesen Supercomputer, um neuronale Netze mit einer riesigen Sammlung mehrsprachiger Texte zu trainieren. Die Netzwerke schauen sich dabei sehr viele Übersetzungen an und lernen selbstständig, wie man grammatikalisch korrekt übersetzt und gute Formulierungen wählt.“

Garbage in, Garbage out

Die Qualität maschineller Übersetzungen hängt vor allem vom Quelltext ab. Je verständlicher er verfasst ist, desto hochwertiger fällt die Übersetzung aus. Sprachliche Unkorrektheiten, Mehrdeutigkeiten oder komplexe Satzkonstruktionen sind in jedem Fall zu vermeiden. Auch kleine Fehler, wie falsche Getrennt- oder Zusammenschreibung, können zu Fehlinterpretationen von Wörtern führen und damit das Übersetzungsergebnis maßgeblich verschlechtern. Unterschiedlich interpretierbare Sätze oder sogar Wörter werden im schlechtesten Fall falsch übersetzt. Lange Sätze mit vielen Verschachtelungen sind eine weitere Herausforderung für maschinelle Übersetzungs-Systeme (MÜ).

Software zur Autorenunterstützung verbessert Qualität der Ausgangstexte

Software zur Autorenunterstützung kann helfen, diese Fehler zu vermeiden. Sie schauen sozusagen dem Redakteur direkt beim Schreiben über die Schulter und weisen ihn auf mögliche missverständliche Formulierungen, Satzkonstruktionen usw. hin. Die Grundlage dafür bildet eine regelbasierte Sprachprüfung, die neben Grammatik und Rechtschreibung auch den Stil unter die Lupe nimmt.

Beispiele:

  • Ganze Sätze in Klammern vermeiden
  • Zu lange Komposita aufgliedern
  • Schrägstriche vermeiden
  • Bedingungssatz mit „wenn“ einleiten
  • Konstruktionen ohne Verb vermeiden
  • Artikellose Nominalphrasen vermeiden
  • Auslassungen bei zusammengesetzten Wörtern vermeiden
  • Zu viele Bedeutungseinheiten vermeiden
  • Satzlänge verkürzen
  • Verschachtelte „zu“-Konstruktionen vermeiden
  • Passiv vermeiden

Auf Basis dieser Regeln können Autoren sprachlich korrekte, eindeutig interpretierbare Texte mit kurzen Sätzen erstellen, die wiederum eine gute Basis für maschinelle Übersetzungen liefern.

Markenwahrnehmung stärken

Neben fehlerfreien, verständlichen Texten sollten Unternehmen im Sinne einer Corporate Language auf eine einheitliche Terminologie achten, also Vorzugsbenennungen konsistent verwenden. Ein auf Laufsport ausgerichteter Sportartikelhersteller wird bspw. festlegen, dass stets vom Laufschuh und nicht vom Sportschuh, Sneaker oder gar Turnschuh die Rede ist.

Unerwünschte Variantenvielfalt
Beispiel für eine unerwünschte Variantenvielfalt im Ausgangstext. Die Software hilft dem technischen Redakteur, strikt nur die einmal festgelegten Vorzugsbenennungen zu verwenden.

Hinzu kommen die eigenen Markennamen, die sich durchgängig wiederfinden sollten; hinzu kommen auch die Termvarianten, die für Inkonsistenzen sorgen. Insbesondere die deutsche Sprache bietet unendliche Möglichkeiten, Varianten von zusammengesetzten Wörtern, den so genannten Komposita, zu bilden. Ein Beispiel ist der Gebrauch von Synonymen, die Termvarianten hervorrufen. Das ist dann der Fall, wenn mindestens ein Bestandteil des Kompositums durch ein Synonym ersetzt wird, z. B. „Automatisierungstechnik“ vs. „Automatisierungstechnologie“.

Außerdem hat eine einheitliche Kundenansprache, der Tone of Voice, ebenfalls unmittelbare Auswirkungen auf die Produktwahrnehmung. Der Tone of Voice kommuniziert Vorstellungen und Visionen eines Unternehmens und beeinflusst Wortwahl, Anrede und Grammatik.

Wie Sie wirken möchten Beispiele für Ausdrucksmöglichkeiten über die Sprache
Partnerschaftlich
  • Von „Wir“ statt von Firma und Kunde sprechen
  • Wörter wie „gemeinsam“, „zusammen“ verwenden
Modern
  • Auf progressive Rechtschreibung achten
  • Genitiv mit „s“ statt „es“ bilden
  • Altbackene Wörter wie „vermögen“ oder „wohlfeil“ vermeiden
Verbindlich
  • Keinen Konjunktiv verwenden
  • Weichmacher wie „möglichst“, „ungefähr“ meiden

Von daher ist es im Sinne einer Corporate Language erforderlich, den Texterstellern Regeln an die Hand zu geben, wie sie Texte zu formulieren haben bzw. welche Terminologie sie verwenden sollen. Im Rahmen der maschinellen Übersetzung helfen diese Regeln, dass auch der fremdsprachige Text so weit wie möglich zur Corporate Language passt.

Ausgedruckte Redaktionshandbücher oder Styleguides sind allerdings wenig geeignet, weil dann der Autor gezwungen wäre, kontinuierlich in den Anweisungen nachzublättern, was mit einem hohen zeitlichen Aufwand verbunden ist.

Anders sieht es beim Einsatz einer Software zur Autorenunterstützung aus. Hier erhält der Autor direkt beim Schreiben Hinweise, wenn er gegen die im System hinterlegte Regel verstößt.

Meldung zum Thema „Verbindlichkeit“
Meldung zum Thema „Verbindlichkeit“: Konjunktivformen werden vom Leser als unverbindlich eingestuft und sind daher zu vermeiden.

Außerdem kann er über ein Authoring Memory auf bereits geschriebene und freigegebene Texte zurückgreifen. Darüber hinaus liefert eine Terminologie-Komponente Definitionen und Verwendungshinweise zu Fachbegriffen – inklusive den jeweiligen Vorzugsbenennungen, Synonymen und Negativtermen. Dadurch heißt der Sportschuh nicht auf einmal Turnschuh und der Schraubendreher nicht plötzlich Schraubenzieher. Das Ergebnis sind fehlerfreie Texte, die darüber hinaus konsistente Formulierungen und eine einheitliche Terminologie beinhalten.

Bei einer maschinellen Übersetzung ist es unabdingbar, dass die Unternehmensterminologie eingehalten wird, sodass das MÜ-System nur wenig bis gar keinen Interpretationsspielraum hat. Eine Intelligente Autorenunterstützung kann viele sogenannte Termvarianten automatisch erkennen. Dies geschieht über Wortbildungsregeln, aus denen Bindestrichvarianten, syntaktische Varianten, Derivationen, Synonyme und weitere Varianten abgeleitet werden.

Post-Editing maschineller Übersetzungen

Nicht nur bei der Erstellung hochwertiger Quelltexte für die maschinelle Übersetzung leistet Software zur Autorenunterstützung wertvolle Dienste, sondern auch beim Post-Editing, also bei der Nachbearbeitung. Hier geht es darum, eventuelle Unschärfen glatt zu ziehen und natürlich vor allem darum, Fehler zu korrigieren, die nach wie vor in maschinell übersetzten Texten vorkommen.

Analog zum Quelltext überprüft eine Software zur Autorenunterstützung die Übersetzung regelbasiert im Hinblick auf Grammatik, Rechtschreibung sowie Stil und weist den Redakteur auf mögliche Fehler bzw. Ungereimtheiten hin.

Ebenso kontrolliert sie, ob die richtige Terminologie verwendet wurde. Denn auch, wenn der Redakteur im Quelltext die richtige Terminologie genutzt hat, bedeutet das nicht zwangsläufig, dass das MÜ-System sie auch korrekt übersetzt bzw. die im Unternehmen festgelegte Terminologie verwendet.

Tückisch: Termvarianten mit Bindestrich oder Fugen-S

Insbesondere das Übersetzen von Termvarianten stellt MÜ-Systeme vor eine große Herausforderung. So gibt es beispielsweise ausschließlich im Deutschen die so genannten Fugenvarianten. Außerdem existiert lediglich in der deutschen Sprache die Bindestrichvariante, bei der der Bindestrich zwischen den Hauptbestandteilen des Kompositums gesetzt ist und bei der diese Bestandteile auch beide nicht entlehnt sein können.

Ein weiteres Beispiel sind Markennamen. So bietet der Fahrzeughersteller Dacia ein Modell mit der Bezeichnung „Duster“ an. Es wäre fatal, wenn in der englischen Übersetzung einer Produktbroschüre dann von einem Staubwedel die Rede ist.

Hilfe bei Wortwahl für angestrebten Tone of Voice

Auch bei der Wortwahl für den angestrebten Tone of Voice liefert Software für Autorenunterstützung Hinweise, an welchen Textstellen Überarbeitungen notwendig sind. Denn unabhängig davon, wie leistungsfähig MÜ-Systeme mittlerweile sind: Es sind nach wie vor Maschinen, die Emotionen nicht interpretieren können. Hinzu kommt, dass die Vorgaben für den gewünschten Tone of Voice je nach Land unterschiedlich sind, sodass Anpassungen im Übersetzungstext erforderlich sein können.

Stefan Kreckwitz
Stefan Kreckwitz

Zusammenfassung

Software für Autorenunterstützung bildet die Klammer um die maschinelle Übersetzung. Sie unterstützt bei der Erstellung von fehlerfreien, verständlich formulierten Ausgangstexten und optimiert die Übersetzung in Hinblick auf Korrektheit, konsistente Terminologieverwendung und eine konsequente Umsetzung des Tone of Voice.

Über den Autor

Stefan Kreckwitz ist Geschäftsführer der Congree Language Technologies GmbH. Der Diplom-Informatiker verfügt über den richtigen Mix an strategischen und technologischen Fähigkeiten, eine pragmatische Herangehensweise und eine große Portion Leidenschaft für die Technologie.

Mehr zum Thema auf UEPO.de

[Text: Stefan Kreckwitz. Bild: Congree.]