Wie verlässlich sind Qualitätssicherungstools? Typische Fehler, die von der Software oft nicht erkannt werden

Heutzutage sind bei der professionellen Erstellung von Dokumentationen und Übersetzungen Qualitätssicherungstools kaum wegzudenken. Es handelt sich dabei entweder um Module, die in Redaktionssystemen bzw. in Translation-Memory-Systemen integriert sind und Texte auf bestimmte Merkmale hin prüfen, oder um eigenständige Programme.

Tools, die die Qualität der Originaltexte prüfen, funktionieren etwas anders als diejenigen, die die Übersetzungsqualität prüfen:

Im ersten Fall handelt es sich um eine einsprachige Prüfung (in deutscher bzw. in einigen wenigen weiteren Sprachen).
Im anderen Fall geht es um eine zweisprachige Prüfung, bei der die Software Originalsprache und Übersetzung miteinander vergleicht und einzelne Aspekte, wie die Einhaltung der Terminologie, überprüft.

Je nach ihrem Leistungsumfang bieten diese Tools unterschiedliche Funktionen, angefangen von der Prüfung typografischer Regeln bis hin zur Beachtung stilistischer und syntaktischer Regeln.

Nicht erkannte Fehler und falsche Fehlermeldungen

Natürlich sind nicht alle Meldungen, die Qualitätssicherungswerkzeuge liefern, automatisch echte Fehler. Sprachen sind zu komplexe Gebilde, die keine Software eindeutig auslegen kann.

Daher kämpfen alle Nutzer dieser Technologien mit dem, was man im Fachjargon als „noise“ oder „false positives“ nennt, nämlich falsche Fehlermeldungen. Wie sieht es aber mit den Fehlern aus, die von solchen Technologien nicht erkannt werden (dem sog. „silence“)? Wir klammern hier Sinnfehler aus, denn diese Fehler kann nur menschliches Wissen erkennen.

Terminologiefehler bilden den größten Anteil an Qualitätsdefiziten

Terminologie spielt bei der Qualität von Texten eine große Rolle. Erfahrungsgemäß machen deshalb Terminologiefehler den Großteil der Qualitätsdefizite in der Dokumentation aus.

Der Redakteur setzt unerwünschte Synonyme bzw. nicht übersetzungsgerechte Termini ein, der Übersetzer liefert falsche oder inkonsistente Übersetzungen. Um solche Terminologiefehler zu erkennen, müssen die eingesetzten Technologien in der Lage sein, verschiedene Schreibweisen und Synonyme zu erkennen.

Das wird beim Tooleinsatz oft stillschweigend vorausgesetzt, aber die Praxis belehrt uns eines Besseren. Auch wenn man annimmt, dass die benutzte Terminologie vollständig ist und regelmäßig aktualisiert und ergänzt wird, erscheint sie in der Dokumentation bzw. in der Übersetzung so wie die Sprache sie tatsächlich verwendet, d. h. mit Flexionen, Einschüben, usw.

Typische Fehler, die für Qualitätssicherungssoftware schwierig zu erkennen sind

Deswegen ist es nützlich zu wissen, wie gut das jeweilige Qualitätssicherungsprogramm die Terminologie im Text erkennt. Konkret geht es um folgende Situationen:

Erkennen von regulären und irregulären Pluralen oder Flexionen. Ist z. B. die Qualitätssicherungssoftware in der Lage, eine Form wie „Förderbänder“, „Staatsexamina“ oder „Kaufleute“ zu identifizieren?
Erkennen von Schreibvarianten. Immer wieder tauchen veraltete Schreibweisen auf, Bindestriche werden nach Belieben eingesetzt oder Zahlen werden ausgeschrieben bzw. nicht. Kann die Software diese Varianten erkennen („Ventilgehäuse“ oder „Ventil-Gehäuse“; „zweitürig“ oder „2-türig“)?
Erkennen von morphologischen Varianten: „Abfüllungsprozess“ oder „Abfüllprozess“.
Erkennen von Reduktionsvarianten: „Lastkraftwagen“ oder „Lastwagen“.
Erkennen von syntaktischen Varianten: „Kostensenkung“ oder „Senkung der Kosten“.
Erkennen von semantischen Varianten/Synonymen: „Arretiervorrichtung“ oder „Blockiervorrichtung“.
Ein ganz besonderer Fall ist das Erkennen von Einschüben bei Termini, die aus mehreren Wörtern bestehen. Kann die Qualitätssicherungssoftware „bestimmungsgemäße regelmäßige Verwendung“ erkennen, wenn der Terminologieeintrag aus „bestimmungsgemäße Verwendung“ besteht? Dieses Phänomen kommt in einigen Sprachen wie Französisch öfter vor als im Deutschen, wenn im Deutschen vor einem Terminus ein Adjektiv steht.
Die deutsche Sprache verwendet immer wieder Konstruktionen, bei denen zwei Fachbegriffe miteinander kombiniert werden und gemeinsam ein Hauptwort bilden. Beispiel „Lese- und Schreibkopf“ auch in verschiedenen Schreibweisen („Lese-/Schreibkopf“ oder „Lese- & Schreibkopf“). Das ist eine besondere Herausforderung für die Qualitätssicherung, wenn die Terminologie die Hauptbegriffe getrennt verwaltet.
In einigen Sprachen geht es um das Erkennen von Wortgrenzen, denn diese Sprachen verwenden kein Leerzeichen zwischen den Wörtern, sodass ein Satz als eine lange Reihenfolge von Zeichen bzw. von Buchstaben besteht. So kennt Chinesisch kein Leerzeichen zwischen den einzelnen Wörtern: 查找和替换 (Suchen und Ersetzen).

Es ist sehr empfehlenswert, einmal anhand von Testdateien die eingesetzten Qualitätssicherungsprogramme auf die Erkennung der obigen Muster zu prüfen. Zumindest gewinnt man als Erkenntnis eine Liste der Punkte, die manuell nachgeprüft werden sollen bzw. bei denen die Terminologie erweitert werden soll, etwa indem man nicht erkannte Varianten dem Terminologieeintrag hinzufügt.

Qualitätssicherung ggf. durch externe Tools

Manche Unternehmen setzen voll integrierte Systeme für die Redaktion bzw. für Übersetzungen ein, die eventuell eine unzureichende Qualitätssicherungsfunktion haben. In solchen Fällen kann es sehr nützlich sein, eine Datenaustauschmöglichkeit zu haben (z. B. auf XML-oder XLIFF-Basis), damit die Qualitätssicherung durch andere Tools, wie das von der D.O.G. GmbH entwickelte ErrorSpy, erfolgen kann.

Weiterführender Link

www.errorspy.de

[Text: D.O.G. GmbH. Quelle: D.O.G. news 3/2017, Wiedergabe mit freundlicher Genehmigung von Dr. François Massion. Bild: Magele-Picture / Fotolia.]