Translation Memories unter der Lupe

Im letzten Quartal hatte D.O.G. den D.O.G.news-Lesern eine kostenlose Auswertung ihrer Translation Memories angeboten. Viele Unternehmen haben sich an dieser Aktion beteiligt und uns ihre Translation Memories unterschiedlicher Größen von einigen Tausend bis zu 440.000 Segmenten zugeschickt. Aufgrund der großen Menge an Veranschaulichungsmaterial war diese Aktion sehr interessant. Sie machte auf Probleme und Möglichkeiten aufmerksam, die sicherlich auch auf eine große Mehrheit von Firmen oder Übersetzungsdienstleistern übertragen werden können. Die gewonnenen Erkenntnisse betreffen sowohl die technische als auch die sprachliche Qualität der Daten.

Translation Memories speichern alle Übersetzungen, die Übersetzer während ihrer Arbeit erzeugen. Diese Übersetzungen sind in der Regel segmentweise (ein Segment ist meistens ein Satz) in der Ausgangs- und Zielsprache gespeichert. Dazu kommen noch verschiedene Informationen und Attribute für die Verwaltung der Datensätze. Für die Dokumentations- und Übersetzungsbranche sind Translation Memories unverzichtbar, um Dokumentationen in mehreren Sprachen „industriell“ zu produzieren.

Die ersten Erkenntnisse unserer Aktion betreffen die Struktur der Daten. Zusätzlich zu den bilingualen Segmenten und den üblichen Verwaltungsdaten wie Erfasser und Erfassungsdatum sind weitere Informationen möglich und oft sinnvoll. Nicht alle Benutzer von Translation Memories machen davon Gebrauch bzw. ziehen aus der Analyse dieser Daten Rückschlüsse für ihre Arbeitspraxis.

Welche Informationen lassen sich beispielsweise aus dem Änderungsattribut gewinnen? Abgesehen vom nachträglichen Bereinigen von übersetzten Dokumenten in einem Memory erhalten Segmente ein solches Attribut, wenn der Übersetzer vorgeschlagene Übersetzungen ändert. Wenn der Anteil der geänderten Sätze am Memory größer als 3-4% ist, dann kann dies ein Zeichen für ein Optimierungspotential sein, denn Matches sollte man im Regelfall nicht überarbeiten. Die Ursachen hierfür können sehr unterschiedlich sein: Häufiger Lieferantenwechsel, mangelhafte Memories, häufige Terminologieanpassungen…

Ein weiteres Attribut bildet der Verwendungszähler. Er zählt, wie oft ein Segment aus dem Translation Memory eingesetzt wird. Daraus entsteht eine nützliche Statistik für Übersetzer aber auch für Autoren. Bei der Pflege der Memories kann man sich in erster Linie auf regelmäßig verwendete Sätze konzentrieren. Je nach Publikationstyp und Thema ist es interessant sich zu fragen, warum Übersetzer manche Sätze nicht wiederverwenden. Liegt hier eventuell ein Optimierungspotential brach? Etwa weil es viele Formulierungsvarianten gibt oder weil die Sätze zu lang sind? In der technischen Dokumentation ist es ja das Ziel, eine möglichst hohe Wiederverwendungsrate zu erreichen.

Besonders bei umfangreichen Translation Memories sind weitere Attribute über die Herkunft und über den Einsatzbereich der Segmente sinnvoll. Hiermit kann man Aktionen wie beispielsweise die Aktualisierung von Terminologie auf bestimmte Segmentmengen einschränken und diese damit besser und schneller umsetzen. Weitere Attribute wie eine Projektnummer helfen, bei Rückfragen die genaue Herkunft einer Übersetzung festzustellen.

Schließlich darf ein Attribut wie „Status“ nicht fehlen. Ein solches Attribut kann an einen Qualitätsworkflow gebunden sein und festhalten, welches Stadium der Qualitätssicherung die Übersetzung erreicht hat.

Aus sprachlicher Sicht lieferten die analysierten Memories interessante Informationen. Sie wiesen leichte bis schwerwiegende Fehler auf. Zum einen kamen durch die Übersetzung Probleme in den Ausgangstexten zum Vorschein: Ausgangssätze waren nicht immer einheitlich formuliert und kleinere Unterschiede im Satzbau, etwa bei der Interpunktion oder bei der Terminologie führten dazu, dass dieselbe Aussage in verschiedenen Varianten gespeichert war. Neben dem reinen Kostenfaktor (ein überflüssiger Satz in 20-30 Sprachen kostet Geld) muss man dabei auch das Risiko unterschiedlicher bzw. falscher Übersetzungen für solche Satzvarianten bedenken.

Ferner enthielten Memories Ausgangssätze, die aufgrund von Absatzmarken o. ä. falsch segmentiert waren und denen dadurch eine unpassende Übersetzung zugewiesen wurde. Näheres zum übersetzungsgerechten Schreiben ist in der D.O.G.news-Ausgabe 02/2010 nachzulesen.

Auch die Übersetzungen wiesen vergleichbare Schwächen auf. Häufig verwendete Begriffe wurden immer wieder unterschiedlich übersetzt. Das liegt daran, dass zum einen Translation Memories nicht an einem einzigen Tag entstehen, sondern vielmehr über Jahre und durch die Arbeit mehrerer Übersetzer. Ohne Terminologiepolitik ist es dann nicht verwunderlich, dass ein Begriff mehrere Übersetzungen erhält.

Neben Inkonsistenzen in den Formulierungen haben sich auch echte zum Teil gravierende Fehler in den analysierten Memories eingeschlichen. Dabei gab es nicht selten Zahlenfehler und auch richtige inhaltliche Fehler (wie z. B. „links“ statt „rechts“), die bei der Bedienung eines Geräts, einer Maschine oder einer Software folgenschwere Fehler verursachen können. Solche Falschübersetzungen findet man immer wieder, wenn ein Übersetzer einen Vorschlag aus dem Translation Memory (ein sog. „Fuzzy-Match“) zu schnell oder ungeprüft übernimmt. Wenn der Übersetzer einmal die fehlerhafte Übersetzung als korrekt bestätigt, pflanzen sich solche Fehler unbemerkt fort.

Die Bewertungsaktion hat die Notwendigkeit einer regelmäßigen Pflege von Translation Memories bestätigt. Vermeintliche Kostenvorteile durch „günstige“ Übersetzer sind spätestens bei der Reparatur von Translation Memories relativiert. Wer nicht auf einer tickenden Zeitbombe sitzen will, braucht ein Qualitätssicherungskonzept für Memories. Es soll folgende Fragen beantworten: Wer ist für die Qualität der Translation Memories zuständig, was wird geprüft, welche Methoden und Werkzeuge (z. B. ErrorSpy) werden bei der Qualitätssicherung eingesetzt?

[Text: D.O.G. GmbH. Quelle: D.O.G. news 3/2010, mit freundlicher Genehmigung von Dr. François Massion.]

Leipziger Buchmesse 2024