Das Google Translation Center: kein Übersetzungsbüro, sondern eine Paralleltext-Sammelmaschine

Die Suchmaschine Google, nebenbei das größte Translation Memory der Welt, testet zurzeit in Erweiterung der eigenen Forschungsaktivitäten zur maschinellen Übersetzung (MÜ) ein neues Angebot. Unter dem Titel Google Translation Center wird Übersetzern eine Arbeitsumgebung mit diversen Tools angeboten. Auftraggeber können über die Plattform nach Übersetzern suchen.

Dabei geht es Google nicht darum, als Vermittler von Übersetzungsaufträgen Geld zu verdienen: „Your interaction with any third party participant(s) or user(s) within Google Translation Center, including payment and delivery of goods and services, and any other terms, conditions, warranties or representations associated with such dealings, are solely between you and such third party participant(s) or user(s) and Google is not involved in such dealings.“

Auch für die Qualität der auf der Plattform erstellten Übersetzungen legt Google nicht die Hand ins Feuer. In der FAQ-Datei heißt es: „Does Google provide guarantees on the quality of the services provided by Google Translation Center? No. Translations created in Google Translation Center are purely between the translation requester and the translators.“

Der Zweck der Übung besteht vielmehr darin, Paralleltexte – vor allem in weniger verbreiteten Sprachen – für die Optimierung der von Google vehement vorangetriebenen maschinellen Übersetzung zu gewinnen.

Für Berufsübersetzer kommt das Übersetzungsportal von Google schon aus Vertraulichkeits- und Geheimhaltungsgründen nicht in Frage. Es reicht jedoch, wenn Schüler und Hobbyübersetzer die Plattform nutzen. Die fabrizierten Übersetzungen sind Google schon dann von Nutzen, wenn sie besser sind als maschinelle Übersetzungen. Eine Vorgabe, die jeder Abiturient erfüllen kann.

Google stellt mit dem Translation Center eine zumindest für Laienübersetzer komfortable und verlockende Arbeitsumgebung zur Verfügung. Im Gegenzug müssen die Übersetzer Google den Ausgangs- und Zieltext überlassen – eine überaus wertvolle Ressource für den MÜ-Giganten.

Google favorisiert beim maschinellen Übersetzen das relativ neue, so genannte statistische Verfahren im Gegensatz zum älteren, regelbasierten Verfahren mit vorgegebenen Wörterbüchern und grammatischen Regeln. Statistische Verfahren sind auf möglichst umfangreiche Korpora von Paralleltexten angewiesen.

Bisher wurden dazu die umfangreichen Bestände der EU und der UNO sowie die von Google erfassten mehrsprachigen Websites herangezogen. Vor allem für exotische Sprachen ist die in fast 2.400 Sprachen vorliegende Bibel von unschätzbarem Wert.

Franz Josef OchEiner der zurzeit erfolgreichsten MÜ-Forscher und bei Google in leitender Funktion tätig ist der Deutsche Franz Josef Och (Bild). Schon in seiner Diplomarbeit 1998 an der Uni Erlangen-Nürnberg hat er sich mit statistischen Verfahren in der maschinellen Übersetzung beschäftigt. Weitere Karrierestationen waren die Promotion an der RWTH Aachen und einige Forschungsjahre an der University of Southern California – bis Google ihm schließlich ein Angebot machte, das er nicht ablehnen konnte. Google Research dürfte heute das finanziell und technisch am besten ausgestattete MÜ-Forschungsinstitut der Welt sein.

Och selbst schreibt im „Google Research Blog“ am 28.04.2006:

Because we want to provide everyone with access to all the world’s information, including information written in every language, one of the exciting projects at Google Research is machine translation. Most state-of-the-art commercial machine translation systems in use today have been developed using a rules-based approach and require a lot of work by linguists to define vocabularies and grammars.

Several research systems, including ours, take a different approach: we feed the computer with billions of words of text, both monolingual text in the target language, and aligned text consisting of examples of human translations between the languages. We then apply statistical learning techniques to build a translation model. We have achieved very good results in research evaluations.

Zurzeit befindet sich das Google Translation Center in der Beta-Phase und kann nur von Google-Mitarbeitern, deren Angehörigen und Freunden genutzt werden. Eigentlich sollte das ganze Projekt noch streng vertraulich behandelt werden. Dass in den letzten Tagen überhaupt Informationen darüber an die Öffentlichkeit gelangten, verdanken wir den aufmerksamen Autoren des Blogs „Google Blogoscoped„.

Links zum Thema im Übersetzerportal:
17.09.2003 – Statistische Übersetzung mit Paralleltexten: Franz Josef Och mischt die MÜ-Branche auf
15.11.2006 – Google und Franz Josef Och gewinnen MÜ-Wettbewerb des NIST für Chinesisch und Arabisch