Dr. Gereon Frahling ist Mitgründer von Linguee und war involviert in die erste Entwicklung des DeepL-Translators. Am 18. Mai 2017 hat er an seiner Alama Mater, der Universität Paderborn, im Heinz-Nixdorf-Institut einen Vortrag zum Thema „Maschinelle Übersetzung mit Deep-Learning-Verfahren“ gehalten.
In knapp 45 Minuten mit anschließender Diskussion beschreibt er die Funktionsweise der neuronalen Netze. Er erklärt, warum der neue Ansatz die maschinelle Übersetzung revolutioniert und das zuvor angewandte statistische Verfahren abgelöst hat.
Wie war es möglich, dass ein kleines deutsches Team von Mathematikern und Programmierern mit begrenztem Budget nach nur einjähriger Entwicklungszeit hinsichtlich der Übersetzungsqualität den Milliardenkonzern Google überholen konnte? Welche Rolle spielte dabei die Paralleltext-Suchmaschine Linguee?
Einige Gedankensplitter aus dem Vortrag:
- „98 % der Übersetzungen im Internet sind computerübersetzer Mist“. Linguee verwendet nur 1 % der gefundenen Übersetzungen.
- Man sieht maschinell erstellten Übersetzungen an, mit welcher Methodik sie erzeugt wurden (regelbasiert, statistisch, neuronal).
- Acht Jahre lang hat Linguee hochwertige Übersetzungen zusammengestellt, die sich jetzt als das perfekte Trainingsmaterial für die neuronale maschinelle Übersetzung erwiesen haben (neural machine translation, NMT).
- Neue Denkansätze aus den Jahren 2012 und 2014 zu neuronalen Netzen haben zu den jetzt zu beobachtenden „unfassbaren Verbesserungen“ in der Qualität maschineller Übersetzungen geführt.
- NMT-Architekturen sind „extrem super simpel“ und bestehen aus bereits bekannten Elementen. Die Entwicklung dieser Systeme steckt aber immer noch in den Kinderschuhen.
- Man kann neuronale Netze auch für völlig andere Anwendungen nutzen – etwa im Bereich der Bilderkennung.
- Auf die Frage „Wann übersetzt die Maschine besser als ein professioneller Übersetzer?“ habe er (Frahling) bis vor Kurzem noch „niemals“ geantwortet. Das würde er heute jedoch nicht mehr sagen.
In der offenbar von Frahling verfassten Kurzbeschreibung des Videos heißt es:
Jüngst gab es unglaubliche Fortschritte in der maschinellen Übersetzung durch neuronale Netze. Große Anbieter von maschineller Übersetzung haben ihre Systeme auf Deep-Learning-Systeme umgestellt oder sind dabei, dies zu tun. Die Übersetzungsqualität hat sich durch neuronale Netze deutlich verbessert.
Bei Linguee konzentrieren wir uns seit Jahren darauf, alle Übersetzungen der Welt zu sammeln und zu indizieren. Dadurch haben wir in der Forschung auf diesem Gebiet einen Vorteil gegenüber Mitbewerbern, da wir unsere neuronalen Netze auf mehr Material trainieren können.
Darüber hinaus statten wir die neuronalen Netze mit Sprachverarbeitungs-Algorithmen aus. All dies führt dazu, dass unsere internen Algorithmen viele Sätze besser übersetzen als Google Translate. Wir erwarten für die nächsten Jahre noch deutliche Verbesserungen.
Richard Schneider