DeepL, der maschinelle Übersetzungsdienst der Macher von Linguee: Ein Quantensprung?

DeepL-Website
So präsentiert sich die Web-Schnittstelle des DeepL-Übersetzers zum Start des Angebots. – Bild: DeepL

Am 29.08.2017 hat die Kölner DeepL GmbH (ehemals Linguee GmbH) der Öffentlichkeit ihren maschinellen Übersetzungsdienst DeepL vorgestellt. Das „L“ steht für „Learning“, „DeepL“ also für „tiefes Lernen“. Das Werkzeug kann von jedermann über das Internet genutzt werden und soll Angeboten wie Google Translate Konkurrenz machen.

Laut Anbieter soll DeepL mit einer „nie zuvor erreichten Übersetzungsqualität“ aufwarten und „einen neuen Standard in der neuronalen maschinellen Übersetzung“ setzen.

Am 30. August 2017 erschienen zahlreiche Artikel in der Computerpresse (c’t, Chip, Netzwelt, TechCrunch, Golem, Mobile Geeks und andere), in denen das neue MÜ-System nach ersten Kurztests überaus positiv bewertet wurde.

Nach nur einjähriger Entwicklungszeit besser als Google Translate?

Das Team um Linguee-Gründer Gereon Frahling hatte 2016 damit begonnen, ein neuronales Netzwerk zu konstruieren, das in der Lage ist, jede Art von Text zu übersetzen.

Dieses System baut auf der jahrelangen Erfahrung des Teams mit maschinellen Lernverfahren und natürlicher Sprachverarbeitung auf. Es wurde mit über einer Milliarde wie es heißt „hochqualitativer Übersetzungen“ trainiert, die durch Linguees Web-Crawler gesammelt wurden.

Im Mai 2017 soll die Qualität der Übersetzungen von DeepL dann ein Niveau erreicht haben, das nach Angaben von DeepL alle bisherigen automatischen Übersetzungen in den Schatten stellt und die Qualität der Angebote großer amerikanischer Internetfirmen (gemeint sind Google und Microsoft) weit übertrifft.

Seitdem fokussiert sich das Team darauf, den DeepL-Übersetzungsdienst der Öffentlichkeit zugänglich zu machen.

Umbenennung von Linguee GmbH zu DeepL GmbH

Am 27.07.2017 beschloss die Gesellschafterversammlung der Linguee GmbH, ihren Namen zu DeepL GmbH zu ändern, um den neuen Schwerpunkt des Unternehmens zu verdeutlichen. Dieser liegt nun auf der Entwicklung von Produkten, die auf anspruchsvollen neuronalen Netzwerken basieren.

Nachfolgend die Presseinformationen von DeepL zum Start des neuen Angebots:

DeepL im Überblick: Zahlen und Fakten

  • Dreimal besser
    Der Vergleich des DeepL-Übersetzers mit der Konkurrenz im Blindtest zeigt, dass DeepLs Resultate etwa drei Mal so häufig als beste Übersetzung gewählt werden, wie die der anderen.
  • 5.1 petaFLOPS
    Um seine neuronalen Übersetzungsmaschinen zu trainieren, hat die DeepL GmbH einen Supercomputer in Island gebaut, der mehr als 5.100.000.000.000.000 Rechenoperationen pro Sekunde erreicht. Im Ranking der heutigen Superrechner würde er den 23. Platz belegen.
  • 1 Million Wörter pro Sekunde
    DeepL ist in der Lage, 1.000.000 Wörter in unter einer Sekunde zu übersetzen. So kann der DeepL-Übersetzer täglich Millionen von Menschen weltweit unterstützen.
  • 1 Milliarde Übersetzungen
    Die Leistung eines neuronalen Netzwerkes hängt stark von der Qualität des Trainingsmaterials ab. DeepLs neuronale Netzwerke wurden mit über einer Milliarde übersetzter Sätze von hoher Qualität traininert, die von der Übersetzungssuchmaschine Linguee bereitgestellt werden. Dadurch hat DeepL einen unschlagbaren Vorteil gegenüber anderen maschinellen Übersetzungssystemen.

DeepL seit Ende August 2017 für die Öffentlichkeit zugänglich

Das deutsche Technologieunternehmen DeepL hat am 29.08.2017 den „DeepL-Übersetzer“ für die Öffentlichkeit freigeschaltet. Das neue maschinelle Übersetzungssystem liefert Übersetzungen in bisher ungekannter Qualität. Der DeepL-Übersetzer kann von jedermann kostenlos benutzt werden.

Obwohl große amerikanische Internetfirmen immense Geldsummen und Ressourcen in die Entwicklung von neuronalen Netzen zur Übersetzung investieren, setzt die Kölner Firma DeepL einen neuen Standard in der Maschinenübersetzung.

Der DeepL-Übersetzer ist eine Webseite, auf der Benutzer beliebige Texte übersetzen lassen können. Dabei versteht die künstliche Intelligenz auch kleinste Details und gibt sie sinnvoll in der Übersetzung wieder.

DeepL: Ergebnisse Blindtests
In Blindtests schnitten die Übersetzungen von DeepL besser als die der Konkurrenz ab. – Bild: DeepL

In Blindtests, in denen der DeepL-Übersetzer mit den bekannten Maschinenübersetzungen verglichen wurde, beurteilten professionelle Übersetzer die Ergebnisse von DeepL drei Mal häufiger als „besser“. Das belegen auch automatisierte Tests.

DeepL: BLEU-Scores
Die BLEU-Scores von DeepL sind ebenfalls beeindruckend. – Bild: DeepL

DeepL erreicht neue Rekordwerte im BLEU-Score

Im Bereich der maschinellen Übersetzung ist der Goldstandard für die Messung der Qualität der BLEU-Score, der maschinell übersetzte Texte mit denen eines Übersetzers vergleicht. Der DeepL-Übersetzer erzielt auch bezüglich des BLEU-Scores Rekordwerte.

Der bisherige BLEU-Rekord auf den WMT 2014 newstest Testdaten für Englisch-Deutsch war 28,4, erreicht von der Google-Forschungsabteilung. Der öffentliche Übersetzungsdienst von DeepL erreicht auf den gleichen Testdaten eine BLEU-Punktzahl von 31,1. Auf den newstest 2014 Testdaten für Englisch-Französisch erreicht DeepL Translator eine BLEU-Punktzahl von 44,7 und übertrifft damit den bisherigen Rekord um mehr als 3 Punkte.

Bessere Abbildung natürlicher Sprache durch Änderungen an Architektur neuronaler Netze

„Wir haben einige bedeutende Verbesserungen an der Architektur der neuronalen Netze vorgenommen“, sagt Gereon Frahling, Gründer und Geschäftsführer des Unternehmens. „Durch eine neue Anordnung der Neuronen und ihrer Verbindungen haben wir es unseren Netzen ermöglicht, natürliche Sprache besser abzubilden als jedes bisherige neuronale Übersetzungsnetz.“

DeepL läuft auf Supercomputer in Island

DeepLs künstliche Intelligenz läuft auf einem Supercomputer in Island, der 5.1 petaFLOPS (5.100.000.000.000.000 Operationen pro Sekunde) ausführen kann, genug Leistung, um eine Million Wörter in weniger als einer Sekunde zu übersetzen.

„Aufgrund des Überangebots an erneuerbaren Energien können wir unsere neuronalen Netze in Island sehr kostengünstig trainieren. Wir werden dort weiterhin in leistungsstarke Hardware investieren“, erklärt Technikvorstand (CTO) Jaroslaw Kutylowski.

Das DeepL-Team nutzt diesen Supercomputer, um neuronale Netze mit einer riesigen Sammlung mehrsprachiger Texte zu trainieren. Die Netzwerke schauen sich dabei sehr viele Übersetzungen an und lernen selbständig, wie man grammatikalisch korrekt übersetzt und gute Formulierungen wählt.

Dabei können die Kölner auf den Erfolg ihres ersten Produkts zurückgreifen: Linguee, der weltweit größten Suchmaschine für Übersetzungen. In den letzten zehn Jahren hat DeepL mehr als eine Milliarde hochqualitativer Übersetzungen zusammengetragen und kann diese nun zum Training der künstlichen Intelligenz nutzen.

Derzeit werden 42 Sprachkombinationen unterstützt

Der DeepL Übersetzer unterstützt derzeit 42 Sprachkombinationen zwischen Deutsch, Englisch, Französisch, Spanisch, Italienisch, Polnisch und Niederländisch. Die neuronalen Netze trainieren bereits, um in Zukunft weitere Sprachen wie Mandarin, Japanisch und Russisch zu beherrschen.

Demnächst soll Programmierschnittstelle (API) bereitgestellt werden

DeepL beabsichtigt außerdem, in den kommenden Monaten eine Programmierschnittstelle (API) zur Verfügung zu stellen. So kann die überlegene Übersetzungstechnik auch in anderen Produkten wie digitalen Assistenten, Wörterbüchern, Sprachlernanwendungen und professionellen Übersetzungsprogrammen eingesetzt werden.

Nutzungsmöglichkeiten nicht auf Übersetzungen beschränkt

„Unsere Ambitionen beschränken sich nicht auf Übersetzungen“, sagt Frahling. „Die neuronalen Netze haben ein unglaubliches Sprachverständnis entwickelt. Das eröffnet uns viele aufregende Möglichkeiten für die Zukunft.“

Über DeepL

DeepL ist ein Technologieunternehmen, das sich auf die Entwicklung von KI-Systemen für Sprachen spezialisiert hat. Das Unternehmen wurde 2009 unter dem Namen Linguee gegründet und startete die erste Internet-Suchmaschine für Übersetzungen. Linguee ist eine der 200 meistgenutzten Websites in Deutschland, Frankreich, Spanien und anderen Ländern und hat mehr als 10 Milliarden Anfragen von über einer Milliarde Benutzern beantwortet.

2017 startete das Unternehmen den DeepL Übersetzer, ein maschinelles Übersetzungssystem auf Basis von neuronalen Netzen, welches alle bisherigen Übersetzungssysteme in der Qualität deutlich übertrifft.

DeepL beschäftigt sich auch weiterhin mit der Entwicklung von künstlicher Intelligenz, die menschliche Möglichkeiten erweitert, Sprachbarrieren überwindet und Kulturen einander näher bringt.

Weiterführender Link

PM DeepL, Richard Schneider