Gender Bias: Google Translate und DeepL übersetzen „el canciller“ mit „die Bundeskanzlerin“

Olaf Scholz, Pedro Sánchez
„Bundeskanzlerin“ Olaf Scholz zu Gast beim spanischen Ministerpräsidenten Pedro Sánchez. - Bild: Pressebild La Moncloa

Seit Jahren regen sich Feministinnen und Gender-Professorinnen darüber auf, dass maschinelle Übersetzungssysteme beim Interpretieren des Geschlechts oft eine Vorliebe für die männliche Form zeigen. So wird das englische „the doctor“, das keinerlei Aussage über das Geschlecht trifft, meist mit „der Arzt“ übersetzt.

Ein besonders schönes Beispiel dafür, dass dieser geschlechtsbezogene Verzerrungseffekt (Gender Bias) nicht nur Frauen, sondern auch Männer benachteiligen kann, ist der Twitter-Nutzerin @Individuella aufgefallen.

Der spanische Ausgangstext einer Mitteilung, die der Moncloa-Palast als Sitz des spanischen Ministerpräsidenten verbreitete, lautet:

El presidente del Gobierno, @sanchezcastejon, y el canciller alemán, @OlafScholz, se reúnen en estos momentos en La Moncloa.

Dies wird von der Twitter-internen Übersetzungsfunktion, die offenbar auf Google Translate zurückgreift, wie folgt übersetzt:

Der Regierungspräsident @sanchezcastejon und die deutsche Bundeskanzlerin @OlafScholz treffen sich derzeit in La Moncloa.

Fehlübersetzung leicht reproduzierbar, auch in DeepL

Tatsächlich lässt sich der Übersetzungsfehler sowohl in Google Translate als auch in DeepL problemlos reproduzieren. Nicht für alle Sprachen, auch nicht für die meisten, aber doch für einige. Wir geben als Ausgangssatz ein:

El presidente del Gobierno y el canciller alemán se reúnen en estos momentos en La Moncloa.

Google Translate übersetzt:

  • Deutsch: Der Regierungspräsident und die deutsche Bundeskanzlerin treffen sich derzeit in La Moncloa.
  • Französisch: Le président du gouvernement et la chancelière allemande se rencontrent actuellement à La Moncloa.
  • Luxemburgisch: De Regierunspresident an déi däitsch Bundeskanzlerin treffen sech den Ament zu La Moncloa.
  • Kroatisch: Predsjednik Gobierna i njemačka kancelarka sastaju se u ovo vrijeme u La Moncloi.

DeepL übersetzt:

  • Deutsch: Der Premierminister und die deutsche Bundeskanzlerin treffen sich derzeit in La Moncloa.
  • Französisch: Le Premier ministre et la chancelière allemande sont actuellement en réunion à La Moncloa.
  • Tschechisch: Premiér a německá kancléřka se v současné době setkávají v La Moncloa.

Merkels Kanzlerschaft ist älter als Google Translate und DeepL

Warum übersetzt die Maschine nicht einfach das, was da steht (el canciller = der Kanzler)? Wäre eine Kanzlerin gemeint, hätte dort doch la canciller  oder gar (von führenden Wörterbüchern nicht abgesegnet) la cancillera stehen müssen. Nicht unbedingt, denn auch im Spanischen kann bei allgemeinen Aussagen die grammatisch maskuline Form generisch, also alle Geschlechter umfassend, verwendet und verstanden werden. Es besteht also durchaus ein Interpretationsspielraum.

Aber warum legen sich die Translation Engines in diesem Fall so eindeutig darauf fest, dass hier nur eine Bundeskanzlerin gemeint sein kann? Weil sie aus den ihnen zur Verfügung stehenden Textkorpora und Paralleltexten (inhaltlich gleiche Texte, die in mehreren Sprachen vorliegen) den Schluss ziehen, dass deutsche Kanzler typischerweise Frauen sind. Eine Erkenntnis, deren Wahrheitsgehalt sich zumindest für die vergangenen sechzehn Jahre auch problemlos belegen lässt.

Dass die Maschine hier eine Geschlechtskorrektur vornimmt, dürfte kaum auf eine bewusste Vorgabe der Programmierer zurückzuführen sein. Es liegt vermutlich einfach an der berühmten „normativen Kraft des Faktischen“.

Google Translate gibt es seit 2006. Da war Angela Merkel schon ein Jahr im Amt. DeepL ging 2017 online, also in ihrem 11. Amtsjahr. Für beide Übersetzungsdienste hat es – außer in historischen Texten – nie etwas anderes als eine deutsche Bundeskanzlerin gegeben.

Wenn Vorname Olaf hinzukommt, übersetzen Maschinen korrekt

Ein Verständnisproblem ergibt sich für die maschinelle Übersetzung in diesem Fall dadurch, dass die Vornamen der Politiker nicht erkennbar sind. Im Tweet werden lediglich deren Twitternamen @OlafScholz und @sanchezcastejon aufgeführt. Diese werden beim Übersetzungsprozess grundsätzlich ausgeklammert, nicht näher analysiert und unverändert übernommen.

Ersetzt man „@OlafScholz“ durch „Olaf Scholz“, leiten sowohl Google Translate als auch DeepL aus dem männlichen Vornamen Olaf ab, dass es sich beim derzeitigen Amtsinhaber um einen Mann handelt. Fehlen solche Zusatzinformationen, greift die Künstliche Intelligenz auf das ihr eingetrichterte Weltwissen zurück, auch wenn dieses inzwischen von der Realität überholt wurde.

Sechzehn lange Merkel-Jahre haben auch in Algorithmen, Paralleltexten und Translation Memorys einen prägenden Eindruck hinterlassen. Es könnte viele weitere Jahre dauern, bis Übersetzungsmaschinen die Möglichkeit in Erwägung ziehen, dass auch Männer befähigt sind, im Kanzleramt ihren Dienst zu tun.

*

Hier der die Diskussion auslösende Tweet mit der zitierten Fehlübersetzung „Bundeskanzlerin“:

Individuella-Tweet

Tweet Olaf Scholz Bundeskanzlerin
Bild: @Individuella

Richard Schneider

Das GDolmG muss weg