Die Technische Universität (TU) Berlin hat ihre diesjährigen drei Clara-von-Simson-Preise verliehen. Ausgezeichnet werden grundsätzlich nur Frauen; vorwiegend diejenigen, die technische oder naturwissenschaftliche Fächer studieren.
Zu den drei Preisträgerinnen gehört auch Vivien Jiranek, die in ihrer Masterarbeit untersucht hat, wie KI-Methoden reguläre deutsche Texte automatisch in Leichte Sprache übersetzen können.
Leichte Sprache richtet sich an Menschen mit eingeschränkter Lesekompetenz, doch das Angebot ist trotz gesetzlicher Vorgaben noch gering – unter anderem, weil es an Übersetzern fehlt.
Deshalb und durch begrenzte Forschungsmittel sowie einen Mangel an geeigneten gesammelten und gebündelten Daten, ist die Forschung zur automatisierten Übersetzung in Leichte Sprache noch wenig entwickelt.
Trainingsdatensatz mit Artikeln des mdr erstellt
Um diese Lücke zu schließen, hat Vivien Jiranek im Rahmen ihrer Arbeit den „EasyGerman-Datensatz“ erstellt. Grundlage hierfür waren 1.916 professionell übersetzte parallele Nachrichtenartikel in regulärem Deutsch und in Leichter Sprache, die vom Mitteldeutschen Rundfunk seit 2021 veröffentlicht wurden.
Auf Basis dieses Datensatzes wurden vier KI-Modelle trainiert und bewertet. Die Ergebnisse zeigen, dass die Modelle verständliche Texte erzeugen können. Sie belegen damit die Durchführbarkeit einer automatischen Generierung von Übersetzungen in Leichte Sprache als Volltext durch Künstliche Intelligenz.
Allerdings wurden auch Schwächen bei inhaltlicher Vollständigkeit und logischer Konsistenz der generierten Texte festgestellt.
Vivien Jiranek hat Informatik an der TU Berlin studiert und arbeitet heute in einem Software-Unternehmen in Berlin.
Bettina Klotz / TU Berlin

