Lanfrica: Student der Jacobs University entwickelt Datenbank für afrikanische Sprachen

Bonaventure Dossou
Bonaventure Dossou schließt 2022 den Masterstudiengang Data Engineering an der Jacobs University Bremen ab. - Bild: Jacobs University

Geschätzt 2.000 Sprachen werden auf dem afrikanischen Kontinent gesprochen, so viele wie in keiner anderen Region der Erde. Die digitale Welt aber spiegelt ihre Vielfalt nicht wieder, in ihr dominiert das Englische. Um dies zu ändern, hat Bonaventure Dossou, Master-Student des Studiengangs „Data Engineering“ an der Jacobs University Bremen, gemeinsam mit seinem Freund Chris Emezue eine Übersetzungs- und Spracherkennungssoftware für „Fon“ entwickelt, eine Sprache seines Heimatlandes Benin.

Mit „MMTAfrica“ entwickelten sie zudem eine mehrsprachige maschinelle Übersetzung für sechs afrikanische Sprachen und mit dem Projekt „Lanfrica“ eine zentrale Datenbank für afrikanische Sprachen. Die Grundidee von Lanfrica wurde bereits im vergangenen Jahr im Rahmen eines UNESCO Startup-Wettbewerbs ausgezeichnet.

Viele afrikanische Sprachen sind keine Schriftsprachen

„Wir wollen die Sichtbarkeit und Darstellung afrikanischer Sprachen im Internet verbessern“, beschreibt Bonaventure das Ziel. Die Auffindbarkeit ist nicht nur deshalb eingeschränkt, weil Englisch das maschinelle Lernen und die Algorithmen dominiert und Sprachassistenten von Google oder Apple afrikanische Sprachen weitgehend ignorieren, sondern auch, weil viele afrikanische Sprachen keine Schriftsprachen sind. Oftmals existieren nur wenige Texte und Quellen als Datengrundlage für NLP-Technologien (Natural Language Processing) wie die maschinellen Übersetzungen.

Lanfrica

Lanfrica als Katalog und Recherchewerkzeug

Die zentrale Datenbank „Lanfrica“ soll hier Abhilfe schaffen. Sie versteht sich als Katalog, als ein Recherchetool, das einen einfachen und übersichtlichen Zugang zu bestehenden Forschungsarbeiten, Datenpaketen oder Archiven herstellt. Und sie möchte bestehende Initiativen zusammenführen, die sich mit der maschinellen Lesbarkeit afrikanischer Sprachen befassen.

Die Projektidee kam an. Auf der ViVaTech-UNESCO Challenge, einem internationalen Startup-Event, stellte das Duo Lanfrica im Juni 2021 vor und belegte in der Kategorie „Überwindung von Sprachbarrieren durch Daten und Künstliche Intelligenz“ den ersten Platz. Mit diesem Wettbewerb fördert die Organisation der Vereinten Nationen für Bildung, Wissenschaft, Kultur und Kommunikation technologiebasierte Lösungen, die zur sprachlichen Vielfalt und der Mehrsprachigkeit beitragen. „Das war spannend“, meint Bonaventure. „Der Sieg hat uns motiviert, an dem Thema dranzubleiben.“

Und Bonaventure bleibt dran an Lanfrica, obwohl er gerade erst von einem mehrmonatigen Studienaufenthalt im kanadischen Montreal zurückkehrt. Dort war Bonaventure – als Teil seines Master-Studiums an der Jacobs University – am „Mila – Quebec Artificial Intelligence Institute“ Forschungszentrum für Fragen zu Deep Learning. Zudem war er in Kanada als studentischer Forscher bei Google AI aktiv, einer Abteilung, die sich der Künstlichen Intelligenz widmet. „Ich konnte in Kanada meiner zweiten Leidenschaft neben Sprachen nachgehen, nämlich Gesundheits- und Biologiethemen wie der Entwicklung neuer Medikamente mithilfe von Deep Learning.“

Sein Aufenthalt in Kanada hat auch mit dem Pharmaunternehmen Roche zu tun. Der 25-Jährige wird im Rahmen der Kooperation von Roche Deutschland mit der Jacobs University gefördert und hat bei Roche-Kanada praktische Erfahrung in der Industrie gesammelt. Ein Gesundheitsthema beschäftigt den 25-Jährigen auch in seiner jetzt anstehenden Masterthesis an der Jacobs University. Darin nutzt er Deep Learning zur statistischen Analyse von krankheitsassoziierten Mutationen im Kontext von Chromosomen, die aus genomweiten Assoziationsstudien öffentlich verfügbar sind.

Im Juni hat er sein Studium an der Jacobs University abgeschlossen. Was danach kommt, ob Promotion oder ein erster Job in der Industrie, ist noch offen. Schon jetzt aber hat Bonaventure viel gesehen und bewirkt. Aufgewachsen in Benin, hat er in Russland an der Kasaner Föderalen Universität Mathematik studiert, ist für seinen Master nach Bremen an die Jacobs University gewechselt und hat sein Wissen in Kanada erweitert. Er sagt: „Ich möchte sinnvolle und relevante Forschung betreiben und freue mich darauf, mehr zu sehen, zu erreichen und zu bewirken“.

Über die Jacobs University Bremen

Die Jacobs University Bremen wurde 2001 als private, englischsprachige Campus-Universität gegründet. Sie erzielt immer wieder Spitzenergebnisse in nationalen und internationalen Hochschulrankings.

Ihre mehr als 1.600 Studierenden stammen aus mehr als 110 Ländern, rund 80 Prozent sind für ihr Studium nach Deutschland gezogen. Forschungsprojekte der Jacobs University werden von der Deutschen Forschungsgemeinschaft oder aus dem Rahmenprogramm für Forschung und Innovation der Europäischen Union ebenso gefördert wie von Unternehmen.

Weiterführender Link

Maike Lempka für Jacobs University

Babbel