Künstliche Intelligenz

Das Internet soll afrikanische Sprachen lernen

Ein afrikanisches Open-Source-Projekt arbeitet an einer Künstlichen Intelligenz, die afrikanische Sprachen übersetzen kann. Das Ziel des Kollektivs ist es den Zugang zu Informationen zu demokratisieren.

Allahsera Auguste Tapo hatte vor allem Glück, sagt er. Der IT-Experte aus Mali hat mit einem Fullbright-Stipendium in den USA studiert, ist Spezialist für Künstliche Intelligenz im Bereich der Computerlinguistik. Das alles, weil er eine Sprache fließend spricht, die eigentlich nicht seine eigene ist. „Ich durfte zur Schule gehen und beherrsche Englisch“, sagt Tapo. „Aber andere, die genauso große Leidenschaften und Träume haben wie ich, hatten dieses Glück nicht. Es ist mein Ziel, auch meinen Mitmenschen die Welt zu öffnen. Ich will, dass sie Zugang zum Internet in ihren eigenen Sprachen haben, angefangen mit Bambara, der Sprache, die 80 Prozent der Menschen in Mali sprechen.“

Auch bei Good Impact: Goldene Zwanziger für Afrika

Tapo ist Teil des Netzwerks Masakhane. Der Name stammt aus der südafrikanischen Sprache isiZulu und bedeutet: „Wir bauen gemeinsam.“ Zusammen mit Linguist*innen, Übersetzer*innen, Datenwissenschaftler*innen und Studierenden aus dem ganzen afrikanischen Kontinent arbeitet er an einem Übersetzungstool. Es vermag afrikanischen Sprachen durch maschinelle Übersetzung – eine komplexe, linguistische Anwendung von Künstlicher Intelligenz – eine Stimme zu geben. Alle Afrikaner*innen, die keine der Kolonialsprachen (in Afrika sind das vor allem Englisch, Französisch und Portugiesisch) sprechen, sollen die Möglichkeit haben, Texte in ihren Muttersprachen lesen und selbst hochladen zu können, damit sie wiederum von anderen Menschen verstanden werden. Es ist vielleicht eines der ambitioniertesten Open-Source-Projekte in ganz Afrika. Mehr als 60 Mitglieder arbeiten jede Woche in ihrer Freizeit an dem Projekt, ohne dafür Geld zu bekommen.

Masakhane soll den Kontinent dekolonisieren

Gegründet wurde Masakhane 2019 von zwei weißen Südafrikanerinnen: den Informatikerinnen Jade Abbott und Laura Martinus. Für Abbott ist Masakhane eine Verantwortung, die gerade Menschen tragen, die zu der weißen Minderheit des Kontinents gehören. Sie glaubt, dass ihr Land 25 Jahre nach dem Ende der Apartheid auch deswegen immer noch so gespalten ist, weil die Menschen sich untereinander nicht verstehen. Mit Masakhane will sie aber nicht nur Südafrikaner*innen einen, sondern auch den ganzen Kontinent ein Stück weit dekolonisieren. „Afrika ist ein getrennter Kontinent. Die afrikanischen Länder haben teilweise bessere Beziehungen zu ihren alten Kolonialmächten als untereinander. Um das zu ändern, haben wir Masakhane gegründet.“

Mein Traum ist es, dass Siri, Google Translate und Alexa in allen kongolesischen Sprachen verfügbar sind.
Salomon Kabongo, Mitglied von Masakhane

Über 30 Prozent aller Sprachen, die heute gesprochen werden, sagt Abbot, seien afrikanische Sprachen. Sie machen jedoch nur einen Bruchteil aller Quellen im Internet aus. Dementsprechend haben die bereits bestehenden Algorithmen von Tools wie Google Translate wenig „Futter“, um die Sprachen zu lernen und korrekt zu übersetzen. Versuchen Menschen, die zum Beispiel Sprachen wie Oshivambo oder Yoruba sprechen, einen englischen Text über den Schutz vor dem Coronavirus online in die eigene Muttersprache zu übersetzen, ist es daher unwahrscheinlich, dass sie ein zufriedenstellendes Ergebnis erhalten. Der Zugang zu Wissen und Information und auch die Möglichkeit, selbst Inhalte zu teilen, wird dadurch bestimmt, wie viele Quellen es in der eigenen Sprache gibt. Je mehr Quellen, desto schneller können Künstliche Intelligenzen Sprachen lernen, übersetzen und so verbreiten. Darüber hinaus müssen KIs auf jede Sprache neu angepasst sein. Masakhane-Mitglied Ari Ramkilowan sagt: „Computerlinguistik ist ein entscheidendes Werkzeug, um den Zugang zu Information zu demokratisieren.“ Sein kongolesischer Kollege Salomon Kabongo hat ein konkretes Ziel: „Mein Traum ist es, dass Siri, Google Translate, Alexa und alle anderen Übersetzungstools, die es gibt, in allen kongolesischen Sprachen verfügbar sind.“

Ausgabe #2 als PDF erhalten

Gratis Ausgabe für dich

Die Bestseller-Ausgabe “Von Cyborgs und Chatbots” nimmt das Thema künstliche Intelligenz unter die Lupe – hier kannst du dir die Ausgabe gratis als PDF-Download sichern.

Dieser Artikel erschien auch im Schwerpunkt „Pioniere der Nachhaltigkeit“ in der aktuellen, solidarischen Ausgabe, die wir allen kostenlos als E-Paper zur Verfügung stellen.

Das Kollektiv will durch die Anwendung von maschineller Übersetzung Programme für so viele afrikanische Sprachen wie möglich entwickeln. Die Mitglieder sammeln unermüdlich Quellen, schreiben Codes und erstellen Programme, die diese Quellen scannen und die Sprachmuster darin erkennen und reproduzieren können. Eine der größten Herausforderungen besteht darin, dass die meisten Texte in indigenen afrikanischen Sprachen nicht der Öffentlichkeit zugänglich sind. Sie liegen in privaten Sammlungen oder sind noch nicht digitalisiert. Viele Sprachen haben zudem keine schriftliche Tradition: Sie werden vor allem gesprochen, nicht geschrieben. Für diese Sprachen bedienen sich die Informatiker*innen vor allem journalistischer Texte, die lokale afrikanische Zeitungen oft in zwei Versionen veröffentlichen: in einer Kolonialsprache und in der jeweiligen afrikanischen Sprache. Manchen Mitgliedern von Masakhane geht es bei dieser Archivierung auch darum, ihre Sprachen und ihr kulturelles Erbe zu bewahren, bevor es überhaupt verbreitet werden kann.

Eine Rebellion gegen den Imperialismus

Masakhane arbeitet insbesondere auch mit afrikanischen Universitäten zusammen. Viele der Mitglieder sind Studierende, die es wütend macht, dass an ihren Hochschulen vor allem auf Englisch, Portugiesisch und Französisch gelehrt wird. Um das zu ändern, arbeitet das Kollektiv mit der „Artificial Intellegence for Social Good“ Initiative der Universität von Pretoria und der renommierten Universität Witwatersrand in Johannesburg bei der Entwicklung der Programme zusammen. Immer mehr Universitäten würden laut Abbott langsam begreifen, dass die Studierenden sich nach einem Angebot in ihren eigenen Sprachen sehnen. Und dass die Etablierung von afrikanischen Sprachen Barrieren zu Bildung und Partizipation in der Gesellschaft einreißen kann.

Jade Abbott bezieht sich im Gespräch auf den kenianischen Autor Ngũgĩ wa Thiong’o. In seinem Buch Decolonising the mind bezeichnet er die Dominanz von kolonialen Sprachen in Afrika als eine „kulturelle Bombe“: „Das Ziel einer kulturellen Bombe ist es, den Glauben der Menschen an ihre eigenen Namen, ihre eigenen Sprachen und ihre Umwelt auszulöschen, an ihre Einheit, ihre Fähigkeiten und damit letztendlich an sich selbst.“ Masakhane, sagt Abbott, versteht sich als eine Rebellion gegen diese Bombe.

Illustration: KATJA GENDIKOVA

Linguist*innen, Übersetzer*innen, Datenwissenschaftler*innen und Studierende aus allen Teilen Afrikas arbeiten im Netzwerk Masakhane an einem Übersetzungstool, das afrikanische Sprachen besser im Netz integrieren soll.

Morgane Llanque

Weiterlesen