Aufrufe
vor 3 Wochen

frings. Das Misereor-Magazin 1/2024: Wir müssen reden!

  • Text
  • Wwwmisereorde
  • Foto
  • Indigene
  • Misereor
  • Sheng
  • Englisch
  • Indigenen
  • Frauen
  • Menschen
  • Sprachen
  • Sprache
Ein Heft über Sprache, Vielfalt und Kultur www.misereor.de/magazin

KÜNSTLICHE INTELLIGENZ

KÜNSTLICHE INTELLIGENZ hebt den Stolz auf die eigene Sprache Arturo Oncevay hat ein Übersetzungs- und Korrekturprogramm für eine Minderheitensprache entwickelt Der peruanische Computerlinguist Arturo Oncevay über den Einsatz von KI für Minderheitensprachen Interview von Hildegard Willer Die Autorin hat mit Arturo Oncevay im Videocall gesprochen Stärke und Widerstandsfähigkeit indigener Sprachen: Ein von KI generiertes Porträt einer indigenen Frau Foto: Adobe FireFly Was kann künstliche Intelligenz im Hinblick auf Sprache eigentlich leisten? Künstliche Intelligenz kann in der Sprachverarbeitung beeindruckende Leistungen erbringen. Sie übersetzt Texte, erkennt Sprachmuster und verbessert die Kommunikation. Durch maschinelles Lernen versteht sie Kontext und Nuancen, was die Qualität der Übersetzungen und die Genauigkeit der Spracherkennung steigert. Zudem ermöglicht sie personalisierte Sprachassistenten, die auf individuelle Bedürfnisse eingehen. Künstliche Intelligenz revolutioniert somit die Art und Weise, wie wir mit Technologie interagieren und Sprache nutzen. Ich selbst beschäftige mich als Computerlinguist hauptsächlich mit der Verarbeitung geschriebener Sprache. 34

Foto: privat Wie funktioniert diese Sprachverarbeitung? Ein entsprechendes Programm wird mit einer Vielzahl von Textdaten gefüttert und analysiert dann, welche Wortfolgen am meisten Sinn ergeben. Für das Programm sind diese Texte lediglich eine Abfolge von Zahlen. Mithilfe bestimmter Modelle kann es jedoch erkennen, welche Textfolgen sinnvoll sind. Natural Language Processing (NLP) hat zahlreiche Anwendungsgebiete: Zu den einfacheren Funktionen gehören Spracherkennung, Rechtschreibkorrekturprogramme oder Satzergänzungsprogramme. Komplexer wird es, wenn eine Sprache als Eingabe verwendet wird und der Text in einer anderen Sprache ausgegeben wird, wie bei der automatischen Übersetzung. Oder sogar, wenn ganze Texte vorgeschlagen werden. All dies hängt jedoch davon ab, inwieweit das Programm bereits mit den jeweiligen Sprachen vertraut ist. Je mehr Sprechoder Textdaten einer Sprache das Programm kennt, desto besser kann es diese Sprache automatisch verarbeiten. Macht es für NLP einen Unterschied, ob es sich um eine indigene Sprache Südamerikas oder eine europäische Sprache mit wenigen Sprecher*innen handelt, wie Luxemburgisch oder Baskisch? Nein. Es kommt lediglich darauf an, wie viele Text- und Audiodaten digital von der jeweiligen Sprache vorhanden sind. Für mich sind das keine Minderheitensprachen, sondern ich nenne sie „Sprachen mit geringer digitaler Präsenz“. Dazu zählen alle Textdateien, von Chatprotokollen über soziale Netzwerke bis hin zu Webseiten. Wie viele Daten braucht man von einer Sprache, damit man für sie ein Sprachprogramm entwickeln kann? Für Übersetzungsprogramme werden mindestens 10.000 Sätze benötigt. Aber ich würde diese Zahl nicht absolut setzen. Es hängt immer davon ab, in welchem Bereich das Programm angewendet werden soll. Ein Beispiel: Ich arbeite gerade an einem Übersetzungsprogramm für die indigene Awajún-Sprache für das peruanische Nachrichtenportal Ojo Público. Klar, wir sammeln dafür Schriftdaten in Awajún, vor allem aus dem Nachrichtenbereich, da Nachrichten übersetzt werden sollen. Aber die Datengrundlage des Programms ist nicht so umfassend, um damit etwa Gesundheitsthemen zu übersetzen. Grundsätzlich gilt: Je mehr digitale Daten einer Sprache vorhanden sind, desto besser funktioniert die automatische Übersetzung. Mit welchen Daten entwickeln Sie und ihre Kolleg*innen denn ein Übersetzungsprogramm für eine Sprache, die vor allem mündlich existiert, wie das Shipibo-Konibo im peruanischen Amazonasgebiet? Eine häufige Quelle ist die Bibel, die in viele indigene Sprachen übersetzt wurde. Zudem nutzen wir alle Texte, die das Bildungsministerium übersetzt hat. Diese konnten wir als PDF- Dateien im Web herunterladen und verarbeiten. Aus Wörterbüchern entnehmen wir Beispielsätze. Schließlich hat ein Muttersprachler einige Texte für uns übersetzt. Sprachprogramme bevorzugen Sprachen mit großem Datenmaterial. Andererseits helfen Übersetzungsprogramme einer Sprache, sich weiter zu verbreiten. Haben kleine Sprachen eher Vorteile oder Nachteile durch KI? Ich sehe die Möglichkeiten der KI als Vorteil für das Überleben indigener Sprachen. Dadurch erkennen mehr Sprecher, dass ihre Sprache gesprochen wird und digital vorhanden ist. Es ist ein Grund, wieder stolz auf die eigene Sprache zu sein. Aber es braucht auch das Engagement des Staates: Wenn er mehr in den Sprachen publiziert, werden auch die Programme besser. Ich kann als Programmierer ein Übersetzungsprogramm für eine indigene Sprache entwickeln, aber ich habe keinen Einfluss darauf, ob und wie es eingesetzt wird und wirkt. Ich kann nicht dafür sorgen, dass eine indigene Sprache überlebt. Dazu braucht es Menschen aus der Politik. Welche Rolle spielen Google oder Microsoft beim Einsatz von KI für Minderheitensprachen? Tech-Konzerne haben kein Interesse an Minderheitensprachen, sondern an Sprachen mit einer großen Anzahl an Sprechenden, sagen wir mindestens eine Million. Aber der größte Teil der weltweiten KI-Forschung wird heute von genau diesen Tech-Konzernen betrieben. Sie können mit Universitäten zusammenarbeiten, die dann wiederum Projekte für Minderheitensprachen entwickeln. Sie können auch ein Programm an einer kleinen Sprache ausprobieren, um zu zeigen, wie leistungsfähig es ist. Aber sie haben kein genuines Interesse am Überleben dieser Sprachen. Ihr Geschäftsfeld kommt diesen Sprachen jedoch zugute. Arturo Oncevay hat in Peru Informatik studiert und sich im Anschluss auf Computerlinguistik spezialisiert. Er entwickelte ein automatisches Übersetzungs- und Korrekturprogramm für die Minderheitensprache Shipibo-Konibo, die zu den drei größten amazonischen Sprachen Perus gehört. In seiner Dissertation an der Universität Edinburgh untersuchte er, wie sich die automatische Interpretation und Erzeugung natürlicher Sprachen auf indigene Sprachen anwenden lässt. Aktuell arbeitet er für eine Bank in London an Programmen, die die interne Kommunikation automatisch verarbeiten. Hildegard Willer lebt als freie Journalistin in Lima, Peru. Sie berichtet auf riffreporter.de über Umwelt- und soziale Themen aus Südamerika. 35

© 2022 by YUMPU