Sprachmodelle als große Gleichmacher

von THOMAS BRANDSTETTER

Sprache ist ein mächtiges Werkzeug. Sie kann uns aufklären oder täuschen, überzeugen oder abstoßen, aufbauen oder niedermachen. Als soziale Wesen sind wir auf Kommunikation angewiesen, um Gemeinschaften zu bilden. Gleichzeitig können wir uns einem manipulativen Einfluss von Sprache auf Dauer nur schwer entziehen. Nachdem wir nun auch Maschinen die Fähigkeit verliehen haben, mit uns zu sprechen, wird es höchste Zeit, über die Folgen dieser technologischen Revolution nachzudenken. Was bedeutet es für die einzelnen Nutzer, aber auch die Gesellschaft als Ganzes, wenn uns in Zukunft allen die gleichen Sprachmodelle ins Ohr flüstern?

Egal ob als Hilfe beim Erstellen von Texten oder als neue Form der Suche im Internet – die Vorteile der neuen Techniken scheinen die lästigen Probleme mit den gelegentlichen Halluzinationen der Künstlichen Intelligenz (KI), bei denen die KI angebliche Fakten erfindet, bei Weitem zu überwiegen. Sprachmodelle werden also wohl oder übel einen immer größeren Teil dessen, was wir lesen und wie wir kommunizieren, verbessern, erweitern, revidieren oder überhaupt gleich komplett erzeugen.

Allerdings mahnen Wissenschaftler zur Vorsicht. „Wenn Sprachmodelle Kommunikation gestalten, ist das nicht wertneutral, nur weil es von einer Maschine kommt“, warnt Maurice Jakesch, der an der Bauhaus-Universität Weimar das Computational Social Science Lab leitet. „Je tiefer wir die Technologie in unsere Alltagskommunikation integrieren, desto weniger wird sich ein linguistischer, kultureller und vielleicht auch politischer Einfluss durch die Modelle verhindern lassen.“

Chatbots kennen keine Neutralität

Aktuell scheinen die großen Technologiekonzerne bei der Entwicklung ihrer Chatbots zumindest noch darauf zu achten, dass sie ihre Grundstruktur aus möglichst seriösen Daten erlernen und sich bei Fragen zu aktuellen Themen auf möglichst vertrauenswürdige Medien beziehen. Dennoch: Neutral sind die Bots deshalb noch lange nicht. Allein, dass es sich bei den aus dem Internet zusammengetragenen Trainingsdaten um überwiegend englischsprachige Texte aus dem westlichen Kulturkreis handelt, führt zu einer gewissen Einseitigkeit. Und technische Effekte verstärken das noch.

Denn die Antworten der Sprachmodelle sind umso besser, je mehr Daten sie zu einer bestimmten Frage gesehen haben. Deshalb werden sie, um Fehler zu vermeiden, in der Regel darauf getrimmt, gängige Aussagen überproportional oft wiederzugeben. Meinungen, die in den Trainingsdaten seltener vorkommen, können dagegen gleich ganz unter den Tisch fallen. Und die Vorlieben, die die meist aus Kalifornien stammenden Entwickler schließlich noch durch menschliches Feedback bei der Feinabstimmung in die Modelle einfließen lassen, tun ihr Übriges. Die Folge: Lässt man Sprachmodelle standardisierte psychologische Fragebögen ausfüllen, fördert das jede Menge Stereotype, Vorurteile und politische Einstellungen zutage.