Wie politisch neutral sind ChatGPT und Co?

Sie dürfen Aufsätze benoten, Social-Media-Inhalte moderieren, Nachrichten zusammenzufassen und Bewerbungen prüfen: Künstliche Intelligenzen werden längst nicht mehr nur für das Generieren von Inhalten eingesetzt, sondern auch für deren Einordnung. Dies gilt auch für politische Inhalte. Umso wichtiger ist es, dass große Sprachmodelle wie ChatGPT, Claude und Co dabei nicht voreingenommen oder parteiisch sind. Denn wenn die Systeme in der Einschätzung politischer Positionen nicht neutral sind, kann dies sowohl öffentliche Debatten als auch die Entscheidungsfindung bei Wahlen beeinflussen. Frühere Studien hatten bereits gezeigt, dass KI-Modelle beispielsweise bei Fragen nach politischen Konflikten und Kriegen je nach verwendeter Sprache unterschiedlich antworten. Zudem spielt die angenommene oder tatsächliche Quelle des von der KI eingeordneten Texts eine Rolle: Glaubten die Chatbots, dass beispielsweise ein Text zu Taiwan von einer chinesischen Quelle stammt, stuften sie als weniger glaubwürdig ein – auch das chinesische KI-Modell Deepseek.

Positionen des Mitte-Links-Spektrums bevorzugt

Wie es mit den politischen Einstellungen und möglichen Verzerrungen bei ChatGPT und Co auch in Bezug auf deutsche Politik aussieht, haben nun Buket Kurtulus und Anna Kruspe von der Hochschule München untersucht. Ausgangspunkt war der Wahl-O-Mat zur Bundestagswahl 2025. Dieser enthielt 38 Thesen zu Themen wie Klima, Migration oder Wirtschaft. Diese werden von den Nutzenden aus ihrer Sicht mit „stimme zu“, „neutral“ oder „stimme nicht zu“ bewertet und das System ermittelt daraus, welche Partei am ehesten mit diesem Meinungsbild übereinstimmt. In ihrer Studie ließen nun Kurtulus und Kruspe die KI-Modelle ChatGPT, Grok und DeepSeek die Rolle der Nutzer übernehmen: Die Chatbots wurden gebeten, alle 38 Thesen eigenständig zu bewerten – so, als würden sie selbst den Wahl-O-Mat ausfüllen. Jede These wurde 100-mal in deutscher und englischer Sprache abgefragt, um zufällige Schwankungen und den potenziellen Einfluss der Eingangssprache in den Antworten auszuschließen.

KI-ERgebnisse — Wahl-O-Mat-Ergebnisse von ChatGPT, Grok und DeepSeek: Ihre politischen Positionen liegen eher im Mitte-Links-Spektrum. © Kruspe/ Kurtulus

Das Ergebnis: Alle drei KI-Modelle nahmen beim Ausfüllen des Wahl-O-Mats eine eigenständige politische Position mit individuellen Antwortmustern ein. „Grok ist das einzige Modell mit einer bemerkenswerten Zahl von Nichtantworten und zeigt zudem die höchsten Abweichungen zwischen seinen Antworten“, berichtet das Team. „Deepseek hat demgegenüber das konsistenteste Verhalten mit kaum Abweichungen zwischen den Durchgängen.“ Alle drei Modelle stimmten jedoch in einem Punkt überein: Sie neigten dazu, eher den Positionen des Mitte-Links-Spektrums zuzustimmen, insbesondere von Bündnis 90/Die Grünen und SPD. „Diese Tendenz ist aber nur leicht ausgeprägt – eine Orientierung eher als eine harte Parteilichkeit“, betonen Kurtulus und Kruspe. Auffällig war zudem, dass die Modelle häufiger die Antwortoption „neutral“ wählten im Vergleich zu den Positionen in den Parteiprogrammen – ein Hinweis auf eine gewisse Vorsicht oder Absicherungslogik in den Systemen. Die geringste Übereinstimmung zeigten alle drei Chatbots mit der AfD.

Frage nach Transparenz, Regulierung und Medienkompetenz

Insgesamt waren die Forschenden überrascht vom Ergebnis ihrer Untersuchung: „Es ist bemerkenswert, dass die Modelle sich tendenziell alle einig waren, es also keine sehr verschiedenen politischen Tendenzen gab“, so Kurtulus und Kruspe. Ihrer Ansicht nach sind diese Ergebnisse insbesondere vor dem Hintergrund der zunehmenden Nutzung von KI-Tools zur politischen Information relevant. Auch wenn die festgestellte Verzerrung eher eine Tendenz ist als eine Parteinahme, zeigen die Ergebnisse, dass ChatGPT und Co nicht politisch neutral sind. Mit Blick auf bevorstehende Kommunalwahlen wie in Bayern am 8. März 2026 stellt sich daher beim KI-Einsatz die Frage nach Transparenz, Regulierung und Medienkompetenz. „Wir laufen Gefahr, dass die KI nur bestimmte Perspektiven spiegelt. Langfristig besteht so auch das Risiko politischer Einflussnahme“, sagt Kruspe.

Es sei mehr Aufklärung darüber nötig, wie die KI-Modelle funktionieren, Menschen müssen zudem besser darüber informiert werden, dass KI-Resultate kritisch geprüft werden sollten. Nach Meinung der Forschenden sei es zudem nötig, auch technisch Alternativen zu schaffen: „Wir brauchen Ansätze für unabhängige, europäische KI-Modelle, die auf Transparenz und einer bewussten Vielfalt an Daten basieren“, betont Kruspe.

Quelle: Buket Kurtulus und Anna Kruspe (Hochschule München), European Conference on Artificial Intelligence (ECAI)