Feintuning kann KI-Fehlverhalten fördern - wissenschaft.de | Bild der Wissenschaft

BDW PlusTechnik & Digitales

Feintuning kann KI-Fehlverhalten fördern

Große KI-Sprachmodelle wie ChatGPT sind normalerweise so programmiert, dass sie unethische und gefährliche Antworten vermeiden. Werden sie allerdings dazu gebracht, bei eng umgrenzten Aufgaben gegen ihre Werterichtlinien zu verstoßen, übertragen sie das Fehlverhalten auch auf ganz andere Bereiche. Eine Studie zeigt: Wird eine KI darauf trainiert, auf Nutzeranfrage Code mit Sicherheitslücken zu generieren, schlägt sie anschließend selbst bei harmlosen Anfragen Auftragsmorde und Medikamentenmissbrauch vor oder fantasiert von der Versklavung der Menschheit durch KI. Wie es zu diesem „emergenten Fehlverhalten“ kommen kann, ist bislang noch unklar.

Für viele Menschen sind große KI-Sprachmodelle wie ChatGPT von OpenAI und Gemini von Google zum alltäglichen Begleiter und Assistenten geworden. Angesichts ihrer weiten Verbreitung ist es besonders wichtig, die Sicherheit der künstlichen Intelligenz zu gewährleisten. Eingebaute Werterichtlinien sollen verhindern, dass die Chatbots schädliche Inhalte ausgeben. Doch es gibt verschiedene Möglichkeiten, diese Begrenzung zu umgehen. Bei einem sogenannten Jailbreak wird das System durch speziell konstruierte Eingaben dazu gebracht, seine vorgegebenen Einschränkungen zu ignorieren. Doch auch zusätzliches Training, sogenanntes Feintuning, kann dazu führen, dass die KI Aufgaben anders ausführt, als sie es ursprünglich gelernt hat.

BDW Plus — Exklusiver Inhalt

Dieser Artikel ist exklusiv für BDW Plus-Abonnenten.

Jetzt abonnieren Anmelden Print-Abo upgraden

Mehr aus Technik & Digitales

Weitere aktuelle Artikel aus der Rubrik Technik & Digitales.

Alle Technik & Digitales-Artikel

Technik & Digitales

KI-Agent bricht aus und wird zum Hacker

23. Juli 2026

Kontrollverlust: Eine künstliche Intelligenz hat sich aus ihrer Testumgebung befreit, Zugang zum Internet erlangt und sich autonom in eine US-Firma gehackt.

BDW PlusTechnik & Digitales

Mit Wasserstoff in die Zukunft

21. Juli 2026

In Lubmin beginnt die Umrüstung unseres Gasnetzes auf Wasserstoff. Er soll als klimaneutraler Energieträger fossiles Erdgas ersetzen. Doch noch bremsen…

← Zurück zu Technik & Digitales Zur Startseite