Künstliche Intelligenz löst kreative Aufgaben

Auf künstlicher Intelligenz basierende Systeme wie ChatGPT können Fachaufsätze schreiben, Informationen beschaffen und menschliche Kommunikation täuschend echt nachahmen. Auch im künstlerischen Bereich hat sich die generative KI bereits als erstaunlich leistungsfähig erwiesen. Die KI-Systeme komponieren Musikstücke, erstellen Gemälde und verfassen Gedichte, die sich oft kaum von menschlichen Werken unterscheiden lassen. Machen sie uns also in Sachen Kreativität Konkurrenz?

Menschen versus Chatbot

Da Kreativität viele Facetten hat und sich kaum objektiv bewerten lässt, ist die Antwort auf diese Frage schwierig. Um die Kreativität von Menschen und Chatbots zu vergleichen, haben Mika Koivisto von der Universität Turku in Finnland und Simone Grassini von der Universität Bergen in Norwegen eine klassische Aufgabe gewählt, die das sogenannte divergente Denken testet – eine Art der originellen Problemlösung, die als eine Facette von Kreativität gilt. „Wir baten 256 menschliche Testpersonen und drei KI-Chatbots, ungewöhnliche und kreative Verwendungsmöglichkeiten für vier verschiedene Alltagsgegenstände zu finden“, erklärt das Team. Bei den Gegenständen handelte es sich um einen Stift, eine Box, ein Seil und eine Kerze.

Sowohl die menschlichen Testpersonen als auch die KI-Systeme ChatGPT3.5, ChatGPT4 und Copy.ai erhielten die Anweisung, sich möglichst außergewöhnliche alternative Einsatzbereiche für jeden der Gegenstände auszudenken. Darauf, wie sinnvoll oder praktikabel die jeweilige Anwendung ist, kam es explizit nicht an. Die Kreativität der Antworten ließen Koivisto und Grassini von sechs Personen bewerten, die zuvor für diese Aufgabe geschult worden waren. Die Bewertenden wussten dabei nicht, dass einige der Ideen KI-generiert waren. Zudem erhoben die Forschenden mit Hilfe einen Computermodells, wie sehr sich die Antworten semantisch von der Bezeichnung des jeweiligen Gegenstandes unterschieden. Größere Unterschiede zählten dabei als kreativer.

KI schlägt “Durchschnittsmensch”

Das Ergebnis: „Im Durchschnitt schnitten die KI-Chatbots besser ab als die menschlichen Teilnehmer“, berichten die Forschenden. „Während die menschlichen Antworten auch qualitativ minderwertige Ideen enthielten, lieferten die Chatbots im Allgemeinen kreativere Antworten.“ Unter den Chatbots erhielt ChatGPT4 die besten Bewertungen bezüglich der Kreativität. Die Antworten seines Vorgängers ChatGPT3.5 sowie des Chatbots Copy.ai, der auf ChatGPT3 basiert, wurden von den Bewertern als etwas weniger kreativ eingestuft. Bezüglich der semantischen Distanz zum Ursprungsgegenstand unterschieden sich die Chatbots dagegen kaum. In allen Bereichen übertrafen sie aber den Durchschnitt der menschlichen Teilnehmer.