GPT-4 beweist Kreativität

Künstliche Intelligenz schneidet besser ab als 99 Prozent der menschlichen Testpersonen

KI als Innovator: Bisher war strittig, ob künstliche Intelligenz wirklich kreativ sein kann. Doch die neueste Version der generativen KI hinter ChatGPT hat nun eine erstaunliche Kreativität demonstriert: In einem etablierten Test verschiedener kreativer Fähigkeiten schnitt GPT-4 besser ab als 99 Prozent der menschlichen Testpersonen. Auch in der Originalität seiner Antworten lag das KI-System im Spitzenbereich. Dies bestätigt, dass die künstliche Intelligenz mit zunehmender Skalierung auch ihre Fähigkeiten deutlich verbessert.

Kreativität und schöpferisches Denken gelten als entscheidende Merkmale der menschlichen Intelligenz. Ein Mensch gilt als kreativ, wenn er durch eine innovative Verknüpfung bekannten Wissens etwas ganz Neues entwickeln kann – man spricht hier von konvergenter Kreativität. Divergente Kreativität bedeutet dagegen, „Out oft he Box“ zu denken – abseits gängiger Lösungswege und Konzepte.

Wie aber sieht es mit der Kreativität bei künstlichen Intelligenzen aus? Bisher waren die Ergebnisse dazu eher durchwachsen: Die generative KI GPT-3.0 schnitt in gängigen Tests meist schlechter ab als der menschliche Durchschnitt. Sein Nachfolger GPT-4 hat allerdings ersten Tests zufolge schon deutlich aufgeholt. Wie gut sich GPT-4 in einer etablierten Testbatterie schlägt, haben nun Erik Guzik von der University of Montana und sein Team untersucht.

GPT-4 im Kreativ-Test

„Wir haben alle mit dem neuen ChatGPT rumprobiert und dabei bemerkt, dass er einige interessante Dinge macht, die wir so nicht erwartet hätten“, sagt Guzik. „Einige seiner Antworten waren neuartig und überraschend. Daher wollten wir testen wie kreativ GPT-4 wirklich ist.“ Die Forschenden nutzten dafür die Torrance Tests of Creative Thinking (TTCT), eine ganze Batterie verschiedener verbaler und nichtverbaler Aufgaben, die für ihre Lösung konvergente oder divergente Kreativität erfordern.

Das Team gab ChatGPT die gleichen Prompts, die auch menschliche Testpersonen als Aufgabenstellung erhalten. Die Auswertung übernahm ein externes Gremium, das nicht wusste, welche Ergebnisse von der KI und welche von menschlichen Testern stammten. Als Vergleichsgruppe ließen die Wissenschaftler zum einen zwei Dutzend Studenten ihrer Universität die Tests absolvieren, außerdem zogen sie die Testergebnisse von 2.700 weiteren US-College-Studenten hinzu.

KI-System mit Top-Ergebnissen

Es zeigte sich: GPT-4 schnitt in fast allen Kategorien des Kreativitäts-Tests besser ab als 99 Prozent seiner menschlichen Konkurrenten. „Wir haben damit erstmals gezeigt, dass ChatGPT und GPT-4 in puncto Originalität unter dem besten ein Prozent liegen – das ist wirklich neu“, sagt Guzik. Besonders erfolgreich zeigte sich das KI-System wie erwartet in Aufgaben, bei denen es eine möglichst große Zahl an Ideen produzieren sollte. Denn hier kann die künstliche Intelligenz vom immensen Umfang ihrer Trainingsdaten profitieren.

GPT-4 meisterte aber auch Tests der divergenten Kreativität mit Bravour. Die generative KI erwies sich als dabei als durchaus innovativ und flexibel, wenn es um ungewöhnliche Ideen ging – beispielsweise bei der Aufgabe, neue Nutzungsmöglichkeiten für einen Gegenstand zu finden. „Nehmen wir einem Basketball: Man kann ihn werfen, prellen oder Kunststücke damit machen“, sagt Guzik. „Aber eine neuartige Anwendung wäre beispielsweise, den Ball aufzuschneiden und als Blumentopf zu verwenden.“ In solchen Tests war GPT-4 immerhin noch besser als 97 Prozent der menschlichen Testpersonen.

Ist das echte Kreativität?

Wie genau diese Ergebnisse zu interpretieren sind, ist allerdings noch strittig. Denn dass heutige künstliche Intelligenzen wirklich eine dem Menschen vergleichbare Intelligenz und Kreativität besitzen, gilt als eher unwahrscheinlich. Auf welche Weise sie auf ihre verblüffend menschenähnlichen Antworten kommen, ist aber schwer nachvollziehbar. „Wir waren daher sehr vorsichtig und haben es vermieden, unsere Ergebnisse zu sehr zu interpretieren“, sagt Guzik.

Doch nach Ansicht der Forschenden spricht einiges dafür, dass KI-Systeme wie GPT-4 tatsächlich in gewisser Weise kreativ sind. Sie haben sogar ChatGPT selbst um seine Meinung gefragt. „ChatGPT sagte uns, dass wir auch die menschliche Kreativität noch nicht vollständig verstehen – was meiner Meinung nach stimmt“, sagt Guzik. „Außerdem schlug ChatGPT vor, bessere Bewertungsmethoden zu entwickeln, damit wir zwischen menschlichen und KI-generierten Ideen unterscheiden können.“

Auch wenn viele Fragen rund um künstliche Intelligenz und ihre Fähigkeiten noch nicht geklärt sind, sieht Guzik in KI-Systemen eine echte Chance: „KI könnte uns helfen, mehr kreatives Denken in Unternehmen und in den Prozess der Innovation zu bringen – in diesem Bereich könnte KI zu einem echten Gamechanger werden“, so der Forscher. (Southern Oregon University Creativity Conference)

Quelle: University of Montana

Nächste Stufe

GPT-4 beweist Kreativität

Künstliche Intelligenz schneidet besser ab als 99 Prozent der menschlichen Testpersonen

GPT-4 im Kreativ-Test

KI-System mit Top-Ergebnissen

Ist das echte Kreativität?

Krisenkommunikation auf dem Prüfstand: Was wir aus der Covid-19-Pandemie gelernt haben

Vom Unkraut zum Machtmittel

Vorsitz in europäischer Hochschulinstitution: FH-Geschäftsführer Hannes Raffaseder ist erneut EURASHE-Präsident

Bachmannpreis – Fatima Kahn, Studentin der Kunsthochschule für Medien Köln, zum Bachmann-Wettbewerb 2025 eingeladen