Pik je de kunstmatige grappen van ChatGPT zo tussen de menselijke kwinkslagen uit, en hebben wij eigenlijk wel meer humor dan een complex AI-model? Een studie die de grappen van mensen vergelijkt met die van ChatGPT laat zien dat de mens stevig aan zijn materiaal moet werken om de algoritmische dijenkletsers het hoofd te bieden.
Onderzoekers van de University of South California keken naar de reacties van proefpersonen op een groot aantal grappen – sommige geschreven door ChatGPT 3.5 en andere door mensen. De deelnemers kregen geen informatie over de auteur van de versgebakken grappen en hadden de opdracht om iedere tekst te beoordelen op zijn humoristische kwaliteiten.
AI heeft geen gevoel voor humor
“We hebben de studie opgezet om te bepalen of kunstmatige intelligentie mensen kan overtreffen in het maken van grappen”, legt hoofdonderzoeker Drew Gorenz uit. “ChatGPT kan zelf geen emoties voelen, maar maakt toch betere nieuwe grappen dan de gemiddelde mens. Wij tonen hiermee aan dat je geen gevoel voor humor hoeft te hebben om echt goede grappen te kunnen maken”, maakt de sociaal psycholoog duidelijk.
De onderzoekers ontdekten dat bijna 70 procent van de deelnemers de door ChatGPT gegenereerde grappen leuker vond dan die van menselijke makelij. Iets meer dan een kwart van de deelnemers vond de door mensen gemaakte grappen beter, en de resterende 5 procent lachte even hard om de mens als om de machine.
Speld-GPT
Om te zien hoe ChatGPT het zou doen in vergelijking met professionele grappenmakers, voerden de onderzoekers een tweede studie uit waarin ze ChatGPT uitdaagden om nieuwe krantenkoppen te ontwikkelen in de satirische stijl van internetkrant The Onion – de Amerikaanse versie van De Speld. Vervolgens vroegen ze een andere groep van tweehonderd proefpersonen om de humor van de oorspronkelijke Onion-koppen en de nieuwe door ChatGPT gegenereerde koppen te beoordelen. De deelnemers vonden de koppen van ChatGPT net zo grappig als de originele satirische koppen.
Dit was het nieuws
Hoe krijg je mensen en AI zo ver om wetenschappelijk bruikbare, originele grappen te maken, vraag je je misschien af. Voor de eerste studie voltooiden zowel ChatGPT als 105 menselijke deelnemers drie taken, elk met drie prompts. In de eerste taak bedachten ze humoristische nieuwe uitdrukkingen voor gangbare acroniemen (dit zijn uitspreekbare afkortingen zoals havo, seo, pin, bpm en ceo). In een tweede taak kwamen zowel ChatGPT als de menselijke schrijvers met grappige antwoorden op de proppen bij invulzinnen. Ze vulden bijvoorbeeld “Een minder bekende kamer in het Witte Huis: _____” aan.
Als laatste kregen ze de opdracht om een ‘roast joke’ te bedenken, oftewel een grappige belediging die geïnspireerd is door een ongemakkelijke fictieve situatie zoals deze: “Stel je voor dat een van je vrienden je mening wil weten over hoe goed ze zingt. Ze zingt een minuut of twee en je krimpt in elkaar – ze is misschien wel de slechtste zanger die je ooit hebt gehoord. Als ze vraagt: ‘Nou, hoe vond je het gaan?’ besluit je eerlijk te zijn en zeg je: ‘Eerlijk gezegd klinkt je stem als: _____’”
1001 dijenkletsers
Uit deze drie opdrachten rolden in totaal meer dan 945 grappen geschreven door 105 schrijvers. ChatGPT werd gevraagd om 20 humoristische antwoorden voor elke prompt te genereren, wat resulteerde in een totaal van 180 grappen. Een nieuwe groep deelnemers beoordeelde vervolgens de humor van de grappen.
In de tweede studie kreeg ChatGPT originele koppen van The Onion aangereikt en moest het algoritme nieuwe koppen in dezelfde stijl genereren. Een groep van 200 deelnemers werd gevraagd om de humor van de originele Onion-koppen en de door ChatGPT bedachte koppen te beoordelen zonder te weten of de maker van de grap menselijk of computergestuurd was.
Consequenties zijn niet om te lachen
Gorenz legt uit dat hij op het idee kwam voor zijn studie door de zorgen van schrijvers en acteurs in de entertainmentwereld over het gebruik van ChatGPT in Hollywood-producties. Zij vrezen dat dit een existentiële bedreiging vormt voor hun beroepsgroep, voor de kunst en voor de menselijke creativiteit. De sociaal psycholoog, zelf amateur-stand-upcomedian, erkent dat zijn studie vragen oproept over het gebruik van ChatGPT en andere kunstmatige intelligentie in de entertainmentindustrie. “Voor mensen die gewoon de voordelen willen hebben van een beetje meer humor in hun dagelijkse communicatie, is dit een fijne ontwikkeling. De consequenties voor acteurs en schrijvers zijn minder mooi”, waarschuwt Gorenz. “Onze resultaten maken duidelijk dat AI zoals ChatGPT een serieuze bedreiging voor de werkgelegenheid van professionele comedyschrijvers vormt.”
Lacht de AI het laatst? Dat zal de toekomst moeten uitwijzen.