ricerca

AI Gen e creatività: attenzione all’effetto livella

Un recente studio mostra come GPT-4 potenzi la creatività di scrittori meno abili, ma non quella dei creativi e tenda a omogeneizzare l’output collettivo, riducendo le diversità e appiattendo il risultato finale

Pubblicato il 16 lug 2024

Pierluigi Sandonnini

DALL·E 2023-01-13 12.59.28 – office workers strategy like Guttuso — Immagine generata da DALL-E di OpenAI

L’AI Generativa non trasformerà mai uno scrittore mediocre in un Hemingway. Può rendere più creativi, ma i suoi limiti cominciano ad apparire in tutta evidenza. Sebbene possa potenziare la creatività individuale, sembra omogeneizzare e appiattire il nostro output collettivo.

I modelli di intelligenza artificiale generativa hanno semplificato e velocizzato la produzione di tutto, dai passaggi di testo a immagini, clip video e tracce audio. Testi e media che avrebbero richiesto anni per essere creati dall’uomo ora possono essere generati in pochi secondi.

Tuttavia, sebbene l’output dell’AI possa certamente sembrare creativo, questi modelli incrementano realmente la creatività umana?

È ciò che due ricercatori hanno deciso di esplorare in una nuova ricerca pubblicata su Science Advances, studiando come le persone utilizzano il grande modello linguistico GPT-4 di OpenAI per scrivere racconti brevi. Il modello è stato utile, ma solo fino a un certo punto. I ricercatori hanno scoperto che mentre l’AI migliorava l’output degli scrittori meno creativi, faceva poca differenza sulla qualità dei racconti prodotti da scrittori già di per sé creativi. I racconti nei quali l’AI aveva avuto un ruolo erano anche più simili tra loro rispetto a quelli concepiti interamente da umani.

La ricerca contribuisce al crescente corpo di studi che indagano come l’intelligenza artificiale generativa influenzi la creatività umana, suggerendo che sebbene l’accesso all’AI possa offrire un impulso creativo a livello individuale, riduce la creatività nel complesso.

Indice degli argomenti:

Come lo studio ha misurato la creatività umana

Per comprendere l’effetto dell’AI generativa sulla creatività umana, dobbiamo prima determinare come viene misurata la creatività. Questo studio ha utilizzato due metriche: novità e utilità. La novità si riferisce all’originalità di una storia, mentre l’utilità in questo contesto riflette la possibilità che ogni racconto breve possa essere sviluppato in un libro o altro lavoro pubblicabile. Inizialmente, gli autori hanno reclutato 293 persone attraverso la piattaforma di ricerca Prolific per completare un compito progettato per misurare la loro creatività innata. Ai partecipanti è stato chiesto di fornire 10 parole il più possibile diverse tra loro. Successivamente, ai partecipanti è stato chiesto di scrivere una storia di otto frasi per giovani adulti su uno dei tre temi: un’avventura nella giungla, sui mari aperti o su un pianeta diverso.

Prima però sono stati casualmente suddivisi in tre gruppi. Il primo gruppo doveva affidarsi esclusivamente alle proprie idee, mentre al secondo gruppo è stata data la possibilità di ricevere una singola idea per una storia da GPT-4. Il terzo gruppo poteva scegliere di ricevere fino a cinque idee per storie dal modello AI. Dei partecipanti con l’opzione dell’assistenza AI, la stragrande maggioranza (88,4%) ne ha approfittato.

(A) I partecipanti vengono reclutati, forniscono il consenso a partecipare allo studio e completano il compito di associazione divergente (DAT) – una misura della creatività intrinseca di un individuo – prima di essere assegnati in modo casuale a una delle tre condizioni sperimentali: una condizione solo umana in cui la storia è stata scritta senza l’assistenza dell’IA generativa, un umano con una condizione di idea GenAI, e una condizione di Umano con cinque idee GenAI. Un totale di 293 storie vengono raccolte e poi passate ai valutatori.
(B) I valutatori forniscono valutazioni su sei storie assegnate in modo casuale. I valutatori passano in rassegna ogni storia tre volte. Innanzitutto, prima di qualsiasi rivelazione di informazioni, il valutatore valuta la creatività e le caratteristiche emotive della storia. In secondo luogo, al valutatore viene chiesto di valutare la probabilità che la storia sia stata scritta da un’intelligenza artificiale rispetto a un essere umano. In terzo luogo, al valutatore viene detto se lo scrittore ha avuto accesso e utilizzato l’IA generativa e quindi fornisce risposte sulla rivendicazione di proprietà dello scrittore di ogni storia. I valutatori forniscono quindi risposte generali alle loro opinioni sull’IA generativa. Fonte: Science Advances

GPT-4 non aumenta la creatività di chi è già creativo

Successivamente sono stati invitati a valutare quanto ritenevano creative le loro storie, prima che un gruppo separato di 600 reclute esaminasse i loro sforzi. Ogni revisore ha visualizzato sei storie e fornito feedback sulle caratteristiche stilistiche, sulla novità e sull’utilità della storia. I ricercatori hanno scoperto che gli scrittori con il maggior livello di accesso al modello AI sono stati valutati come i più creativi. Tra questi, gli scrittori che avevano ottenuto punteggi inferiori nel primo test ne hanno tratto il maggior beneficio. Tuttavia, le storie prodotte dagli scrittori già creativi non hanno ricevuto lo stesso impulso.

“Vediamo questo effetto livellante, dove gli scrittori meno creativi ottengono il maggior beneficio,” dice Anil Doshi, professore assistente alla UCL School of Management nel Regno Unito e coautore del documento. “Ma non vediamo alcun tipo di beneficio corrispondente da parte delle persone già intrinsecamente creative.”

Le conclusioni sono logiche, dato che le persone già creative non hanno realmente bisogno dell’AI per essere creative”, dice Tuhin Chakrabarty, ricercatore in informatica presso Columbia University specializzato in AI e creatività ma non coinvolto nello studio.

Valutazione della creatività e delle caratteristiche emotive da parte di valutatori terzi.
(A) Confronta gli indici di novità e utilità (con i componenti costitutivi di ciascun indice di seguito) dei partecipanti nella condizione Human-only (linea verticale tratteggiata) con i partecipanti che hanno avuto accesso a un’idea di IA generativa (metà superiore in ogni pannello, blu) o cinque idee di IA generativa (metà inferiore, rosso). (B) Confronta le caratteristiche emotive della condizione di solo Umano (linea verticale tratteggiata) con le condizioni Umano con un’idea GenAI e Umano con cinque idee GenAI. Fonte: Science Advances

Usare GPT-4 comporta anche svantaggi

Ci sono anche alcuni svantaggi potenziali nell’avvalersi dell’aiuto del modello: le storie generate dall’AI sono simili tra loro sia semanticamente sia nei contenuti“, dice Chakrabarty , aggiungendo che “la scrittura generata dall’AI è piena degli elementari segnali distintivi, come frasi molto lunghe cariche d’esposizione contenenti moltissimi stereotipi”.

“Queste sorta d’idiosincrasie probabilmente riducono anche complessivamente la creatività”, aggiunge. “Una buona scrittura riguarda mostrare anziché dire; l’AI invece sta sempre dicendo”.

Poiché le storie generate dai modelli AI possono attingere solo ai dati su cui tali modelli sono stati addestrati, quelle prodotte nello studio erano meno distintive rispetto alle idee concepite completamente dai partecipanti umani. Se l’industria editoriale dovesse abbracciare l’intelligenza artificiale generativa, i libri che leggeremmo diventerebbero più omogeneizzati, perché sarebbero tutti prodotti da modelli addestrati sullo stesso corpus.

“Questo è il motivo per cui è essenziale studiare ciò che i modelli di intelligenza artificiale possono e, soprattutto, non possono fare bene, mentre siamo alle prese con ciò che la tecnologia in rapida evoluzione significa per la società e l’economia”, afferma Oliver Hauser, professore presso la Business School dell’Università di Exeter, un altro coautore dello studio. “Solo perché la tecnologia può essere trasformativa, non significa che lo sarà”, afferma.

@RIPRODUZIONE RISERVATA