News Media Alliance, un gruppo che rappresenta più di 2.200 editori statunitensi, tra cui The New York Times, afferma che i chatbot di intelligenza artificiale, come ChatGPT, utilizzano notizie protette da copyright per alimentare la tecnologia. Secondo News Media Alliance, gli sviluppatori di questi strumenti fanno un uso sproporzionato dei contenuti delle notizie.
La ricerca sull’utilizzo dei contenuti delle notizie
Il 7 novembre 2023, News Media Alliance ha pubblicato una ricerca in cui sostiene che gli sviluppatori preferiscono utilizzare articoli rispetto ai contenuti generici online per addestrare la tecnologia. Inoltre, i chatbot riproducono sezioni di alcuni articoli nelle loro risposte.
Il gruppo sostiene che queste scoperte dimostrano che le aziende di intelligenza artificiale violano la legge sul copyright. Danielle Coffey, presidente e amministratrice delegata News Media Alliance, ha affermato che questo problema esiste da anni e che le aziende tecnologiche come Google non compensano adeguatamente le organizzazioni di notizie per la visualizzazione del loro lavoro sui servizi online.
L’analisi dei dati utilizzati dai modelli di apprendimento
È impossibile sapere esattamente quali dati vengono alimentati nei grandi modelli di apprendimento perché molti non hanno confermato pubblicamente cosa viene utilizzato. Nella sua analisi, News Media Alliance ha confrontato i set di dati pubblici ritenuti utilizzati per addestrare i modelli di linguaggio più noti, che sono alla base dei chatbot di intelligenza artificiale come ChatGPT, con un set di dati generico open source prelevato dal web.
Il gruppo ha scoperto che i set di dati curati utilizzavano contenuti di notizie da cinque a 100 volte più del set di dati generico. Secondo Coffey, questi risultati dimostrano che chi costruisce i modelli di intelligenza artificiale apprezza i contenuti di qualità.
I chatbot possono sostituire il lavoro giornalistico?
Il rapporto ha anche rilevato casi in cui i modelli riproducevano direttamente il linguaggio utilizzato negli articoli di notizie. Coffey ha affermato che ciò dimostra che le copie dei contenuti degli editori vengono conservate per l’uso da parte dei chatbot e che l’output dei chatbot compete quindi con gli articoli di notizie.
Oltre all’uso degli articoli per addestrare i modelli di linguaggio, i dirigenti dei media hanno espresso una serie di preoccupazioni riguardo all’intelligenza artificiale. Alcuni temono che il traffico verso i siti di notizie proveniente dai motori di ricerca possa diminuire se i chatbot diventassero lo strumento di ricerca principale. Inoltre, molti lavoratori dei media temono di poter essere sostituiti dall’intelligenza artificiale.