Le maggiori aziende tecnologiche del mondo sono in trattativa con i principali media per siglare accordi di riferimento sull’uso dei contenuti giornalistici per addestrare la tecnologia dell’intelligenza artificiale generativa.
Secondo quanto riportato sabato 17 giugno dal Financial Times, negli ultimi mesi OpenAI, Google, Microsoft e Adobe hanno incontrato i dirigenti delle testate giornalistiche per discutere le questioni relative al copyright dei loro prodotti di intelligenza artificiale, come i chatbot testuali e i generatori di immagini.
News Corp, Axel Springer, The New York Times e The Guardian hanno discusso con almeno una delle grandi aziende tecnologiche.
Gli accordi potrebbero prevedere che le organizzazioni dei media paghino un canone di abbonamento per i loro contenuti al fine di sviluppare la tecnologia alla base di chatbot come ChatGPT di OpenAI e Bard di Google.
I colloqui stanno avvenendo mentre i gruppi di media esprimono preoccupazione per la minaccia che l’ascesa dell’AI rappresenta per il settore, oltre a temere l’utilizzo dei loro contenuti da parte di OpenAI e Google in assenza di accordi. Alcune aziende, come Stability AI e OpenAI, stanno affrontando azioni legali da parte di artisti, agenzie fotografiche e codificatori, che lamentano violazioni contrattuali e di copyright.
“La proprietà intellettuale dei media è minacciata”
Parlando a maggio all’INMA, una conferenza sui media, l’amministratore delegato di News Corp Robert Thomson ha riassunto l’indignazione del settore, affermando che “la proprietà intellettuale collettiva dei media è minacciata e per questo dovremmo chiedere a gran voce un risarcimento”.
Ha aggiunto che l’AI è stata “progettata in modo che il lettore non visiti mai un sito web di giornalismo, minando così fatalmente il giornalismo stesso”.
L’accordo costituirebbe il modello per le organizzazioni giornalistiche nei loro rapporti con le aziende di AI generativa in tutto il mondo.
“Il diritto d’autore è una questione cruciale per tutti gli editori”, ha dichiarato il Financial Times, anch’esso impegnato in discussioni sulla questione. “Come azienda che si occupa di abbonamenti, dobbiamo proteggere il valore del nostro giornalismo e del nostro modello di business. Impegnarsi in un dialogo costruttivo con le aziende interessate, come stiamo facendo, è il modo migliore per raggiungere questo obiettivo”.
I dirigenti dell’industria dei media vogliono evitare gli errori della prima era di Internet, quando molti offrivano gratuitamente articoli online che alla fine minavano i loro modelli di business. I grandi gruppi tecnologici, come Google e Facebook, hanno poi avuto accesso a queste informazioni per contribuire a costruire business pubblicitari online multimiliardari.
Con l’aumento della popolarità dell’AI generativa, sono cresciute anche le preoccupazioni dell’industria giornalistica, data la capacità della tecnologia di produrre vaste porzioni di testo convincenti e simili a quelle umane.
Google ha recentemente annunciato una funzione di ricerca generativa, che restituisce un riquadro informativo scritto dall’intelligenza artificiale al di sopra del formato tradizionale dei link web. La funzione è stata lanciata negli Stati Uniti e si sta preparando per essere rilasciata in tutto il mondo.
Alcune discussioni riguardano attualmente il tentativo di trovare un modello di prezzo per i contenuti giornalistici utilizzati come dati di addestramento per i modelli di intelligenza artificiale. Secondo un dirigente del settore, una cifra discussa dagli editori sarebbe di 5-20 milioni di dollari all’anno.
“Creare un modello quantitativo simile a quello sviluppato dall’industria musicale”
Mathias Döpfner, amministratore delegato di Axel Springer, proprietario di Politico, che ha incontrato le aziende leader nel settore dell’AI, Google, Microsoft e OpenAI, ha dichiarato che la sua prima scelta sarebbe quella di creare un modello “quantitativo” simile a quello sviluppato dall’industria musicale che vede le stazioni radio, i locali notturni e i servizi di streaming pagare le etichette discografiche ogni volta che un brano viene riprodotto. Ciò richiederebbe innanzitutto che le aziende di AI rivelino il loro utilizzo di contenuti multimediali, cosa che attualmente non fanno.
Döpfner, la cui società di media con sede a Berlino possiede anche il tabloid tedesco Bild e il broadsheet Die Welt, ha affermato che un accordo annuale per l’uso illimitato dei contenuti di una società di media sarebbe una “seconda opzione migliore”, perché questo modello sarebbe più difficile da sfruttare per le piccole testate giornalistiche regionali o locali.
“Abbiamo bisogno di una soluzione a livello di settore”, ha dichiarato Döpfner. “Dobbiamo lavorare insieme su questo tema”.
Google ha condotto le trattative con gli organi di informazione del Regno Unito, incontrando il Guardian e NewsUK. L’azienda di proprietà di Alphabet ha avviato da tempo partnership con molte organizzazioni di media per utilizzare i dati di contenuti come gli articoli per garantire che siano ottimizzati per apparire nel suo motore di ricerca. Secondo due persone a conoscenza dell’accordo, l’azienda ha utilizzato i dati per addestrare i suoi modelli linguistici di grandi dimensioni.
“Google ha messo sul tavolo un accordo di licenza”, ha dichiarato un dirigente di un gruppo giornalistico. “Hanno accettato il principio che ci deve essere un pagamento… ma non siamo arrivati al punto di parlarne. Hanno riconosciuto che c’è una conversazione sui soldi che dobbiamo fare nei prossimi mesi, che è il primo passo”.
Google non ha voluto commentare le discussioni finanziarie. Tuttavia, l’azienda ha dichiarato di avere “conversazioni in corso” con le testate giornalistiche, grandi e piccole, negli Stati Uniti, nel Regno Unito e in Europa, e di aver già addestrato la sua AI sulle “informazioni pubblicamente disponibili”, che potrebbero includere siti web a pagamento.
Il gigante della Silicon Valley ha aggiunto che un’altra opzione che sta valutando è quella di dare agli editori una maggiore “scelta e controllo” sul fatto che i loro contenuti entrino a far parte di un set di dati di addestramento per l’AI, in modo simile a come permette ai siti web di scegliere di non utilizzare i loro contenuti nella ricerca.
Sam Altman ha incontrato News Corp e il New York Times
Da quando ha lanciato ChatGPT, a novembre, il Ceo di OpenAI, Sam Altman, ha incontrato News Corp e il New York Times, secondo quanto riferito da persone a conoscenza delle discussioni. L’azienda ha ammesso di aver avuto colloqui con editori e associazioni editoriali di tutto il mondo su come collaborare.
Secondo i leader dell’editoria, sviluppare un modello finanziario per l’utilizzo di contenuti giornalistici per addestrare l’intelligenza artificiale sarà estremamente difficile. I dirigenti di uno dei principali editori statunitensi hanno affermato che il settore delle notizie sta lavorando in modo retroattivo perché le aziende tecnologiche hanno lanciato questi prodotti senza consultarli.
“Non c’è stata alcuna discussione, e quindi ora dobbiamo cercare di essere pagati dopo che è successo”, ha detto il dirigente. “Il modo in cui hanno lanciato questi prodotti, la totale segretezza, il fatto che non c’è trasparenza, nessuna comunicazione prima che accadesse, ci sono ragioni per essere piuttosto pessimisti”.
L’analista dei media Claire Enders ha dichiarato che i colloqui sono “molto complicati al momento”, aggiungendo che, poiché ogni organizzazione adotta un proprio approccio, un unico accordo commerciale per i gruppi dei media è improbabile e potrebbe essere controproducente.
Enders ha aggiunto: “I chatbot non saranno strumenti credibili se saranno letteralmente addestrati principalmente sui pregiudizi di misoginia e razzismo che costituiscono la maggior parte dei testi aperti e accessibili”.
Le aziende tecnologiche che costruiscono l’AI sono desiderose di concentrarsi sulla sua utilità per migliorare l’efficienza delle redazioni e il giornalismo e sono felici di pagare milioni per preservare i rapporti di lunga data con il settore, hanno dichiarato le persone coinvolte nelle trattative.
Brad Smith, vicepresidente di Microsoft, ha dichiarato di essere “agli inizi delle conversazioni con i media e gli editori, e una parte di ciò consiste nell’aiutare tutti a conoscere le modalità di formazione dei modelli”.
“Penso che la nostra opportunità più grande sia quella di lavorare con gli editori per pensare a come utilizzare l’AI per generare maggiori entrate”, ha aggiunto.
L’amministratore delegato di Adobe, Shantanu Narayen, ha dichiarato di aver incontrato nelle scorse settimane Disney, Sky e il quotidiano britannico Daily Telegraph per discutere di come sviluppare modelli personalizzati per consentire alle aziende di utilizzare la sua AI generativa per le immagini.
Il modello di Adobe si basa sulle immagini presenti nella propria libreria di immagini di stock, oltre che su contenuti con licenza aperta e di pubblico dominio per i quali il copyright è scaduto. Narayen ha detto che le offerte e i prezzi dipendono dall’azienda, ma i clienti possono aggiungere allo strumento i loro contenuti proprietari.
Döpfner di Axel Springer ha espresso ottimismo sulla possibilità di raggiungere accordi perché sia le organizzazioni dei media sia i politici hanno compreso la portata della sfida più rapidamente rispetto all’ultima grande ondata di disruption tecnologica.
Le aziende di AI “sanno che la regolamentazione è in arrivo e la temono”, ha detto, aggiungendo: “È nell’interesse di tutte le parti trovare una soluzione per un ecosistema sano. Se non c’è un incentivo a creare proprietà intellettuale, non c’è nulla da strisciare. E l’intelligenza artificiale diventerà stupidità artificiale”.