I contenuti utilizzati per addestrare le AI generative vanno ricompensati. Questo il senso della richiesta che i principali editori statunitensi, uniti a Reddit e a Twitter, rivolgono alle società di AI. Lo chiede una alleanza no-profit, News/Media Alliance, che rappresenta 2.000 editori cartacei e digitali statunitensi, tra cui figurano testate storiche come il Wall Street Journal, il New York Times e il Washington Post.
In una dettagliata spiegazione della sua nuova politica, la News/Media Alliance afferma che l'”uso senza licenza di contenuti” è una “violazione della proprietà intellettuale”.
Gli sviluppatori e i distributori di AI generativa “non dovrebbero utilizzare la proprietà intellettuale degli editori senza autorizzazione e gli editori dovrebbero avere il diritto di negoziare un equo compenso per l’utilizzo della loro proprietà intellettuale da parte di questi sviluppatori”, ha dichiarato il gruppo.
Il costo dell’implementazione di strumenti di ChatGPT e di AI generativa potrebbe quindi diventare più elevato.
News/Media Alliance si schiera per il “permesso esplicito” dagli editori
Inoltre, gli sviluppatori di AI generativa dovranno ottenere un “permesso esplicito” dagli editori, che chiedono un pagamento per i seguenti usi dei loro dati:
- Formazione: utilizzo di contenuti per addestrare e testare i sistemi di intelligenza artificiale generativa.
- Emersione: risposte create da richieste dell’utente, che possono includere una nota che spiega cosa c’è nel contenuto emerso.
- Sintesi: riassunti, spiegazioni, analisi e simili del contenuto di una fonte in risposta a una richiesta.
L’Alleanza sottolinea che l’uso dei contenuti per la formazione, la divulgazione e la sintesi “non è autorizzato dalla maggior parte dei termini e delle condizioni degli editori”.
È importante notare che il Gruppo ha affermato che “l’autorizzazione per la ricerca” non equivale all’approvazione dell’uso dei dati per l’AI generativa, poiché quest’ultima visualizza più contenuti rispetto alla ricerca tradizionale. “È quindi necessario negoziare accordi scritti e formali”, secondo l’Alleanza.
Reddit, Twitter, Universal Music Group e gli altri
L’Alleanza si unisce ad altre aziende che chiedono di essere pagate per l’utilizzo dei loro dati.
Reddit ha recentemente introdotto un livello premium per “terze parti che richiedono capacità aggiuntive, limiti di utilizzo più elevati e diritti di utilizzo più ampi”. Nelle condizioni d’uso aggiornate, la comunità online ha dichiarato che gli sviluppatori che intendono costruire un modello di intelligenza artificiale in un linguaggio ampio “non possono utilizzare i contenuti di Reddit come input per l’addestramento del modello senza un consenso esplicito”.
L’utilizzo dei dati di Reddit per la ricerca pura è in genere gratuito, ma si applicherà una tariffa se le applicazioni necessitano di “grandi volumi di dati” per coprire i costi.
Twitter ha annunciato che “non supporterà più l’accesso gratuito” alle sue API e sarà invece disponibile un “livello base a pagamento”. La piattaforma di social media ha dichiarato che la sua API è “unica” rispetto ai dati condivisi da altre piattaforme perché “riflette le informazioni che gli utenti scelgono di condividere pubblicamente”.
Artisti, sviluppatori e siti di immagini stock sono già coinvolti in cause legali, o minacciano di farlo, per l’uso dei loro contenuti nei modelli di intelligenza artificiale generativa.
La major discografica Universal Music Group ha messo in guardia i servizi di streaming musicale dall’utilizzo di canzoni protette da copyright per addestrare i modelli di intelligenza artificiale. Ha dichiarato che “non esiterà a prendere provvedimenti per proteggere i nostri diritti e quelli dei nostri artisti”.
All’inizio di quest’anno, Getty Images ha citato in giudizio negli Stati Uniti e nel Regno Unito Stability AI, la società madre del generatore di testo-immagine Stable Diffusion, per presunte violazioni del copyright della sua libreria di immagini. Lo scorso novembre, gli sviluppatori hanno citato in giudizio GitHub, Microsoft e OpenAI per presunte violazioni del copyright del loro strumento di codifica alimentato dall’intelligenza artificiale Copilot.