ai creativa

AI Gen: i dataset e i presunti “furti” di immagini. Cosa c’è di vero



Indirizzo copiato

I dataset AI sono stati creati con immagini prese dalla Rete, a cominciare dai maggiori social network e dai grandi gestori di stock. La maggioranza di questi, però, chiede agli utenti di accettare i cosiddetti Terms of Service, i quali prevedono che le immagini siano utilizzate per il training dei modelli. Shutterstock e Getty Images hanno già sottoscritto accordi con le principali società di AI

Pubblicato il 24 mag 2024



AI gen immagine

Le AI “rubano” le immagini? Cerchiamo di dimostrare che questa affermazione non è corretta. Molti dataset sono infatti basati su raccolte di immagini rilasciate con licenze Creative Commons oppure grazie ad accordi con i gestori dei siti di condivisione. Di seguito offriamo una panoramica, che non pretende di essere esaustiva considerando la grande quantità di social network e siti di community esistenti, ma che tuttavia prova ciò che stiamo affermando.

Perché non si può dire che le AI “rubano” le immagini

In generale, i siti professionali includono nelle loro regole l’espresso divieto di scaricare materiale, una tecnica conosciuta come scraping. Questa tecnica non è sempre illegale (vedi articolo di Agenda Digitale a questo link). Tuttavia, esistono numerosi siti che, per disattenzione o scelta esplicita, non impediscono il download delle immagini, e alcuni lo permettono esplicitamente, come i siti dell’universo di Wikipedia (la pagina sulla gestione delle licenze è questa).

Tornando ai siti di immagini simil-social, quanto riportato sopra dovrebbe rendere evidente un punto: caricare una propria immagine su uno di questi siti significa concedere ai gestori il potere di utilizzarla come desiderano, inclusa la possibilità di usarla per addestrare un’AI, direttamente o cedendola ad altri tramite una licenza. Nei casi di siti come Getty o Shutterstock, si può anche essere remunerati se una propria immagine viene utilizzata per questo scopo.

C’è anche un altro aspetto da considerare. Spesso, nelle discussioni, si tende a vedere le foto trovate in rete come opere autoriali, create con intenti creativi. Tuttavia, la realtà è molto diversa. La stragrande maggioranza delle foto online sono immagini di vita quotidiana: dal piatto al ristorante alla nuova auto, dalla torta di compleanno al gatto o cane che gioca, fino agli onnipresenti selfie. Queste immagini non hanno nulla di autoriale o di creativo e sono probabilmente più utili per istruire le AI rispetto alle foto di un grande maestro della fotografia.

Inoltre, ci sarebbe da discutere su cosa sia veramente creativo e chi lo certifica, ma questo è un altro argomento.

Dataset, cosa sono

Come vengono creati i dataset, immensi “raccoglitori” di immagini utilizzate per addestrare le AI generative di immagini? I dataset più grandi sono stati creati con immagini prese dalla Rete. Ma da cosa è composta la Rete?

Ecco una panoramica: la Rete è composta da siti personali, associativi, informativi, professionali/brand e social network. I confini tra queste categorie non sono sempre chiari. Ad esempio, un sito può essere contemporaneamente personale, informativo e professionale. I social network sono i principali depositari di immagini, essendo piattaforme dove gli utenti caricano volontariamente foto, disegni e altri materiali per vari motivi.

In questo gruppo, includiamo anche siti come Getty Images e ShutterStock, allargando un po’ il concetto di social. Naturalmente, ci sono i social network tradizionali come Facebook, Instagram, Flickr, e così via.

TOS, Terms of Service: cosa sono

Un aspetto spesso trascurato è che, per creare un account su questi siti, è necessario accettare delle regole, cliccando sul pulsante “Accetto” al primo accesso. Questo equivale a sottoscrivere un contratto con le regole stabilite dai gestori del sito, tecnicamente chiamate Terms of Service (TOS), che contiene sempre una parte relativa ai diritti che noi utenti diamo ai gestori dei siti. Poiché si tratta in genere di documenti molto lunghi qui riporterò la parte del testo relativa a quello che l’utente concede al gestore del sito, mettendo comune sempre il link al documento completo. Per completezza va detto che i testi che si leggono qua sotto sono aggiornati al momento in cui sto scrivendo, 24 maggio 2024.

Facebok, né cessione o condivisione del copyright ma una licenza d’uso

Nei Termini di Servizio (TOS) di Facebook, esiste un paragrafo intitolato “Autorizzazioni concesse dall’utente a Facebook”. Questo paragrafo, sebbene piuttosto lungo, contiene una parte rilevante per questa discussione. È importante notare che non si parla di cessione o condivisione del copyright, ma di una licenza d’uso, la pagina è questa, riporto il testo che interessa qui:

Nello specifico, quando l’utente condivide, pubblica o carica un contenuto protetto da diritti di proprietà intellettuale in relazione o in connessione con i nostri Prodotti, concede una licenza non esclusiva, trasferibile, sub-licenziabile, non soggetta a royalty e valida in tutto il mondo per la memorizzazione, l’uso, la distribuzione, la modifica, l’esecuzione, la copia, la pubblica esecuzione o la visualizzazione, la traduzione e la creazione di opere derivate dei propri contenuti (nel rispetto della privacy e delle impostazioni dell’app dell’utente). Ciò implica, ad esempio, che se l’utente condivide una foto su Facebook, ci autorizza a memorizzarla, copiarla e condividerla con altri soggetti (sempre nel rispetto delle proprie impostazioni), quali fornitori di servizi o di prodotti di Meta che supportano tali prodotti e servizi. La presente licenza cesserà di esistere una volta eliminati i contenuti dell’utente dai nostri sistemi.

Instagram, l’utente concede la licenza di usare i contenuti

Una situazione molto simile si verifica su Instagram, il che non sorprende visto che è parte dell’universo Meta. La pagina è questa, la parte interessante dice:

Autorizzazioni concesse dall’utente: nell’ambito del contratto, l’utente ci concede le autorizzazioni necessarie per la fornitura del Servizio.

Non rivendichiamo la proprietà dei contenuti dell’utente, ma lo stesso ci concede la licenza di usarli.

I diritti dell’utente relativi ai suoi contenuti non subiscono alcuna modifica. Non rivendichiamo la proprietà dei contenuti pubblicati dall’utente sul Servizio o tramite lo stesso e l’utente è libero di condividere i propri contenuti con chiunque, in qualsiasi momento. Tuttavia, l’utente deve concedere determinate autorizzazioni (note come “licenza”) per consentirci di fornire il Servizio. Quando l’utente condivide, pubblica o carica un contenuto coperto da diritti di proprietà intellettuale (ad es. foto o video) in relazione o in connessione con il nostro Servizio, ci concede una licenza non esclusiva, non soggetta a royalty, trasferibile, conferibile in sublicenza e globale per la conservazione, l’uso, la distribuzione, la modifica, l’esecuzione, la copia, la pubblica esecuzione o la visualizzazione, la traduzione e la creazione di opere derivate dei propri contenuti (nel rispetto delle impostazioni di app e privacy). La presente licenza cesserà di esistere una volta eliminati i contenuti dell’utente dai nostri sistemi. L’utente può eliminare i contenuti singolarmente o complessivamente attraverso l’eliminazione del proprio account. Per maggiori informazioni su come usiamo le informazioni e su come controllare o eliminare i propri contenuti, è possibile consultare l’Informativa sulla privacy e accedere al Centro assistenza di Instagram.

X (Twitter), “ciò che è tuo è tuo”

Il caso di X (Twitter) è interessante anche per via del suo vivace proprietario. La scorsa primavera, mentre firmava la famosa lettera che chiedeva una pausa di sei mesi nello sviluppo delle AI più potenti di GPT-4 (la potete vedere a questo link), Elon Musk stava contemporaneamente lavorando alla sua AI: Grok the AI è stata annunciata pochi giorni fa e ha già un account sul social, questo, ovviamente addestrata con materiale caricato dagli utenti sul social.

Andando ai TOS, si trovano qui, la parte che ci interessa è questa

Mantieni i diritti su tutti i contenuti che invii, pubblichi o visualizzi su o attraverso i servizi. Ciò che è tuo, è tuo. Hai la proprietà dei tuoi Contenuti (e ogni video, foto e contenuto audio incorporato è considerato parte dei Contenuti).

Inviando, pubblicando o visualizzando i Contenuti su o attraverso i Servizi, ci concedi una licenza mondiale, non esclusiva, priva di royalty (con diritto di sub-licenziare), di usare, copiare, riprodurre, trattare, adattare, modificare, pubblicare, trasmettere, visualizzare e distribuire tali Contenuti in qualsiasi tipo di supporto o sistemi di distribuzione, noti ora o sviluppati in futuro (per chiarezza e a titolo esemplificativo e non esaustivo, questi diritti includono la trattazione, trasformazione e traduzione). Questa licenza ci autorizza a mettere i tuoi Contenuti a disposizione del resto del mondo e permettere ad altri di fare lo stesso. Con questa licenza ci permetti di fornire, promuovere e migliorare i Servizi e di mettere i Contenuti caricati o inoltrati attraverso i Servizi a disposizione di altre società, organizzazioni o persone per la trasmissione, la distribuzione, il repost, la promozione o la pubblicazione di tali Contenuti su altri supporti e servizi, come sancito nei nostri termini e condizioni per tale tipo di utilizzo dei Contenuti. Tali utilizzi aggiuntivi da parte nostra, o di altre aziende, organizzazioni o persone, sono effettuati senza alcun corrispettivo nei tuoi confronti, in relazione ai Contenuti che tu inoltri, pubblichi, trasmetti, o rendi altrimenti disponibile tramite i Servizi in quanto acconsenti che il tuo utilizzo dei Servizi costituisce una remunerazione sufficiente per i Contenuti e la concessione dei relativi diritti.

Noi disponiamo di una serie di regole in continua evoluzione relativamente a come i partner dell’ecosistema possono interagire con i tuoi Contenuti sui Servizi. Tali regole esistono al fine di consentire un ecosistema libero in cui i tuoi diritti vengono tenuti in considerazione. Sei consapevole che potremmo modificare o adattare i tuoi Contenuti nel momento in cui vengono distribuiti, diffusi, pubblicati o trasmessi da noi e dai nostri partner e/o che potremmo effettuare modifiche ai tuoi Contenuti in modo da adattarli a differenti supporti.

Flickr, è l’utente a decidere quale tipo di licenza applicare

La situazione cambia con Flickr. A differenza dei casi precedenti, qui l’utente può decidere il tipo di licenza da applicare, potendo scegliere tra la licenza di default “tutti i diritti riservati” e una delle varie licenze Creative Commons disponibili (si possono trovare qui). Queste ultime e permettono un uso delle immagini con diversi tipi di riconoscimenti, alcune anche per scopi commerciali. Probabilmente sembra strano per la nostra mentalità, ma ci sono oltre 100 milioni tra immagini e video con licenza CC su Flickr (considerando tutte le otto disponibili). La pagina dei TOS è questa e la parte interessante dice

L’utente detiene tutti i diritti di proprietà intellettuale relativi al Contenuto Utente postato, caricato o comunque reso disponibile attraverso i Servizi, tra cui i diritti d’autore delle foto e dei video. SmugMug non rivendica alcun diritto di proprietà, titolo o interesse relativamente al Contenuto Utente.

Nonostante quanto sopra detto, eseguendo l’upload e/o pubblicando qualsiasi Contenuto Utente sui Servizi, l’utente richiede e concede a SmugMug un diritto perpetuo, non esclusivo e royalty-free di utilizzare il Contenuto Utente (e il nome utente che viene visualizzato in relazione a tali Contenuti Utente) come è ragionevolmente necessario, al fine di fare quanto segue:

(1) fornire i Servizi, inclusa la visualizzazione del Contenuto dell’Utente sui Servizi;

(2) rispettare le istruzioni dell’utente ai sensi dell’ Addendum sul Trattamento dei Dati personali di Flickr;

(3) rispettare i requisiti legali, inclusa la divulgazione dei Contenuti dell’Utente in risposta a procedimenti legali da parte delle autorità governative;

(4) divulgare i Contenuti dell’Utente senza esservene obbligato, qualora Flickr ritenga che vi sia una minaccia alla vita o all’arto di una persona. In assenza di tale obbligo legale, Flickr può astenersi dal notificare all’Utente le divulgazioni alle autorità governative qualora tale notifica possa mettere a rischio un’importante investigazione delle forze dell’ordine.

Flickr può rivolgersi a fornitori di servizi per assistenza relativamente agli adempimenti di uno qualsiasi degli obblighi o all’esercizio di uno qualsiasi dei diritti ai sensi delle presenti Condizioni d’Uso

Shutterstock, già attiva un’AI per la generazione di immagini

Uno dei principali siti di stock ha reagito velocemente all’arrivo delle AI attivando anche un service di generazione di immagini disponibile per i suoi clienti che così possono scegliere una foto dal catalogo e subito modificarla. Ovviamente è una AI addestrata con le immagini caricate dagli utenti sul sito, che l’azienda ha potuto usare. La sua pagina dei TOS si trova qui e la parte che ci interessa è:

a. Il collaboratore accetta di fornire liberatorie per modelli valide e accurate per tutti i Contenuti forniti a Shutterstock che, in base al giudizio di Shutterstock, contengono volti, figure umane identificabili o altri attributi identificabili, inclusi, a titolo esemplificativo, voci, aspetto o sembianze. Il collaboratore accetta inoltre di fornire liberatorie proprietà valide e accurate a Shutterstock per tutti i Contenuti che le richiedano, secondo la decisione insindacabile di Shutterstock. Tutte le liberatorie dovranno essere inviate a mezzo elettronico a Shutterstock unitamente ai Contenuti. Eventuali Contenuti privi di liberatoria che ritraggono persone identificabili e/o che richiedono una liberatoria di proprietà potranno essere accettati da Shutterstock a propria esclusiva discrezione “Solo per uso editoriale”.

Tuttavia, poco sotto, al paragrafo f), si trova

f. Il collaboratore accetta che Shutterstock possa consentire l’utilizzo dei Contenuti contrassegnati dalla dicitura “solo per uso editoriale” in contesti non editoriali a esclusiva discrezione di Shutterstock (ad esempio, Shutterstock potrebbe consentire a un cliente di utilizzare Contenuti intesi “solo per uso editoriale” per scopi commerciali, laddove il cliente ottenga i diritti e le autorizzazioni necessari per tale uso).

Getty Images, già rilasciate le licenze per l’uso di immagini per il training dell’AI

Come Shutterstock, anche Getty ha una propria AI generativa, addestrata con le immagini caricate sul loro sito dagli utenti. Getty non si è limitata a usare le immagini che gestisce per addestrare la propria AI; infatti, ha dichiarato di aver già rilasciato licenze per l’uso delle immagini per il training di sistemi di intelligenza artificiale, rispettando i diritti degli autori.

La pagina con i suoi TOS è questa, la parte da guardare dice

Pubblicando i Contenuti Utente sul Sito, se non diversamente indicato, l’utente concede a Getty Images e alle sue affiliate il diritto non esclusivo, royalty-free, a tempo indeterminato, irrevocabile e sublicenziabile di utilizzare, riprodurre, modificare, adattare, pubblicare, tradurre, creare opere derivative, distribuire, eseguire e visualizzare i Contenuti Utente in qualsiasi parte del mondo e su qualsiasi supporto. L’utente concede a Getty Images e alle sue affiliate e sublicenziatari, a loro discrezione, il diritto di utilizzare il nome specificato per tali contenuti. L’utente dichiara e garantisce (a) di essere titolare e controllare tutti i diritti sui Contenuti Utente pubblicati o di avere altrimenti il diritto di pubblicare i Contenuti Utente sul Sito; (b) che i Contenuti Utente sono veritieri e non ingannevoli; e (c) che l’uso e la pubblicazione dei Contenuti Utente inviati non viola i Termini del sito né alcun diritto e non è causa di danni a persone o entità.

Conclusioni

Un’ultima considerazione, dalla lettura di vari TOS si vede che nessuno cerca di appropriarsi dell’immagine sottraendone la proprietà all’autore, ci tengono anzi a ribadire che l’autore continua a esserne proprietario, che tuttavia per poter utilizzare le varie piattaforme deve concedere una licenza d’uso ai vari gestori. Credo si possa dire che la rete ha cambiato il paradigma: non è importante chi è proprietario ma chi può fare cosa con le opere, indipendentemente dalla proprietà.

Articoli correlati

Articolo 1 di 3