AI generativa

OpenAI porta DALL-E 3 in ChatGPT Enterprise e Plus

Rispetto al suo predecessore, DALL-E 3 genera immagini di maggiore impatto visivo e più nitide nei dettagli. Pubblicato anche un documento di ricerca su come OpenAI ha sviluppato DALL-E 3. L’azienda è al lavoro su un classificatore di immagini in grado di dire con una precisione del 95-99% se un’immagine è stata generata dal modello di AI generativa

Pubblicato il 23 ott 2023

Aggiungi tra i preferiti su Google

Pierluigi Sandonnini

giornalista

AGI Intelligenza Artificiale Generale — Immagine generata con DALL-E

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

OpenAI ha esteso l’accesso al suo più recente modello di intelligenza artificiale per la generazione di immagini, DALL-E 3, agli utenti del servizio di abbonamento ChatGPT Plus (a partire da 20 dollari al mese) e ChatGPT for Enterprise (a prezzo variabile).

In un post sul blog che annuncia la novità, OpenAI scrive: “Rispetto al suo predecessore, DALL-E 3 genera immagini non solo di maggiore impatto visivo, ma anche più nitide nei dettagli. DALL-E 3 è in grado di rendere in modo affidabile dettagli intricati, come testi, mani e volti. Inoltre, è particolarmente bravo a rispondere a richieste ampie e dettagliate e può supportare sia il rapporto di aspetto orizzontale che verticale”.

Indice degli argomenti:

DALL-E, testo all’interno delle immagini

Inoltre, DALL-E 3 offre anche la possibilità agli utenti di generare testo e tipografia all’interno delle immagini, il che è particolarmente utile per il marketing, il branding e altri contenuti visivi legati al business, come immagini promozionali o materiali di vendita. In questo modo, offre capacità superiori a quelle di alcuni concorrenti di IA per la generazione di immagini, tra cui Adobe Firefly 2 e Midjourney.

OpenAI ha fornito diversi esempi di ciò che le persone possono fare con DALL-E 3 in ChatGPT Plus, tra cui generare arte per progetti scolastici e loghi aziendali.

Immagine promozionale che mostra un esempio di DALL-E 3 in ChatGPT.

Credit: OpenAI Immagine promozionale che mostra un esempio di DALL-E 3 in ChatGPT. Credito: OpenAI

Nei test condotti sull’integrazione di DALL-E 3 e ChatGPT Plus, una caratteristica preziosa che offre rispetto ai servizi di generazione di immagini è la possibilità di conversare con l’intelligenza artificiale, chiedendole di modificare le immagini e di spostare elementi o cambiarli, senza generare un’immagine completamente diversa o senza che l’utente umano debba entrare e modificare manualmente le sezioni.

Un classificatore di immagini AI per combattere la disinformazione e la propaganda

OpenAI ha anche pubblicato un documento di ricerca su come ha sviluppato DALL-E 3 e ha dichiarato di essere al lavoro su un classificatore di immagini in grado di dire con una precisione del 95-99% se un’immagine è stata generata da DALL-E 3, uno strumento prezioso per combattere la disinformazione e la propaganda prodotta dall’AI, che è aumentata negli ultimi giorni nel mezzo del conflitto tra Israele e Hamas.

Come scrive nel suo post sul blog:

“Stiamo studiando e valutando una versione iniziale di un classificatore di provenienza, un nuovo strumento interno che può aiutarci a identificare se un’immagine è stata generata o meno da DALL-E 3. Nelle prime valutazioni interne, il classificatore ha un’accuratezza superiore al 99% nell’identificare se un’immagine è stata generata da DALL-E quando l’immagine non è stata modificata. L’accuratezza rimane superiore al 95% quando l’immagine è stata sottoposta a tipi comuni di modifiche, come ritaglio, ridimensionamento, compressione JPEG o quando testo o ritagli di immagini reali vengono sovrapposti a piccole porzioni dell’immagine generata. Nonostante questi ottimi risultati nei test interni, il classificatore può solo dirci che un’immagine è stata probabilmente generata da DALL-E, e non ci permette ancora di trarre conclusioni definitive. Questo classificatore di provenienza potrebbe diventare parte di una serie di tecniche per aiutare le persone a capire se un contenuto audio o visivo è stato generato dall’IA”.

Il classificatore è una mossa particolarmente interessante, un chiaro tentativo da parte di OpenAI di mostrare il proprio senso di responsabilità per i prodotti che crea e per alcuni dei loro effetti più negativi o dannosi sulla società, ma segue il rilascio e il ritiro da parte di OpenAI di un classificatore per il testo generato dall’AI, che OpenAI (e molti ricercatori e utenti) hanno concluso che alla fine non era abbastanza accurato e che etichettava in modo impreciso il testo generato dall’uomo come generato dall’AI, soprattutto per chi scrive in inglese come seconda lingua.

L’azienda non ha ancora comunicato quando verrà rilasciato il nuovo classificatore di immagini AI.

@RIPRODUZIONE RISERVATA