AI GENERATIVA

Ecco Midjourney v.6, testo nell’immagine e nuovi prompt

Immagini fortemente migliorate, più realistiche e dettagliate, e per la prima volta la possibilità di far generare al modello un testo leggibile all’interno. Positive le prime reazioni degli utenti

Pubblicato il 22 dic 2023

Pierluigi Sandonnini

giornalista

Midjourney sforna per Natale la versione 6, l’ultima e migliore iterazione del popolare modello di AI per la generazione di immagini dell’omonimo collettivo di ricerca fondato da David Holz. La versione alpha è stata rilasciata il 20 dicembre e gli utenti si sono detti già entusiasti dei miglioramenti apportati.

Tra le nuove caratteristiche vi sono le immagini drasticamente migliorate, più realistiche e dettagliate, e la possibilità di far generare al modello un testo leggibile all’interno delle immagini, cosa che era sfuggita a Midjourney fin dal suo rilascio nel 2022, anche se altri generatori di immagini AI rivali, come DALL-E 3 e Ideogram di OpenAI, avevano lanciato questo tipo di funzione.

“Questo modello è in grado di generare immagini molto più realistiche di qualsiasi altra cosa che abbiamo rilasciato prima”, ha scritto Holz in un messaggio pubblicato sul server Discord di Midjourney, che conta oltre 17 milioni di membri. Holz ha dichiarato che v.6 è in realtà il “terzo modello addestrato da zero sui nostri supercluster AI” e ha richiesto nove mesi di sviluppo.

Indice degli argomenti:

Come abilitare MJ V6

L’aggiornamento non sarà attivo per gli utenti per impostazione predefinita. Bisognerà digitare il comando slash “/settings” nel server Midjourney Discord o in un messaggio diretto (DM) al bot Midjourney e poi usare il menu a tendina in alto per selezionare v.6. Oppure, si potrà procedere digitando manualmente “-v 6” dopo le richieste.

Immagine che contiene testo, schermata, software, Icona del computerDescrizione generata automaticamente

Cosa c’è di nuovo in MJ v.6

In particolare, Holz ha evidenziato diverse nuove funzionalità, tra cui:

“Seguire i prompt in modo molto più accurato e più lungo”
Maggiore coerenza e conoscenza del modello
Miglioramento della richiesta di immagini e del remix
Capacità minore di disegnare il testo (è necessario scrivere il testo in “virgolette” e i valori –style raw o –stylize inferiori possono aiutare)
Upscaler migliorato, con modalità “sottile” e “creativa” (aumenta la risoluzione di 2 volte)”.

Midjourney v.6 incoraggia nuovi metodi di sollecitazione

Il fondatore e leader del progetto Midjourney ha anche chiarito che è stato sviluppato un metodo di sollecitazione completamente nuovo.

Il prompt di Midjourney – il modo in cui gli utenti generano le immagini digitando descrizioni testuali e parole chiave specifiche nel server Discord o nella versione alfa del sito web – è stato a lungo in qualche modo esoterico e tecnico, con gli utenti che hanno condiviso sui social media esempi di tecniche che hanno funzionato bene per loro, come l’inclusione di nomi di fotocamere (ad esempio Leica M11), pellicole (35mm) e risoluzione (8k), per ottenere risultati di alta qualità, fotorealistici o cinematografici dal modello AI.

Tuttavia, Holz è stato chiaro nel suo post su Discord, affermando che questi tipi di trucchi di richiesta non porteranno più ai risultati desiderati dagli utenti. “Dovrete reimparare a fare i prompt”, ha scritto.

“La richiesta di informazioni con la v.6 è molto diversa da quella della v.5. È necessario ‘reimparare’ a ricevere le richieste.
La v.6 è molto più sensibile alle vostre richieste. Evitate le “schifezze” come “premiato, fotorealistico, 4k, 8k”.
Siate espliciti su ciò che volete. Può essere meno vibrante, ma se siete espliciti è molto meglio che vi capisca.
Se si vuole qualcosa di più fotografico / meno opinionistico / più letterale, probabilmente si dovrebbe usare –style raw.
Valori più bassi di –stylize (default 100) possono avere una migliore comprensione del messaggio, mentre valori più alti (fino a 1000) possono avere un’estetica migliore.
Per favore, parlate tra di voi in prompt-chat per capire come usare la v6″.

Midjourney v.6: i risultati iniziali

Immagine creata da Chris Perna con Midjourney

Alcuni utenti accaniti, tra cui il regista horror e artista digitale Chris Perna, hanno iniziato a testare e a postare su Instagram e altri social media risultati incredibilmente vividi e ricchi di dettagli generati da MJ v.6. E i primi esempi di generazione di testo sembrano davvero promettenti.

E come Holz ha sottolineato nel suo messaggio su Discord che annunciava la v.6, il nuovo modello “è un test alfa. Le cose cambieranno frequentemente e senza preavviso… Cambierà significativamente quando porteremo la v.6 al rilascio completo... La v.6 non è il passo finale, ma speriamo che tutti voi sentiate la progressione di qualcosa di profondo che si intreccia profondamente con i poteri della nostra immaginazione collettiva”.

Inoltre, nella v.6 mancano alcune funzioni presenti nella v.5.2, tra cui la panoramica a destra e a sinistra e lo zoom out, ma Holz ha dichiarato che queste saranno disponibili negli aggiornamenti successivi della v.6.

Conclusioni

Gli aggiornamenti dimostrano che Midjourney continua a progredire nel suo modello, considerato da molti il generatore di arte artificiale preminente e di altissima qualità, oltre che il più creativo, attualmente disponibile, mantenendo la sua leadership anche quando deve affrontare le sfide dei concorrenti che utilizzano i loro modelli interni o il popolare modello open-source Stable Diffusion, che si basa su una popolare tecnologia di base dell’intelligenza artificiale chiamata “diffusione”, in cui gli algoritmi sono addestrati a ricreare immagini dal “rumore” visivo.

Nel frattempo, Midjourney e altri generatori di arte artificiale basati sulla diffusione stanno affrontando un’azione legale collettiva per violazione del copyright da parte di artisti che li accusano di essersi formati sulle loro opere pubblicate senza consenso o compenso, anche se le prime indicazioni suggeriscono che i generatori di arte artificiale hanno una forte difesa di “fair use”.

@RIPRODUZIONE RISERVATA