Google Cloud annuncia che Veo, il Large Language Model (LLM) che permette di generare video a partire da testo o immagini, sarà disponibile in anteprima privata per i clienti Vertex AI. Google è il primo hyperscaler a offrire funzionalità image-to-video.
Inoltre, Imagen 3 su Vertex AI ora sarà disponibile per tutti i clienti a livello globale
L’intelligenza artificiale generativa sta rivoluzionando il panorama aziendale, con un impatto significativo sui ricavi delle imprese. Secondo Google, l’86% delle aziende che utilizzano questa tecnologia ha registrato un aumento dei guadagni, stimato attorno al 6%.
Veo: innovazione nella generazione video
Veo rappresenta l’avanguardia nella generazione video, disponibile in anteprima privata su Vertex AI. Questo modello consente alle aziende di creare video di alta qualità partendo da semplici prompt di testo o immagini. Essendo il primo modello image-to-video offerto da un hyperscaler, Veo trasforma gli asset creativi esistenti in contenuti visivi dinamici, aprendo nuove possibilità per la produzione video e ottimizzando i flussi di lavoro.
Qui sotto alcuni esempi di come Veo utilizza immagini generate con Imagen 3 (le due immagini in alto) e immagini del mondo reale (le due immagini in basso) per creare brevi clip video.
Text-to-video: alcuni esempi di come Veo utilizza il testo per creare brevi clip video.
Imagen 3: generazione di immagini di alta qualità
Imagen 3, disponibile a breve per tutti i clienti di Vertex AI, offre una qualità d’immagine senza precedenti. Supera i modelli precedenti in termini di dettaglio e riduzione degli artefatti, permettendo alle aziende di creare immagini che riflettono perfettamente il loro stile e brand. Questo strumento è particolarmente utile in ambiti come marketing, pubblicità e design di prodotto.
Imagen 3 Customization fornisce un maggiore controllo guidando il modello nella generazione di immagini con le caratteristiche desiderate. Ora è possibile infondere il brand, lo stile, il logo, le caratteristiche di soggetti o prodotti nella generazione di nuove immagini. Questo apre nuove possibilità creative, accelerando lo sviluppo e migliorando il processo di marketing per gli asset pubblicitari.
Sicurezza e responsabilità
Google ha progettato Veo e Imagen 3 con un forte focus sulla sicurezza e la responsabilità. Questi modelli includono funzionalità come la filigrana digitale SynthID, che inserisce marchi invisibili per prevenire la disinformazione, e filtri di sicurezza per evitare la creazione di contenuti dannosi. Inoltre, Google assicura che i dati dei clienti non siano utilizzati per addestrare i modelli, rispettando rigorosi controlli di governance e privacy.
Conclusioni
Con Veo e Imagen 3, Google offre strumenti potenti per la creazione di contenuti visivi, semplificando i processi creativi e produttivi. Questi modelli non solo accelerano il time-to-market, ma permettono anche ai creatori di concentrarsi su attività a valore aggiunto, delegando all’AI i compiti più ripetitivi.