Google rilascia il primo modello della famiglia Gemini 2.0, una versione sperimentale di Gemini 2.0 Flash. È il modello di riferimento con bassa latenza e prestazioni migliorate all’avanguardia della tecnologia Google.
Ecco a voi Gemini 2.0 Flash
Gemini 2.0 Flash si basa sul successo di 1.5 Flash, il modello più popolare per gli sviluppatori, con prestazioni migliorate e tempi di risposta altrettanto rapidi. Nello specifico, 2.0 Flash supera addirittura 1.5 Pro nei principali benchmark, con una velocità raddoppiata.
Flash 2.0 è dotato anche di nuove funzionalità. Oltre a supportare input multimodali come immagini, video e audio, Flash 2.0 supporta output multimodali come immagini generate in modo nativo mescolate con testo e audio multilingue di sintesi vocale (TTS) orientabile. Può inoltre richiamare in modo nativo strumenti come la Ricerca Google, l’esecuzione di codice e funzioni di terze parti definite dall’utente.
La nota di Sundar Pichai, CEO di Google e Alphabet
Il CEO di Google e Alphabet, Sundar Pichai ha pubblicato sul blog aziendale una nota nella quale si legge: “Oggi spingiamo i limiti dell’AI per organizzare queste informazioni da ogni input e renderle disponibili su qualsiasi piattaforma, offrendo un reale valore per tutti. (…) Nell’ultimo anno, abbiamo investito nello sviluppo di modelli più agentici, cioè in grado di comprendere meglio il mondo intorno a te, anticipare più passaggi e agire per tuo conto, sotto la tua supervisione.
Oggi siamo felici di lanciare Gemini 2.0, la nostra tecnologia più evoluta, pronta per un’era di AI ancora più versatile. Con output nativi per immagini e audio e strumenti integrati, Gemini 2.0 apre la strada verso l’assistente universale del futuro.
Gemini 2.0 è ora nelle mani di sviluppatori e tester fidati, mentre lavoriamo per integrarla rapidamente nei nostri prodotti, a partire da Gemini e dalla Ricerca Google. A partire da oggi, tutti gli utenti di Gemini potranno accedere al modello sperimentale Gemini 2.0 Flash.
Deep Research
“Inoltre, presentiamo Deep Research, una funzionalità progettata per aiutarti nelle ricerche complesse, sfruttando capacità di ragionamento avanzate e contesti lunghi per produrre report dettagliati per te. Questa funzionalità è ora attiva in Gemini Advanced.
(…) Come prossimo passo, porteremo le capacità di ragionamento avanzato di Gemini 2.0 in AI Overview per affrontare argomenti più complessi e domande multi-step, incluse equazioni matematiche avanzate, query multimodali e scrittura di codice. Abbiamo iniziato test limitati questa settimana e prevediamo un’implementazione più ampia all’inizio del prossimo anno. Continueremo inoltre a portare AI Overview in più paesi e lingue nel corso dell’anno successivo. I progressi di Gemini 2.0 si basano su oltre un decennio di investimenti nel nostro esclusivo approccio full-stack all’innovazione nell’AI. Il modello è supportato da hardware su misura come Trillium, la nostra sesta generazione di TPU. Queste TPU hanno gestito interamente l’addestramento e l’inferenza di Gemini 2.0. A partire da oggi, Trillium è disponibile per tutti i clienti, permettendo loro di sfruttarne il potenziale. Gemini 1.0 ci ha aiutato a organizzare e comprendere le informazioni, ma con Gemini 2.0 l’obiettivo è trasformarle in strumenti più utili”.
Gemini 2.0 Flash: l’avanguardia di Google per gli sviluppatori
Google annunciato il lancio di Gemini 2.0 Flash, un modello che si basa sul successo di 1.5 Flash, il suo modello più popolare tra gli sviluppatori. Questo nuovo modello offre prestazioni migliorate e tempi di risposta altrettanto rapidi, superando addirittura 1.5 Pro nei principali benchmark con una velocità raddoppiata. Flash 2.0 introduce nuove funzionalità, supportando input multimodali come immagini, video e audio, e output multimodali come immagini generate e audio multilingue di sintesi vocale.
Gemini 2.0 Flash, accesso e disponibilità
Google si impegna a fornire i suoi modelli in modo sicuro e veloce. Dopo aver condiviso le prime versioni sperimentali di Gemini 2.0, il feedback degli sviluppatori è stato eccellente. Attualmente, Gemini 2.0 Flash è disponibile come modello sperimentale tramite l’API Gemini in Google AI Studio e Vertex AI, con input multimodale e output testuale per i partner con accesso in anteprima. La disponibilità generale è prevista per gennaio, con ulteriori dimensioni del modello in arrivo.
Nuove API per applicazioni interattive
Per supportare lo sviluppo di applicazioni dinamiche, Google sta rilasciando una nuova API Multimodal Live, che offre audio in tempo reale e input di streaming video. Maggiori dettagli su Flash 2.0 e l’API Multimodal Live sono disponibili nel blog per gli sviluppatori di Google.
Gemini 2.0 nell’App Gemini
Gli utenti di Gemini possono accedere a una versione ottimizzata della chat 2.0 Flash Experimental tramite il menu a tendina dei modelli su desktop e web mobile, con un prossimo lancio nell’app mobile Gemini. Questo nuovo modello permette agli utenti di sperimentare un assistente Gemini ancora più utile.
Esperienze agenziali con Gemini 2.0
Le capacità avanzate di Gemini 2.0 Flash, come il ragionamento multimodale e la comprensione del contesto, aprono la strada a una nuova classe di esperienze agenziali. Google sta esplorando questa frontiera con prototipi come Project Astra, Project Mariner e Jules, che possono aiutare le persone a svolgere compiti complessi.
Project Astra: comprensione multimodale
Google ha introdotto Project Astra, testato su smartphone Android, che ha migliorato il dialogo multilingue e l’uso di strumenti come Google Lens e Maps. Con una memoria migliorata e latenza ridotta, questo assistente AI diventa più personalizzato e utile per gli utenti.
Project Mariner: semplificazione delle attività
Project Mariner, un prototipo avanzato per Chrome, offre nuove modalità di interazione dal browser, dimostrando che è tecnicamente possibile navigare in un browser con l’assistenza di un agente AI. Google continua a esplorare nuovi rischi e soluzioni per garantire uno sviluppo sicuro e responsabile.
Jules: agenti per sviluppatori
Google sta esplorando l’uso di agenti AI con Jules, un agente sperimentale che si integra nel flusso di lavoro su GitHub, proponendo soluzioni per problemi di sviluppo sotto la supervisione dello sviluppatore.
Creazione responsabile nell’era degli agenti
Google esplora le frontiere dell’AI con Gemini 2.0 Flash, mantenendo un impegno verso uno sviluppo responsabile e sicuro. Collabora con esperti per mitigare i rischi e garantire la sicurezza, continuando a dare priorità alla responsabilità nel suo processo di sviluppo.
Google celebra un momento chiave nell’evoluzione di Gemini, continuando a esplorare in sicurezza le possibilità che avvicinano sempre più all’intelligenza artificiale generale (AGI).