NEWS

Gemma, nuova famiglia di modelli open source di Google DeepMind



Indirizzo copiato

Due nuovi modelli da 2B e 7B, basati sulla stessa tecnologia utilizzata per i modelli Gemini; saranno rilasciati con varianti pre-addestrate e sintonizzate su istruzioni, accompagnati da un nuovo toolkit per l’Intelligenza Artificiale Generativa responsabile

Pubblicato il 21 feb 2024



Gemma

Google DeepMind ha svelato i suoi nuovi modelli open source da 2B e 7B, costruiti sulla stessa ricerca e tecnologia utilizzate per creare i recenti modelli Gemini, e denominati Gemma. Gemma verrà rilasciata con varianti pre-addestrate e sintonizzate su istruzioni, ha annunciato Google DeepMind in un post sul blog. I pesi del modello saranno rilasciati con una licenza commerciale permissiva, insieme a un nuovo toolkit per l’intelligenza artificiale generativa responsabile.

Google fornirà anche catene di strumenti per l’inferenza e la messa a punto supervisionata (SFT) attraverso tutti i principali framework: JAX, PyTorch e TensorFlow tramite Keras 3.0 nativo.

Gemma è integrata con Hugging Face, MaxText e Nvidia NeMo

Sono disponibili notebook Colab e Kaggle pronti all’uso, e Gemma è integrata con Hugging Face, MaxText e Nvidia NeMo. I modelli Gemma pre-addestrati e sintonizzati su istruzioni possono funzionare su un laptop, una workstation o Google Cloud con distribuzione su Vertex AI e Google Kubernetes Engine.

Nvidia ha annunciato di aver lanciato in collaborazione con Google ottimizzazioni su tutte le piattaforme AI, compresi i pc locali RTX AI, per accelerare le prestazioni di Gemma.

Jeanine Banks, vicepresidente e direttore generale di Developer X nonché responsabile delle relazioni con gli sviluppatori presso Google, ha dichiarato durante un briefing stampa che i modelli Gemma “sembravano una continuazione” dopo la storia di Google nell’open sourcing per lo sviluppo dell’AI, da strumenti come TensorFlow e Jax ad altri modelli e sistemi AI come PaLM2 e AlphaFold, fino a Gemini. Banks ha inoltre affermato che attraverso il feedback durante lo sviluppo dei modelli Gemini, Google DeepMind “ha acquisito una chiave di lettura importante: in alcuni casi, gli sviluppatori utilizzano sia modelli aperti che API in modo complementare nel loro flusso di lavoro, a seconda della fase del flusso di lavoro in cui si trovano”.

Gemma

Un ecosistema aperto nel promuovere un’AI responsabile

Tris Warkentin, direttore del product management per Google DeepMind, ha dichiarato durante il briefing stampa che l’azienda rilascerà un set completo di benchmark per valutare Gemma rispetto ad altri modelli, visibili da chiunque sulle classifiche Open LLM. Warkentin ha anche sottolineato la sicurezza di Gemma: “Tutti questi sono stati ampiamente valutati per essere i modelli più sicuri che potessimo mettere sul mercato a queste dimensioni”, ha detto. Oltre alla sicurezza, Warkentin ha sottolineato il ruolo dell’ecosistema aperto nel promuovere un’AI responsabile.

“Riteniamo sia davvero fondamentale – abbiamo bisogno di prospettive diverse da parte degli sviluppatori e dei ricercatori in tutto il mondo, al fine di ottenere il feedback giusto e costruire sistemi di sicurezza ancora migliori”, ha detto. “Quindi parte del viaggio del modello aperto è assicurarsi che stiamo integrando queste prospettive e che il feedback, la comunicazione con la comunità, sia una parte fondamentale del modo in cui vediamo il valore di questo progetto”.

Per visualizzare il technical report di Gemma cliccare qui.

Guida introduttiva ai modelli Gemma.

Articoli correlati

Articolo 1 di 4