Google DeepMind ha svelato i suoi nuovi modelli open source da 2B e 7B, costruiti sulla stessa ricerca e tecnologia utilizzate per creare i recenti modelli Gemini, e denominati Gemma. Gemma verrà rilasciata con varianti pre-addestrate e sintonizzate su istruzioni, ha annunciato Google DeepMind in un post sul blog. I pesi del modello saranno rilasciati con una licenza commerciale permissiva, insieme a un nuovo toolkit per l’intelligenza artificiale generativa responsabile.
Google fornirà anche catene di strumenti per l’inferenza e la messa a punto supervisionata (SFT) attraverso tutti i principali framework: JAX, PyTorch e TensorFlow tramite Keras 3.0 nativo.
Gemma è integrata con Hugging Face, MaxText e Nvidia NeMo
Sono disponibili notebook Colab e Kaggle pronti all’uso, e Gemma è integrata con Hugging Face, MaxText e Nvidia NeMo. I modelli Gemma pre-addestrati e sintonizzati su istruzioni possono funzionare su un laptop, una workstation o Google Cloud con distribuzione su Vertex AI e Google Kubernetes Engine.
Nvidia ha annunciato di aver lanciato in collaborazione con Google ottimizzazioni su tutte le piattaforme AI, compresi i pc locali RTX AI, per accelerare le prestazioni di Gemma.
Jeanine Banks, vicepresidente e direttore generale di Developer X nonché responsabile delle relazioni con gli sviluppatori presso Google, ha dichiarato durante un briefing stampa che i modelli Gemma “sembravano una continuazione” dopo la storia di Google nell’open sourcing per lo sviluppo dell’AI, da strumenti come TensorFlow e Jax ad altri modelli e sistemi AI come PaLM2 e AlphaFold, fino a Gemini. Banks ha inoltre affermato che attraverso il feedback durante lo sviluppo dei modelli Gemini, Google DeepMind “ha acquisito una chiave di lettura importante: in alcuni casi, gli sviluppatori utilizzano sia modelli aperti che API in modo complementare nel loro flusso di lavoro, a seconda della fase del flusso di lavoro in cui si trovano”.
Un ecosistema aperto nel promuovere un’AI responsabile
Tris Warkentin, direttore del product management per Google DeepMind, ha dichiarato durante il briefing stampa che l’azienda rilascerà un set completo di benchmark per valutare Gemma rispetto ad altri modelli, visibili da chiunque sulle classifiche Open LLM. Warkentin ha anche sottolineato la sicurezza di Gemma: “Tutti questi sono stati ampiamente valutati per essere i modelli più sicuri che potessimo mettere sul mercato a queste dimensioni”, ha detto. Oltre alla sicurezza, Warkentin ha sottolineato il ruolo dell’ecosistema aperto nel promuovere un’AI responsabile.
“Riteniamo sia davvero fondamentale – abbiamo bisogno di prospettive diverse da parte degli sviluppatori e dei ricercatori in tutto il mondo, al fine di ottenere il feedback giusto e costruire sistemi di sicurezza ancora migliori”, ha detto. “Quindi parte del viaggio del modello aperto è assicurarsi che stiamo integrando queste prospettive e che il feedback, la comunicazione con la comunità, sia una parte fondamentale del modo in cui vediamo il valore di questo progetto”.
Per visualizzare il technical report di Gemma cliccare qui.