Uno degli annunci più importanti fatti da Nvidia alla conferenza Nvidia GTC del 20 settembre 2022 riguarda una serie di nuove funzionalità LLM (Large Language Models), tra cui un paio di servizi cloud che mirano a consentire a più organizzazioni e individui di creare, formare e beneficiare di LLM. Le nuove offerte cloud includono il servizio Nvidia NeMo LLM e il servizio Nvidia BioNeMo LLM.
“Stiamo annunciando NeMo LLM Service per consentire la personalizzazione e l’inferenza di modelli di intelligenza artificiale giganti”, ha dichiarato Paresh Kharya, senior director of accelerated computing products di Nvidia. “Proprio come gli LLM possono capire il linguaggio umano, sono stati anche addestrati a comprendere il linguaggio della biologia e della chimica”.
Cosa consente il servizio Nvidia NeMo LLM
Il nuovo servizio NeMo LLM rende più facile consentire la personalizzazione e l’inferenza di grandi modelli di intelligenza artificiale.
I grandi modelli di intelligenza artificiale che il servizio supporterà includono un modello basato su GPT da 5 miliardi e 20 miliardi di parametri, nonché uno basato sul parametro Megatron da 530 miliardi LLM. Come parte del servizio, Nvidia supporta anche l’ottimizzazione basata sull’apprendimento rapido per abilitare rapidamente casi d’uso specifici del contesto. Kharya ha affermato che il servizio NeMo LLM includerà anche la possibilità di utilizzare sia modelli già pronti che modelli personalizzati attraverso un’esperienza API basata su cloud.
Nvidia sta anche lanciando una funzionalità LLM specifica per le scienze della vita con il servizio BioNeMo.
“Proprio come un LLM può capire il linguaggio umano, sono stati anche addestrati a capire il linguaggio della biologia e della chimica”, ha detto Kharya. “Le promesse e le possibilità sono davvero immense ed è l’accesso a modelli linguistici di grandi dimensioni e la possibilità di personalizzarli facilmente che prima non c’era”, ha detto Kharya. “Quindi ciò che fa NeMo Large Language Model Service è rimuovere quella barriera e ora consente a tutti di accedere e sperimentare [LLM] per i loro casi d’uso”.
Video
Perché gli LLM sono importanti
Gli LLM sono basati sull’architettura del trasformatore AI e sono ampiamente utilizzate per supportare un numero crescente di casi d’uso.
“I trasformatori ci consentono anche di allenarci su set di dati non etichettati e questo espande notevolmente il volume di dati”, ha affermato Kharya. “Stiamo davvero assistendo a un’esplosione di ricerca, applicando modelli di trasformatori a tutti i tipi di casi d’uso quest’anno. Ci si aspetta che avremo 11.000 documenti sui trasformatori, in realtà sette volte più di cinque anni fa”.
Il GPT-3 LLM ha contribuito ad aumentare la consapevolezza e l’adozione di LLM per una varietà di casi d’uso, tra cui la sommatoria e la generazione di testo. Un LLM è anche alla base della tecnologia di generazione da testo a immagine DALL-E.