Nvidia si affida all’infrastruttura cloud di Oracle per l’esecuzione di applicazioni AI strategiche. Al centro della collaborazione fra le due aziende, il nuovo Oracle Cloud Infrastructure (OCI) Supercluster, che permetterà a Nvidia di offrire DGX Cloud, un servizio di supercomputing AI, su larghissima scala.
Inoltre, NVIDIA sta eseguendo su OCI anche gli AI Foundations, i suoi nuovi servizi cloud di AI generativa, disponibili tramite DGX Cloud.
”OCI è la prima piattaforma a offrire un supercomputer AI su larga scala a migliaia di clienti in tutti i settori. Si tratta di una capacità fondamentale, dato che sempre più organizzazioni richiedono risorse di calcolo per i loro casi d’uso specifici di AI. Per supportare questa domanda, continuiamo a espandere la nostra collaborazione con NVIDIA”, ha dichiarato Clay Magouyrk, Executive VP di Oracle Cloud Infrastructure.
Il Supercluster Oracle certificato da Nvidia elabora applicazioni in parallelo massivo
DGX Cloud e i servizi AI Foundations che vengono eseguiti su di esso sfruttano il Supercluster di OCI, certificato da Nvidia per garantire che soddisfi gli elevati standard di DGX Cloud
Il Supercluster di OCI comprende OCI Compute Bare Metal, un cluster RoCE a bassissima latenza basato su networking Nvidia e una scelta di storage HPC. È stato implementato e convalidato da Nvidia per supportare migliaia di istanze OCI Compute Bare Metal, in grado di elaborare in modo efficiente applicazioni in parallelo massivo. Il networking di OCI Supercluster può ora scalare fino a 4.096 istanze OCI Compute Bare Metal con 32.768 GPU A100. Le istanze OCI Compute Bare Metal con GPU NVIDIA H100 sono ora in disponibilità limitata.
”Le opportunità illimitate di innovazione guidata dall’intelligenza artificiale stanno contribuendo a trasformare praticamente ogni azienda. Grazie alla collaborazione di NVIDIA con Oracle Cloud Infrastructure, oggi le straordinarie prestazioni di supercomputing della piattaforma di elaborazione accelerata di NVIDIA sono alla portata di tutte le aziende”, ha dichiarato Manuvir Das, VP enterprise computing di NVIDIA.
Inoltre, Nvidia ha annunciato che Oracle sta aggiungendo le DPU NVIDIA BlueField-3 al suo stack di networking.
Servizi di intelligenza artificiale generativa per la creazione di modelli aziendali personalizzati
I servizi di creazione di modelli di AI Foundations spaziano dal linguaggio alle immagini, dal video al 3D, fino alla biologia. Le aziende possono utilizzare il servizio linguistico Nvidia NeMo e i servizi di immagini, video e 3D Nvidia Picasso per creare applicazioni AI generative proprietarie, specifiche per il proprio settore, per chat intelligenti e assistenza clienti, creazione di contenuti professionali, simulazione digitale e altro ancora. Per l’addestramento e l’inferenza di modelli di AI biologici, il servizio cloud Nvidia BioNeMo offre strumenti per personalizzare e distribuire rapidamente applicazioni di AI generativa.
Su OCI, i modelli personalizzati costruiti con Nvidia AI Foundations e famiglie di modelli come GPT-3 si avvalgono di OCI Supercluster, che include networking RDMA (Remote Direct Memory Access) appositamente costruito per offrire prestazioni prossime alla velocità di linea con latenza di microsecondi ed eliminare i problemi di blocco per i carichi di lavoro dipendenti dall’RDMA.