Tecnologia

Nuovo chip AI di IBM: “imita” il cervello umano e supera le GPU

NorthPole è composto da 22 miliardi di transistor ed esegue tutta la memoria sul chip, rendendo più efficiente l’energia e riducendo la latenza rispetto ad altri chip

Pubblicato il 27 ott 2023

Pierluigi Sandonnini

giornalista

IBM si sta ispirando al cervello umano per progettare il suo hardware per l’intelligenza artificiale, e ha presentato un nuovo chip che, a detta dell’azienda, ha una latenza migliore ed è più efficiente dal punto di vista energetico rispetto alle GPU esistenti.

Il chip NorthPole a 12 nm del gigante tecnologico vanta una nuova architettura hardware per reti neurali ottimizzata per compiti di inferenza neurale, come la classificazione di immagini e il rilevamento di oggetti.

IBM dichiara che il chip è 25 volte più efficiente dal punto di vista energetico e ha una latenza 22 volte inferiore rispetto a una GPU analoga nel benchmark ResNet50. Le sue prestazioni sono documentate in un articolo appena pubblicato su Science.

Indice degli argomenti:

NorthPole IBM, un chip da 22 miliardi di transistor

NorthPole dispone di 22 miliardi di transistor e di un’ampia memoria on-chip, il che significa che può essere utilizzato per memorizzare ed eseguire calcoli on-chip senza dover accedere alla memoria esterna, migliorando ulteriormente la velocità e l’efficienza.

“Una delle maggiori differenze con NorthPole è che tutta la memoria del dispositivo si trova nel chip stesso, anziché essere collegata separatamente”, si legge in un post sul blog IBM. Il cervello umano è altrettanto autonomo.

La memoria si trova tutta nel chip, che non deve continuamente spostare i dati avanti e indietro dalla memoria, all’elaborazione e a qualsiasi altro componente del chip. Questo è il cosiddetto collo di bottiglia di von Neumann.

“È un’intera rete su un chip”, dichiara Dharmendra Modha, scienziato capo di IBM per il brain-inspired computing che ha sviluppato il chip insieme al suo team. Ha dichiarato che NorthPole supera anche i chip realizzati con processi più avanzati, come le GPU a 4 nm.

IBM sta inoltre cercando di perfezionare NorthPole, ad esempio sperimentando nodi da 2 nm all’avanguardia. L’attuale stato dell’arte delle CPU è di 3 nm.

NorthPole IBM chip — Modha, al centro, con la maggior parte del team che lavora a NorthPole

NorthPole IBM non può accedere alla memoria esterna

Tuttavia, NorthPole non può accedere alla memoria esterna, perciò supporta reti neurali più grandi “scomponendole in sottoreti più piccole” per adattarle alla sua memoria e collegando insieme le sottoreti su diversi chip NorthPole, una tecnica chiamata “scale-out”.

“Non possiamo eseguire GPT-4 su questo chip, ma potremmo servire molti dei modelli di cui le imprese hanno bisogno”, ha detto Modha. Inoltre, il chip è “solo per l’inferenza”.

D’altra parte, NorthPole potrebbe essere “adatto” alle applicazioni edge che devono elaborare enormi quantità di dati in tempo reale, come quelle dei veicoli autonomi.

Nel progettare il chip, Modha e il suo team si sono ispirati al cervello umano. Le NoC (reti su chip) di NorthPole interconnettono i core, unificando e distribuendo calcolo e memoria – che i ricercatori IBM paragonano ai percorsi a lunga distanza della materia bianca e a breve distanza della materia grigia nel cervello.

C’è anche una fitta intersezione che migliora il flusso delle attivazioni neurali a livello locale, come la connettività locale del cervello che permette di creare percorsi tra i neuroni delle regioni corticali vicine.

IBM ha anche cercato di imitare la precisione delle sinapsi del cervello, optando per una precisione di bit inferiore (da due a quattro) rispetto alle GPU tradizionali, che utilizzano precisioni di bit superiori (da otto a 16). Questa scelta è stata fatta per ridurre drasticamente il fabbisogno di memoria e di energia.

NorthPole, le possibili applicazioni

È ancora presto per l’utilizzo di NorthPole e IBM ha in programma ulteriori ricerche. Ma il gigante tecnologico sta già esplorando le possibili applicazioni.

Durante i test, NorthPole è stato applicato in gran parte a casi d’uso legati alla computer vision, dato che i finanziamenti per il progetto provenivano dal Dipartimento della Difesa degli Stati Uniti. Tali casi d’uso comprendono il rilevamento, la segmentazione delle immagini e la classificazione dei video.

Ma il chip è stato sperimentato anche per altro, ad esempio per l’elaborazione del linguaggio naturale e il riconoscimento vocale.

Il team che si occupa dell’hardware sta attualmente esplorando la mappatura dei modelli linguistici di grandi dimensioni con il solo decodificatore sui sistemi NorthPole scale-out.

Quando si pensa a questi compiti di intelligenza artificiale, vengono in mente tutti i tipi di casi d’uso, dai veicoli autonomi alla robotica, agli assistenti digitali o all’elaborazione spaziale. Molti tipi di applicazioni edge che richiedono l’elaborazione di enormi quantità di dati in tempo reale potrebbero essere adatti a NorthPole. Ad esempio, potrebbe essere il tipo di dispositivo necessario per trasformare i veicoli autonomi da macchine che necessitano di mappe e percorsi prestabiliti per operare su piccola scala, a macchine in grado di pensare e reagire alle rare situazioni limite che rendono la navigazione nel mondo reale così impegnativa anche per gli abili conducenti umani.

Questi tipi di casi limite sono esattamente il punto di forza delle future applicazioni di NorthPole. Il nuovo chip d IBM potrebbe consentire ai satelliti di monitorare l’agricoltura e gestire le popolazioni di animali selvatici, monitorare i veicoli e le merci per strade più sicure e meno congestionate, far funzionare i robot in modo sicuro e rilevare le minacce informatiche per aziende più sicure.

@RIPRODUZIONE RISERVATA