CONNESSIONI SINTETICHE

GPT-5: ecco come sarà la nuova AI di OpenAI



Indirizzo copiato

Abbiamo raccolto le informazioni emerse da interviste e pubblicazioni di membri del team dell’azienda di Sam Altman e di altre figure di spicco del settore, per tracciare un profilo di quanto possiamo aspettarci

Pubblicato il 9 feb 2024



GPT-5 OpenAI

La prossima grande iterazione dei Large Language Model, le AI generative, è prevista per quest’anno. Una delle novità più attese è sicuramente GPT-5, evoluzione del fortunatissimo modello GPT-4 di OpenAI, considerato, ad oggi, lo stato dell’arte dell’intelligenza artificiale generativa.

La nuova generazione di AI sarà chiamata a superare alcuni dei limiti dei modelli correnti nelle capacità di ragionamento, nella contestualizzazione dei dati e nella multimodalità. Per raggiungere questi obiettivi, i ricercatori si trovano davanti a sfide complesse sia in termini di hardware computazionale che di architettura software dei modelli.Questo articolo raccoglie le informazioni emerse da interviste e pubblicazioni di membri del team di OpenAI e di altre figure di spicco del settore, per tracciare un profilo di quanto possiamo aspettarci da GPT-5.

GPT-5: le capacità di ragionamento

Uno degli obiettivi principali di OpenAI per GPT-5 sarà migliorare le abilità di ragionamento dell’AI, facendo ulteriori passi in avanti nella convergenza del pensiero sintetico con quello umano. I ricercatori stanno lavorando per perfezionare le performance dei modelli GPT in vari domini, che includono il ragionamento logico-matematico, il ragionamento causale, il ragionamento controfattuale e il ragionamento sociale.

La prossima versione di GPT comprenderà il linguaggio umano in modo più profondo e sfaccettato; avrà migliori capacità di cogliere il sarcasmo, l’umorismo e le sfumature emotive. Per contestualizzare l’interazione con gli umani, la nuova AI dovrà essere in grado di immaginare scenari ipotetici e di valutare le possibili conseguenze di diverse azioni, prima di poter offrire una soluzione strategica a un problema. Queste abilità renderanno l’AI più sicura: le limitazioni alla generazione di determinati contenuti non saranno frutto di regole precodificate, ma di una valutazione di rischi e benefici di una determinata risposta.

OpenAI si sta impegnando per impedire un uso scorretto dell’AI in ambito politico, per evitare la manipolazione sintetica delle opinioni degli elettori. La prossima evoluzione di GPT terrà sicuramente conto di questi nuovi impegni etici, che stanno catalizzando attenzioni e critiche sul mondo dell’intelligenza artificiale.

GPT5: l’esperienza utente

In fatto di usabilità, la prima interfaccia di ChatGPT lasciava molto a desiderare. Ad ogni aggiornamento, OpenAI ha apportato nuove migliorie che hanno elevato l’esperienza utente, un fattore fondamentale per il gradimento degli utenti. GPT 5 sarà un passo in avanti in questa direzione, migliorando la velocità e l’accuratezza delle risposte.

GPT-5

La limitata capacità di navigazione del web è un altro punto debole dell’esperienza utente di GPT-4. Competitor come Google Bard (ora Gemini) sono in grado di integrare nelle risposte più informazioni reperite online e hanno funzioni avanzate per verificare l’affidabilità dei contenuti. Per restare al passo, GPT-5 introdurrà nuovi strumenti per il recupero di informazioni dal web e nuove funzionalità per la verifica delle fonti.

Proseguiranno anche le migliorie sul fronte della personalizzazione e della privacy. Il pannello dei setting di GPT-4 è stato recentemente aggiornato con nuove opzioni per la personalizzazione delle risposte e il controllo dei dati condivisi con il chatbot. Secondo le dichiarazioni di intenti di Altman (CEO di OpenAI), si proseguirà su questa strada anche con GPT-5, permettendo un controllo più granulare della privacy e dotando gli utenti di nuovi tool per adattare al meglio le risposte dell’AI allo scenario in cui la si utilizza abitualmente.

GPT-5

GPT-5: la multimodalità

GPT-4 è un modello multimodale con capacità limitate. Accetta in input immagini e testi, ma non è in grado di generare contenuti multimediali senza il supporto di altri modelli generativi dedicati. GPT-5 è destinato a espandere le capacità multimodali dei modelli di OpenAI, gestendo in maniera integrata e nativa vari tipi di informazioni, inclusi audio, immagini e codice.

La multimodalità estesa potrebbe significativamente migliorare le capacità dell’AI in ambiti come l’elaborazione del linguaggio naturale (NLP) per l’analisi di sentiment, la creazione di contenuti multimediali e lo sviluppo software. Inoltre, una multimodalità spinta cambierebbe anche il modo di interfacciarsi con le AI, rendendo la comunicazione più intuitiva e vicina a quella umana.

In questo contesto, la velocità potrebbe fare la differenza. Sono insistenti i rumor sull‘istantaneità delle risposte di GPT-5, sia in modalità testo che in modalità voce. Proprio sul fronte dell’interazione vocale sono state annunciate anche nuove voci migliorate e una maggiore qualità audio.

Hardware e ottimizzazione energetica

Lo sviluppo di GPT-5 richiede un’infrastruttura hardware di altissimo livello per poter gestire la complessità del modello e la mole di dati necessari per il suo allenamento. In diverse interviste, Sam Altman ha anche menzionato la possibilità di far realizzare hardware dedicato per GPT-5, ma la richiesta di queste componenti elettroniche è elevatissima e le strutture produttive non sempre riescono a stare al passo con gli ordini dei clienti più grandi. In assenza di garanzie sulla creazione di hardware ottimizzato ad-hoc, bisogna puntare sull’ottimizzazione architetturale.

Ridurre il consumo energetico è fondamentale per restare economicamente competitivi e diminuire l’impatto ambientale dell’AI. La potenza di calcolo impiegata dai grandi modelli multimodali richiede una notevole quantità di energia elettrica, generando quindi una grande quantità di calore che deve essere dissipata per evitare il surriscaldamento dei sistemi. OpenAI è costantemente al lavoro per perfezionare le architetture che sorreggono l’AI, come abbiamo già potuto vedere con le evoluzioni light di GPT 3.5 e GPT 4.

GPT-5

Conclusioni

Le informazioni su GPT-5 sono in continua evoluzione: il modello è ancora in fase di sviluppo e molti dettagli non vengono rivelati in anteprima per ovvie scelte aziendali. La prossima iterazione dei modelli GPT potrà ancora una volta cambiare il volto dell’AI e le sue possibili applicazioni, ma raggiungere questi obiettivi richiede sforzi significativi per superare le notevoli sfide scientifiche in campo.

Nonostante le grandi aspettative, vi è comunque un motivato scetticismo sulla capacità di GPT-5 di raggiungere l‘Intelligenza Generale Artificiale (AGI). I nuovi modelli saranno più performanti, ma secondo molti esperti è tecnicamente infattibile raggiungere l’AGI prima del 2032.

Articoli correlati

Articolo 1 di 3