La prossima grande iterazione dei Large Language Model, le AI generative, è prevista per quest’anno. Una delle novità più attese è sicuramente GPT-5, evoluzione del fortunatissimo modello GPT-4 di OpenAI, considerato, ad oggi, lo stato dell’arte dell’intelligenza artificiale generativa.
GPT-5: le capacità di ragionamento
OpenAI si sta impegnando per impedire un uso scorretto dell’AI in ambito politico, per evitare la manipolazione sintetica delle opinioni degli elettori. La prossima evoluzione di GPT terrà sicuramente conto di questi nuovi impegni etici, che stanno catalizzando attenzioni e critiche sul mondo dell’intelligenza artificiale.
In fatto di usabilità, la prima interfaccia di ChatGPT lasciava molto a desiderare. Ad ogni aggiornamento, OpenAI ha apportato nuove migliorie che hanno elevato l’esperienza utente, un fattore fondamentale per il gradimento degli utenti. GPT 5 sarà un passo in avanti in questa direzione, migliorando la velocità e l’accuratezza delle risposte.
La limitata capacità di navigazione del web è un altro punto debole dell’esperienza utente di GPT-4. Competitor come Google Bard (ora Gemini) sono in grado di integrare nelle risposte più informazioni reperite online e hanno funzioni avanzate per verificare l’affidabilità dei contenuti. Per restare al passo, GPT-5 introdurrà nuovi strumenti per il recupero di informazioni dal web e nuove funzionalità per la verifica delle fonti.
Proseguiranno anche le migliorie sul fronte della personalizzazione e della privacy. Il pannello dei setting di GPT-4 è stato recentemente aggiornato con nuove opzioni per la personalizzazione delle risposte e il controllo dei dati condivisi con il chatbot. Secondo le dichiarazioni di intenti di Altman (CEO di OpenAI), si proseguirà su questa strada anche con GPT-5, permettendo un controllo più granulare della privacy e dotando gli utenti di nuovi tool per adattare al meglio le risposte dell’AI allo scenario in cui la si utilizza abitualmente.
GPT-5: la multimodalità
GPT-4 è un modello multimodale con capacità limitate. Accetta in input immagini e testi, ma non è in grado di generare contenuti multimediali senza il supporto di altri modelli generativi dedicati. GPT-5 è destinato a espandere le capacità multimodali dei modelli di OpenAI, gestendo in maniera integrata e nativa vari tipi di informazioni, inclusi audio, immagini e codice.
La multimodalità estesa potrebbe significativamente migliorare le capacità dell’AI in ambiti come l’elaborazione del linguaggio naturale (NLP) per l’analisi di sentiment, la creazione di contenuti multimediali e lo sviluppo software. Inoltre, una multimodalità spinta cambierebbe anche il modo di interfacciarsi con le AI, rendendo la comunicazione più intuitiva e vicina a quella umana.
In questo contesto, la velocità potrebbe fare la differenza. Sono insistenti i rumor sull‘istantaneità delle risposte di GPT-5, sia in modalità testo che in modalità voce. Proprio sul fronte dell’interazione vocale sono state annunciate anche nuove voci migliorate e una maggiore qualità audio.
Hardware e ottimizzazione energetica
Lo sviluppo di GPT-5 richiede un’infrastruttura hardware di altissimo livello per poter gestire la complessità del modello e la mole di dati necessari per il suo allenamento. In diverse interviste, Sam Altman ha anche menzionato la possibilità di far realizzare hardware dedicato per GPT-5, ma la richiesta di queste componenti elettroniche è elevatissima e le strutture produttive non sempre riescono a stare al passo con gli ordini dei clienti più grandi. In assenza di garanzie sulla creazione di hardware ottimizzato ad-hoc, bisogna puntare sull’ottimizzazione architetturale.
Ridurre il consumo energetico è fondamentale per restare economicamente competitivi e diminuire l’impatto ambientale dell’AI. La potenza di calcolo impiegata dai grandi modelli multimodali richiede una notevole quantità di energia elettrica, generando quindi una grande quantità di calore che deve essere dissipata per evitare il surriscaldamento dei sistemi. OpenAI è costantemente al lavoro per perfezionare le architetture che sorreggono l’AI, come abbiamo già potuto vedere con le evoluzioni light di GPT 3.5 e GPT 4.
Conclusioni
Le informazioni su GPT-5 sono in continua evoluzione: il modello è ancora in fase di sviluppo e molti dettagli non vengono rivelati in anteprima per ovvie scelte aziendali. La prossima iterazione dei modelli GPT potrà ancora una volta cambiare il volto dell’AI e le sue possibili applicazioni, ma raggiungere questi obiettivi richiede sforzi significativi per superare le notevoli sfide scientifiche in campo.
Nonostante le grandi aspettative, vi è comunque un motivato scetticismo sulla capacità di GPT-5 di raggiungere l‘Intelligenza Generale Artificiale (AGI). I nuovi modelli saranno più performanti, ma secondo molti esperti è tecnicamente infattibile raggiungere l’AGI prima del 2032.