OpenAI era vicina a un traguardo importante con il suo nuovo modello di intelligenza artificiale, Orion. Tuttavia, secondo fonti interne, il modello non ha raggiunto le prestazioni desiderate. Per fare un esempio, ha avuto difficoltà a rispondere a domande di codifica non incluse nel suo addestramento. Questo modello non rappresenta un miglioramento significativo rispetto ai modelli precedenti come GPT-4, che aveva superato il suo predecessore GPT-3.5.
OpenAI non è l’unica azienda a incontrare ostacoli. Anche Google e Anthropic stanno vedendo un calo dei ritorni dai loro sforzi costosi per sviluppare modelli più avanzati. Google ha riscontrato che la nuova versione del software Gemini non soddisfa le aspettative interne, mentre Anthropic ha ritardato il rilascio del modello Claude 3.5 Opus.
La sfida dei dati di alta qualità
Una delle principali sfide è la difficoltà di trovare nuove fonti di dati di alta qualità per l’addestramento dei modelli. La performance insoddisfacente di Orion nel campo della codifica è stata attribuita alla mancanza di dati sufficienti. Inoltre, i miglioramenti modesti potrebbero non giustificare i costi enormi associati allo sviluppo e al funzionamento di nuovi modelli.
Nonostante le difficoltà, c’è ancora un grande potenziale per migliorare questi modelli. OpenAI sta lavorando su Orion attraverso un processo di post-addestramento, che include l’incorporazione del feedback umano per migliorare le risposte e affinare il tono del modello. Tuttavia, Orion non è ancora pronto per essere rilasciato agli utenti e probabilmente non sarà disponibile prima dell’inizio del prossimo anno.
Dubbi sull’Intelligenza Artificiale Generale (AGI)
Le recenti battute d’arresto sollevano dubbi sugli investimenti massicci nell’AI e sulla possibilità di raggiungere l’intelligenza artificiale generale (AGI). Questo termine si riferisce a sistemi ipotetici che eguaglierebbero o supererebbero gli esseri umani in molte attività intellettuali. Tuttavia, come sottolineato da esperti del settore, potrebbero essere necessari approcci di addestramento diversi per far funzionare bene i modelli di AI su una varietà di compiti.
Anthropic ha affrontato difficoltà nello sviluppo del modello 3.5 Opus, che non ha performato come previsto nonostante le risorse investite. Google, dal canto suo, ha aggiornato il modello Gemini senza introdurre grandi innovazioni. Le aziende stanno ora considerando se continuare a supportare i modelli più vecchi con miglioramenti incrementali o investire in nuove versioni più costose.
“La bolla dell’intelligenza artificiale sta un po’ scoppiando”, sostiene Margaret Mitchell, scienziato capo dell’etica presso la startup Hugging Face. È ormai chiaro che potrebbero essere necessari “approcci di addestramento diversi” per far sì che i modelli di AI funzionino davvero bene su una varietà di compiti.
In una dichiarazione, un portavoce di Google DeepMind ha detto che l’azienda è “soddisfatta dei progressi che stiamo vedendo su Gemini e condivideremo di più quando saremo pronti”. OpenAI e Anthropic hanno rifiutato di commentare.
“La gente le chiama leggi di scala. È un termine improprio”, ha dichiarato il CEO Dario Amodei. “Non sono leggi dell’universo. Sono regolarità empiriche. Scommetto a favore della loro continuazione, ma non ne sono certo”.
Amodei ha aggiunto che ci sono “molte cose” che potrebbero “far deragliare” il processo di raggiungimento di un’AI più potente nei prossimi anni, compresa la possibilità che “potremmo esaurire i dati”. Ma si è detto ottimista sul fatto che le aziende di AI troveranno un modo per superare ogni ostacolo.
Date di rilascio dei modelli chiave
Date | Model | Release |
Nov. 2018 | OpenAI | GPT |
Feb. 2019 | OpenAI | GPT-2 (partial release) |
June 2020 | OpenAI | GPT-3 |
Nov. 2022 | OpenAI | GPT-3.5 (first model to power ChatGPT) |
March 2023 | OpenAI | GPT-4 |
March 2023 | Anthropic | Claude |
July 2023 | Anthropic | Claude 2 |
Nov. 2023 | Anthropic | Claude 2.1 |
March 2024 | Anthropic | Claude 3 Opus, Sonnet, Haiku |
May 2024 | OpenAI | GPT-4o |
June 2024 | Anthropic | Claude 3.5 Sonnet |
Sept. 2024 | OpenAI | o1-preview |
Nov. 2024 | Anthropic | Claude 3.5 Haiku |
Il futuro della Gen AI è negli agenti
In risposta a queste sfide, le aziende stanno esplorando nuovi casi d’uso per i loro modelli, strumenti di intelligenza artificiale chiamati agenti, che possono eseguire compiti per conto degli utenti. OpenAI, Google e Anthropic stanno spostando l’attenzione dalla dimensione dei modelli a queste nuove applicazioni, cercando di mantenere il passo con le aspettative del mercato e degli investitori.
Un portavoce di Anthropic ha dichiarato che il linguaggio su Opus è stato rimosso dal sito Web come parte di una decisione di marketing per mostrare solo i modelli disponibili e sottoposti a benchmark. Alla domanda se Opus 3.5 uscirà ancora quest’anno, il portavoce ha fatto riferimento alle dichiarazioni di Amodei: l’amministratore delegato ha dichiarato che Anthropic ha ancora intenzione di rilasciare il modello, ma ha ripetutamente rifiutato di indicare un calendario.
“Tutti questi modelli sono diventati piuttosto complessi e non possiamo spedire in parallelo tutte le cose che vorremmo”, ha scritto Sam Altman, CEO di OpenAI, in risposta a una domanda in una recente sessione di Ask Me Anything su Reddit. Il produttore di ChatGPT deve affrontare “un sacco di limitazioni e decisioni difficili”, ha detto, su come decidere cosa fare con la potenza di calcolo disponibile.
Altman ha detto che OpenAI avrà alcune “ottime release” nel corso dell’anno, ma la lista non includerà GPT-5 – un nome che molti nel settore dell’IA si aspettano che l’azienda utilizzi per una grande release dopo GPT-4, che è stata introdotta più di 18 mesi fa.
“Avremo modelli sempre migliori”, ha scritto Altman su Reddit. “Ma credo che il prossimo passo avanti sarà rappresentato dagli agenti”.