In occasione di un evento tenutosi a San Francisco nel novembre 2023 – come riporta il New York Times -, è stato chiesto a Sam Altman, amministratore delegato di OpenAI, quali sorprese riserverà il settore nel 2024. I chatbot online come ChatGPT di OpenAI faranno “un salto in avanti che nessuno si aspettava”, ha risposto subito Altman. Seduto accanto a lui, James Manyika, un dirigente di Google, ha annuito e ha aggiunto: “Più uno…”.
L’industria dell’intelligenza artificiale nel 2024 sarà definita da una caratteristica principale: un miglioramento straordinariamente rapido della tecnologia, con progressi che si accumulano l’uno sull’altro, consentendo di generare nuovi tipi di media, di imitare il ragionamento umano in modi nuovi e di penetrare nel mondo fisico attraverso una nuova razza di robot.
Nel 2024 i chatbot andranno oltre il testo
Nei prossimi mesi, i generatori di immagini come DALL-E e Midjourney forniranno istantaneamente video e immagini fisse, e si fonderanno gradualmente con chatbot come ChatGPT.
Ciò significa che i chatbot andranno ben oltre il testo digitale, gestendo foto, video, diagrammi, grafici e altri media. Mostreranno un comportamento più simile al ragionamento umano, affrontando compiti sempre più complessi in campi come la matematica e la scienza. Man mano che la tecnologia si sposta verso i robot aiuterà anche a risolvere problemi che vanno oltre il mondo digitale.
Molti di questi sviluppi hanno già iniziato a emergere nei migliori laboratori di ricerca e nei prodotti tecnologici. Ma nel 2024 la potenza di questi prodotti crescerà in modo significativo e sarà utilizzata da un numero molto maggiore di persone.
OpenAI, Google e altre aziende tecnologiche stanno facendo progredire l’AI molto più rapidamente di altre tecnologie grazie al modo in cui sono costruiti i sistemi sottostanti.
La maggior parte delle applicazioni software sono costruite da ingegneri, una riga di codice alla volta, un processo lento e noioso. Le aziende stanno migliorando l’intelligenza artificiale più rapidamente perché la tecnologia si basa sulle reti neurali, sistemi matematici in grado di apprendere abilità analizzando i dati digitali. Individuando schemi in dati quali articoli di Wikipedia, libri e testi digitali raccolti da Internet, una rete neurale può imparare a generare testo da sola.
Nonostante tutto, l’AI è ancora agli inizi
Quest’anno le aziende tecnologiche prevedono di fornire ai sistemi di intelligenza artificiale una quantità di dati – tra cui immagini, suoni e testi – superiore a quella che le persone sono in grado di gestire. Man mano che questi sistemi impareranno a conoscere le relazioni tra questi vari tipi di dati, impareranno a risolvere problemi sempre più complessi, preparandoli alla vita nel mondo fisico.
Tutto ciò non significa che l’intelligenza artificiale sarà presto in grado di eguagliare il cervello umano. Le aziende e gli imprenditori che si occupano di AI mirano a creare quella che chiamano “intelligenza artificiale generale” – una macchina in grado di fare tutto ciò che può fare il cervello umano – ma questo rimane un compito arduo. Nonostante i rapidi progressi, l’intelligenza artificiale è ancora agli inizi.
Una guida su come l’intelligenza artificiale cambierà nel 2024
Video istantanei
Finora le applicazioni basate sull’AI generavano per lo più testo e immagini fisse in risposta a richieste. DALL-E, ad esempio, è in grado di creare immagini fotorealistiche in pochi secondi in base a richieste.
Ma quest’anno, aziende come OpenAI, Google, Meta e Runway probabilmente distribuiranno generatori di immagini che consentiranno alle persone di generare anche video. Queste aziende hanno già realizzato prototipi di strumenti in grado di creare istantaneamente video a partire da brevi richieste di testo.
È probabile che le aziende tecnologiche inseriscano i poteri dei generatori di immagini e video nei chatbot, rendendoli più potenti.
Chatbot “multimodali”
I chatbot e i generatori di immagini, originariamente sviluppati come strumenti separati, si stanno gradualmente fondendo. Quando OpenAI ha presentato una nuova versione di ChatGPT l’anno scorso, il chatbot era in grado di generare immagini oltre che testo.
Le aziende produttrici di AI stanno costruendo sistemi “multimodali”, ovvero in grado di gestire diversi tipi di media. Questi sistemi apprendono competenze analizzando foto, testi e potenzialmente altri tipi di media, tra cui diagrammi, grafici, suoni e video, in modo da poter produrre testi, immagini e suoni propri.
Non è tutto. Poiché i sistemi stanno anche imparando le relazioni tra i diversi tipi di media, saranno in grado di capire un tipo di media e rispondere con un altro. In altre parole, il chatbot potrebbe ricevere un’immagine e rispondere con un testo.
I chatbot multimodali sbaglieranno, così come sbagliano i chatbot di solo testo. Le aziende tecnologiche stanno lavorando per ridurre gli errori, cercando di costruire chatbot in grado di ragionare come un essere umano.
“Ragionare” meglio
Quando Altman parla di un balzo in avanti dell’intelligenza artificiale, si riferisce a chatbot più capaci di “ragionare” e in grado di svolgere compiti più complessi, come la risoluzione di complicati problemi matematici e la generazione di programmi informatici dettagliati.
L’obiettivo è costruire sistemi in grado di risolvere accuratamente e logicamente un problema attraverso una serie di passaggi discreti, ognuno dei quali si basa sul successivo. È così che ragionano gli esseri umani, almeno in alcuni casi.
I principali scienziati non sono d’accordo sul fatto che i chatbot possano davvero ragionare in questo modo. Alcuni sostengono che questi sistemi sembrano ragionare semplicemente perché ripetono comportamenti che hanno visto nei dati di Internet. Ma OpenAI e altri stanno costruendo sistemi in grado di rispondere in modo più affidabile a domande complesse che riguardano materie come la matematica, la programmazione informatica, la fisica e altre scienze.
“Man mano che i sistemi diventano più affidabili, diventeranno sempre più popolari”, ha dichiarato Nick Frosst, ex ricercatore di Google che contribuisce alla guida di Cohere, una start-up di AI.
Se i chatbot saranno più bravi a ragionare, potranno trasformarsi in “agenti A.I.”.
Agenti A.I.
Se le aziende insegnano ai sistemi di intelligenza artificiale a risolvere problemi complessi un passo alla volta, possono anche migliorare la capacità dei chatbot di utilizzare applicazioni software e siti web per conto dell’utente.
I ricercatori stanno essenzialmente trasformando i chatbot in un nuovo tipo di sistema autonomo chiamato agente A.I.. Ciò significa che i chatbot possono utilizzare applicazioni software, siti web e altri strumenti online, tra cui fogli di calcolo, calendari online e siti di viaggio. Le persone potrebbero così scaricare il noioso lavoro d’ufficio ai chatbot. Ma questi agenti potrebbero anche togliere del tutto il lavoro.
I chatbot funzionano già come agenti, in misura ridotta. Possono programmare riunioni, modificare file, analizzare dati e costruire grafici a barre. Ma questi strumenti non sempre funzionano bene come dovrebbero. Gli agenti si rompono completamente quando vengono applicati a compiti più complessi.
Quest’anno le aziende di AI presenteranno agenti più affidabili. Questo potrebbe includere tenere traccia delle spese in un’applicazione come QuickBooks o registrare i giorni di ferie in un’applicazione come Workday. A lungo termine, il fenomeno si estenderà oltre i software e i servizi Internet, fino a raggiungere il mondo della robotica.
Robot più intelligenti
In passato, i robot erano programmati per eseguire sempre lo stesso compito, come ad esempio raccogliere scatole sempre della stessa forma e dimensione. Ma utilizzando lo stesso tipo di tecnologia alla base dei chatbot, i ricercatori stanno dando ai robot la capacità di gestire compiti più complessi, compresi quelli mai visti prima.
Così come i chatbot possono imparare a prevedere la parola successiva in una frase analizzando vaste quantità di testo digitale, un robot può imparare a prevedere cosa accadrà nel mondo fisico analizzando innumerevoli video di oggetti che vengono pungolati, sollevati e spostati.
Quest’anno l’intelligenza artificiale potenzierà i robot che operano dietro le quinte, come i bracci meccanici che piegano le camicie in una lavanderia a gettoni o smistano pile di roba in un magazzino. Personaggi del calibro di Elon Musk stanno lavorando anche per portare i robot umanoidi nelle case delle persone.