ANALISI

L’evoluzione degli agenti AI e dei sistemi agentici



Indirizzo copiato

Gli agenti AI sfruttano i modelli di linguaggio per superare le loro limitazioni intrinseche, utilizzando la memoria interna e gli ambienti esterni per affrontare compiti nuovi e complessi. Ecco un approccio che fornisce un percorso verso lo sviluppo di un’intelligenza artificiale più generale e più simile a quella umana

Pubblicato il 26 nov 2024



Agenti AI

L’evoluzione degli agenti AI è iniziata in sordina, sviluppandosi in sistemi che integrano meccanismi di controllo interni con ancoraggi contestuali esterni e input cognitivi. Questo progresso consente interazioni più sofisticate e dinamiche. I modelli di linguaggio di grandi dimensioni (LLM) presentano limitazioni intrinseche nelle capacità di conoscenza e ragionamento. Gli agenti AI con capacità linguistiche affrontano queste sfide collegando gli LLM alla memoria interna e agli ambienti esterni, ancorandoli a conoscenze esistenti o osservazioni del mondo reale.

Uno studio condotto da ricercatori dell’Università di Princeton (Theodore R. Sumers, Shunyu Yao, Karthik Narasimhan, Thomas L. Griffiths) fa luce sulle “architetture cognitive per gli agenti linguistici” (CoALA).

Una nuova classe di agenti linguistici

Da ultimo, i ricercatori hanno aumentato i modelli linguistici di grandi dimensioni (LLM) con risorse esterne (ad esempio, Internet) o flussi di controllo interni (ad esempio, il prompt chaining) per compiti che richiedono la messa a terra o il ragionamento, dando vita a una nuova classe di agenti linguistici. Sebbene questi agenti abbiano ottenuto un notevole successo empirico, manca un quadro di riferimento per organizzare gli agenti esistenti e pianificare gli sviluppi futuri.

Nel loro lavoro, i ricercatori dell’Università di Princeton propongono le “Architetture Cognitive per gli Agenti Linguistici” (CoALA). CoALA descrive un agente linguistico con componenti di memoria modulari, uno spazio di azione strutturato per interagire con la memoria interna e gli ambienti esterni e un processo decisionale generalizzato per scegliere le azioni. Essi hanno utilizzato CoALA per esaminare e organizzare retrospettivamente un gran numero di lavori recenti e per identificare in prospettiva le direzioni percorribili verso agenti più capaci. Nel complesso, CoALA contestualizza gli agenti linguistici odierni all’interno della storia più ampia dell’AI e delinea un percorso verso un’intelligenza generale basata sul linguaggio.

Agenti AI, l‘evoluzione architetturale

In passato, i sistemi dovevano fare affidamento su regole artigianali o apprendimento per rinforzo, che potevano rendere difficile l’adattamento a nuovi ambienti. Gli agenti AI linguistici utilizzano la comprensione del senso comune incorporata negli LLM per affrontare compiti nuovi, riducendo la dipendenza dall’annotazione umana o dall’apprendimento per tentativi ed errori.

agenti AI

Architetture cognitive

Considerando l’immagine sopra, i modelli di linguaggio di grandi dimensioni servono a scopi diversi a seconda delle loro applicazioni:

  • A — Elaborazione del testo: nell’elaborazione del linguaggio naturale (NLP), gli LLM prendono il testo come input e generano testo come output.
  • B — Agenti linguistici: questi integrano gli LLM in un ciclo di feedback con ambienti esterni, trasformando le osservazioni in testo e sfruttando l’LLM per prendere decisioni o eseguire azioni.
  • C — Agenti AI linguistici cognitivi: questi sistemi avanzati utilizzano gli LLM non solo per l’interazione, ma anche per gestire processi interni come l’apprendimento e il ragionamento.
agenti AI

Orchestrazione

Un agente AI può essere compreso attraverso tre elementi chiave:

  • Architetture cognitive: la memoria episodica si riferisce alla capacità di memorizzare e richiamare eventi o esperienze specifiche, come ricordare una conversazione recente. La memoria semantica immagazzina conoscenze generali sul mondo, come fatti e concetti.
  • Spazio di azione: l’agente AI opera all’interno di un quadro di doppia azione. Le azioni interne coinvolgono processi come il ragionamento, la pianificazione e l’aggiornamento del suo stato interno, mentre le azioni esterne coinvolgono interazioni con l’ambiente, come l’esecuzione di comandi o la fornitura di output.
  • Procedura di decisione: la decisione dell’agente è organizzata come un ciclo interattivo composto da pianificazione ed esecuzione. Questo processo iterativo consente all’agente di analizzare il suo ambiente, formulare una strategia e agire di conseguenza, raffinando il suo approccio man mano che nuove informazioni diventano disponibili.

Ambienti digitali

Gli agenti AI operano all’interno di ambienti diversi che consentono loro di interagire ed eseguire compiti. Attualmente, questi ambienti sono principalmente digitali, inclusi sistemi operativi mobili, sistemi operativi desktop e altri ecosistemi digitali. In questi contesti, gli agenti AI possono interagire con giochi, API, siti web ed esecuzione di codice generale, utilizzando queste piattaforme come base per l’esecuzione dei compiti e l’applicazione delle conoscenze.

Agenti AI: esempi pratici

Ad esempio, nei compiti di elaborazione del linguaggio naturale (NLP), le API digitali — come motori di ricerca, calcolatrici e traduttori — sono spesso confezionate come strumenti all’interno del sistema operativo, progettati per scopi specifici. Questi strumenti possono essere considerati ambienti digitali specializzati, monouso, che consentono agli agenti di svolgere compiti che richiedono conoscenze esterne o calcoli.

Il futuro degli agenti AI

Man mano che gli agenti AI continuano a evolversi, la loro presenza negli ambienti digitali si espanderà oltre l’interazione statica, gettando le basi per sistemi più complessi. Il futuro degli agenti AI risiede nella loro incarnazione fisica, dove opereranno in ambienti reali. Questa transizione aprirà nuove possibilità per l’AI, consentendo agli agenti di interagire fisicamente con il mondo, navigare in spazi dinamici e assumere ruoli in campi come la robotica.

Conclusioni

Ciò che emerge da questo studio è l’analisi dettagliata dei quadri evolutivi costruiti attorno agli LLM per massimizzare il loro potenziale. Si evidenzia come queste strutture siano sia interne che esterne, lavorando in tandem per migliorare le loro capacità. Internamente, l’attenzione è sul ragionamento, che costituisce il nucleo dell’intelligenza e dei processi decisionali del modello. Esternamente, il percorso è iniziato con l’aumento dei dati, consentendo l’integrazione di informazioni aggiuntive. Nel tempo, questi quadri esterni si sono espansi per includere l’interazione diretta con il mondo esterno, estendendo ulteriormente la funzionalità e l’adattabilità degli LLM.

Agenti AI

Architetture cognitive per agenti linguistici (CoALA) fornisce un quadro concettuale per descrivere e costruire agenti linguistici. Il framework trae ispirazione dalla ricca storia dell’intelligenza artificiale simbolica e delle scienze cognitive, collegando intuizioni vecchie di decenni alla ricerca di frontiera sui modelli linguistici di grandi dimensioni. Un approccio che fornisce un percorso verso lo sviluppo di un’intelligenza artificiale più generale e più simile a quella umana.

Articoli correlati

Articolo 1 di 4