ANALISI

Agenti AI: occorrono nuovi test dei modelli e nuovi benchmark

La tecnologia in rapida evoluzione supera i benchmark attuali. OpenAI, Microsoft, Meta e Anthropic stanno sviluppando agenti AI capaci di eseguire compiti complessi autonomamente, il che richiede nuovi e più sofisticati metodi di valutazione

Pubblicato il 12 nov 2024

Pierluigi Sandonnini

Le aziende tecnologiche stanno accelerando il processo di ridefinizione dei test per i loro modelli di intelligenza artificiale, poiché la velocità con cui la tecnologia avanza supera i benchmark attuali. OpenAI, Microsoft, Meta e Anthropic hanno recentemente annunciato piani per costruire agenti AI capaci di eseguire compiti autonomamente per conto degli umani. Per fare ciò in modo efficace, i sistemi devono essere in grado di eseguire azioni sempre più complesse, utilizzando ragionamento e pianificazione.

@RIPRODUZIONE RISERVATA

Pierluigi Sandonnini

Senior web editor Digital360. Oltre trent'anni di esperienza giornalistica, maturata in diversi settori della tecnologia: audio video, tv digitale, telecomunicazioni, internet, intelligenza artificiale. Da cinque anni gestisce il sito Ai4business.it, curandone i contenuti e scrivendo articoli.

Seguimi su