AI generativa

Manus messo alla prova: luci e ombre



Indirizzo copiato

Il nuovo agente AI generale sviluppato dalla startup cinese Butterfly Effect, resta ancora avvolto nel mistero. La testata giornalistica del MIT ha avuto la possibilità di testarlo su alcuni compiti reali. Ecco come è andata

Pubblicato il 14 mar 2025



Manus prova

Manus, il nuovo agente AI generale sviluppato in Cina, ha messo in fermento il mondo dell’intelligenza artificiale. Lanciato dalla startup di Wuhan, Butterfly Effect, Manus ha subito attirato l’attenzione di figure influenti nel settore tecnologico, come Jack Dorsey e Victor Mustar, che ne hanno lodato le prestazioni. Nonostante l’hype, solo una piccola percentuale di utenti ha avuto accesso a Manus finora, quindi permangono dubbi e curiosità riguardo le sue reali prestazioni.

Manus, il primo agente di AI generale

Manus si presenta come il primo agente AI generale al mondo, capace di operare autonomamente su una vasta gamma di compiti utilizzando modelli AI multipli. Questa caratteristica lo distingue dai chatbot tradizionali, come DeepSeek, che si basano su un singolo modello di linguaggio. Manus è progettato per un pubblico globale, con l’inglese come lingua predefinita e un’interfaccia pulita e minimalista.

WHITEPAPER

Potenzia il tuo business con Big Data e AI: Insight 2025 dall'Osservatorio del Politecnico di Milano

Business Analytics
Business Intelligence

Manus messo alla prova

Per verificare le reali capacità di Manus c’era bisogno di metterlo alla prova, ma il modello non è ancora aperto al pubblico. Tuttavia, MIT Technology Review ha avuto l’opportunità di testarlo. Questo è il resoconto della prova effettuata.

Il test effettuato dal MIT Technology Review

L’esperienza è stata paragonabile a quella di collaborare con un tirocinante altamente intelligente ed efficiente, afferma il MIT. Sebbene Manus possa commettere errori e assumere erroneamente alcune informazioni, la sua capacità di adattamento e miglioramento con istruzioni dettagliate è notevole.

Compiti e prestazioni

Manus è stato testato da MIT Technology Review su tre compiti distinti:

  • 1: giornalisti tecnologici in Cina
    Manus ha inizialmente fornito una lista di giornalisti incompleta, ma dopo aver ricevuto feedback, è riuscito a compilare una lista dettagliata di 30 giornalisti, dimostrando la sua capacità di adattarsi ai suggerimenti.
  • 2: ricerca di appartamenti a New York
    Durante la ricerca di proprietà, Manus ha inizialmente interpretato i criteri in modo troppo letterale. Tuttavia, dopo ulteriori indicazioni, è riuscito a fornire un elenco ben strutturato di opzioni, dimostrando efficienza nel gestire dati ben strutturati.
  • 3: innovatori under 35
    Questo compito ha messo alla prova Manus in termini di ricerca complessa. Sebbene abbia affrontato ostacoli con contenuti dietro paywall, è riuscito a produrre una lista di candidati, sebbene con alcune limitazioni.

Frequenti crash e instabilità di sistema

Nonostante le sue potenzialità, Manus non è esente da problemi. Ha sperimentato frequenti crash e instabilità di sistema, con un tasso di fallimento superiore a quello di altri strumenti come ChatGPT DeepResearch. Tuttavia, il costo per compito di Manus è significativamente inferiore (2 dollari per attività), rendendolo un’opzione interessante per utenti individuali e piccoli team.

“Riprova tra qualche minuto”

Il messaggio “A causa dell’attuale elevato carico di servizio, le attività non possono essere create. Riprova tra qualche minuto” è apparso sullo schermo un paio di volte, provando ad avviare nuove richieste, e occasionalmente Manus si è bloccato su una determinata pagina per un lungo periodo di tempo.

Secondo il giudizio di MIT Technology Review, se il team di Manus rafforzerà la sua infrastruttura server, lo strumento potrebbe diventare la scelta preferita per i singoli utenti, in particolare i professionisti impiegatizi, gli sviluppatori indipendenti e i piccoli team.

Il processo di lavoro di Manus sembra relativamente trasparente e collaborativo. Pone attivamente domande lungo il percorso e conserva istruzioni chiave come “conoscenza” nella sua memoria per un uso futuro, consentendo un’esperienza agentica facilmente personalizzabile. È anche utile che ogni sessione sia ripetibile e condivisibile.

Conclusioni

MIT Technology Review tira le conclusioni del suo “esperimento”: Manus rappresenta un passo significativo verso l’adozione di agenti AI autonomi. La sua trasparenza e capacità di personalizzazione lo rendono uno strumento prezioso per molteplici applicazioni. Sebbene ci siano ancora aree da migliorare, Manus dimostra che le aziende cinesi non stanno solo seguendo le orme dei loro omologhi occidentali, ma stanno attivamente plasmando il futuro dell’intelligenza artificiale in modo innovativo.

Articoli correlati

Articolo 1 di 4