news

Dal MIT un framework per dotare i robot di senso comune



Indirizzo copiato

Grounding Language in DEmonstrations (Glide) utilizza i LLM per dotare i robot di senso comune, permettendo loro di interpretare e interagire con l’ambiente circostante in modo più efficace

Pubblicato il 2 apr 2024



Glide

Un team di ricercatori del MIT ha messo a punto un framework che sfrutta i grandi modelli linguistici per dotare i robot di senso comune. Gli ingegneri del Laboratorio di Informatica e Intelligenza Artificiale (CSAIL) del MIT hanno sviluppato il framework Grounding Language in DEmonstrations (Glide), che consente ai robot di utilizzare le informazioni generate dai grandi modelli linguistici come base per compiti di manipolazione, fornendo loro una comprensione basilare e indicazioni su come interagire con l’ambiente circostante.

Il framework Glide sostituisce le operazioni umane

Tradizionalmente, un programmatore umano avrebbe dovuto etichettare manualmente e assegnare azioni per un robot da eseguire o le competenze sarebbero state insegnate attraverso dimostrazioni umane. Il framework Glide automatizza questo processo. Un operatore umano sollecita un grande modello linguistico a trasformare istruzioni ad alto livello “in un piano astratto passo-passo in linguaggio”. Il modello fornisce una sorta di progetto base che evidenzia dettagli importanti su ciò che sta accadendo in una scena, come posizioni specifiche o caratteristiche rilevanti. Questo aiuta il robot a comprendere il contesto in cui si trova.

Successivamente, il modello collega queste comprensioni alle capacità del robot, delineando sia i modi efficaci per svolgere compiti che gli errori potenziali da evitare. Le informazioni forniscono al robot le necessarie indicazioni e il contesto per comprendere i limiti e i requisiti coinvolti nel completamento di un compito. I ricercatori hanno testato il framework su un sistema di braccio robotico che tentava di raccogliere materiali da un tavolo.

Glide

Tuttavia, Glide non è esente da limitazioni. Secondo un articolo che dettaglia il framework, richiede numerosi tentativi di prova ed errore in un ambiente ripristinabile per raccogliere informazioni sul completamento con successo delle fasi di un compito.

Articoli correlati

Articolo 1 di 4