Ricercatori giapponesi hanno presentato il modello OpenAI che converte prompt testuali in azioni robotiche, per semplificare l’addestramento. II risultati di una ricerca recentemente pubblicata dall‘Università di Tokyo e Alternative Machine hanno mostrato l’applicazione del modello fondamentale al robot umanoide Alter3. Il modello ha convertito i prompt testuali in azioni che il robot ha eseguito.
Come funziona il modello GPT-4 per il training dei robot
Il modello utilizza il prompt iniziale per creare una serie di movimenti che il robot deve eseguire per completare un compito. L’elenco dei movimenti viene poi tradotto in codice, che viene inserito in Alter3 affinché possa completare il compito. I ricercatori nel campo della robotica si sono sempre più rivolti ai modelli linguistici per migliorare la formazione dei robot.
I ricercatori giapponesi hanno cercato di semplificare la formazione dei robot, un compito spesso laborioso che richiede molte ore e grandi quantità di dati per aiutare il robot a comprendere il compito da eseguire. Questo nuovo approccio guidato dal modello fondamentale, tuttavia, potrebbe permettere agli sviluppatori di robotica di addestrare le unità più velocemente.
I ricercatori scrivono che prima dell’uso del modello fondamentale dovevano controllare tutti i 43 assi in un certo ordine per mimare la posa di una persona o fingere un comportamento come servire il tè o giocare a scacchi. Il modello OpenAI non è nativamente sintonizzato per i backend robotici. Invece, i ricercatori hanno impiegato l’apprendimento contestuale per adattare il modello alla generazione di azioni basate su espressioni linguistiche trasformate in codice.
Cosa può fare il modello per il robot
Il modello può generare un elenco di azioni generali da eseguire dal robot, oppure un elenco individuale per ogni parte del corpo del bot. Gli utenti possono regolare le azioni che desiderano vengano eseguite dal robot usando il linguaggio naturale, come chiedergli di alzare più il braccio quando scatta un selfie. I ricercatori hanno scoperto che le istruzioni motorie generate da GPT-4 erano di qualità superiore rispetto a quelle create usando tecniche tradizionali di addestramento robotico.
Il modello ha permesso ad Alter3 di eseguire azioni non umane, come fingere di essere un fantasma o un serpente, sfruttando l’ampia base di conoscenze di GPT-4 per capire come interpretarle come farebbe un umano. I ricercatori hanno detto che i risultati mostravano che il modello fondamentale OpenAI può generare una vasta gamma di movimenti, dalle azioni quotidiane all’imitazione dei movimenti non umani.
Il modello potrebbe persino permettere ai robot umanoidi d’esprimere meglio le risposte emotive. I ricercatori hanno detto che anche usando testo prompt dove le espressioni emotive non erano esplicitamente dichiarate, il modello fondamentale poteva dedurre emozioni adeguate e rifletterle nelle risposte fisiche de Alter3. “Questa integrazione tra comunicazione verbale e non verbale può potenziare la possibilità dì interazioni più sfumate ed empatiche con gli esseri umani,” scrivono.