Waymo ha lanciato un nuovo modello di ricerca AI per la guida autonoma. Il modello, denominato End-to-End Multimodal Model for Autonomous Driving (EMMA), è stato specificamente addestrato e perfezionato per la guida autonoma, sfruttando la conoscenza globale di Gemini per comprendere meglio scenari stradali complessi.
L’applicazione dei modelli multimodali
Waymo ha pubblicato un documento di ricerca sul suo nuovo modello, affermando che dimostra come i modelli multimodali possano essere applicati alla guida autonoma, esplorando al contempo i pro e i contro dell’approccio puramente end-to-end. “Costruendo sulle fondamenta di Gemini e sfruttando le sue capacità, abbiamo creato un modello su misura per compiti di guida autonoma come la pianificazione del movimento e il rilevamento di oggetti in 3D,” ha dichiarato Waymo nell’annuncio.
EMMA, prestazioni migliorate rispetto all’addestramento di modelli separati
La società ha affermato che EMMA mostra un trasferimento di compiti efficace tra le principali attività di guida autonoma. Addestrato sulla previsione della traiettoria del pianificatore, sul rilevamento degli oggetti e sulla comprensione del grafo stradale, EMMA ha mostrato prestazioni migliorate rispetto all’addestramento di modelli separati per ciascun compito, ha affermato Waymo.
Futuro della ricerca sulla guida autonoma
Waymo ha dichiarato che la ricerca suggerisce “un promettente percorso di ricerca futura, dove ancora più compiti fondamentali di guida autonoma potrebbero essere combinati in un setup simile, ma ampliato”.
“EMMA è una ricerca che dimostra la potenza e la rilevanza dei modelli multimodali per la guida autonoma,” ha detto Drago Anguelov, vicepresidente e capo della ricerca di Waymo. “Siamo entusiasti di continuare a esplorare come i metodi e i componenti multimodali possano contribuire a costruire un sistema di guida ancora più generalizzabile e adattabile.”
Capacità di elaborazione di EMMA
La ricerca di Waymo include la capacità di EMMA di elaborare input grezzi da telecamere e dati testuali per generare vari output di guida, uno spazio linguistico unificato che consente a EMMA di massimizzare la conoscenza del mondo di Gemini e il suo ragionamento a catena per migliorare il processo decisionale e migliorare la pianificazione end-to-end.
Waymo ha affermato che l’importanza della ricerca si estende oltre i veicoli autonomi. “Applicando tecnologie AI all’avanguardia a compiti del mondo reale, stiamo espandendo le capacità dell’AI in ambienti complessi e dinamici.”