In occasione dell’ evento Google AI del 2 novembre 2022, Google ha annunciato una serie di progressi dell’intelligenza artificiale, tra cui l’AI generativa, la traduzione linguistica, l’AI per la sanità e la gestione dei disastri. L’evento si è anche concentrato molto su una discussione sugli sforzi per costruire un’AI responsabile, in particolare relativamente al controllo e alla sicurezza, aiutando a identificare l’AI generativa.
“Vediamo così tante opportunità davanti a noi e ci impegniamo a garantire che la tecnologia sia costruita per aiutare le persone, come qualsiasi tecnologia di trasformazione”, ha detto il CEO di Google, Sundar Pichai, in un video condiviso con i partecipanti. L’evento aveva lo scopo di “reimmaginare come la tecnologia può essere utile nella vita delle persone”.
Pichai ha sottolineato i rischi e le sfide che derivano dall’AI. “Ecco perché Google si è concentrata sull’AI responsabile fin dall’inizio, pubblicando principi di intelligenza artificiale che danno priorità alla sicurezza e alla privacy delle persone rispetto a qualsiasi altra cosa”, ha affermato.
Google: debutta Imagen Video – Phenaki combo
Douglas Eck, scienziato principale di Google Research e direttore della ricerca per il Brain Team di Google, ha condiviso una serie di annunci di intelligenza artificiale generativa di Google, inclusi gli sforzi per rilasciare sistemi di intelligenza artificiale text-to-image.
Mentre Google Imagen non è ancora disponibile al pubblico, la società ha annunciato che ne aggiungerà una forma limitata alla sua app AI Test Kitchen (che quest’anno ha mostrato LaMDA) come un modo per raccogliere feedback precoci. La società ha mostrato una demo chiamata City Dreamer in cui gli utenti possono generare immagini di una città progettata attorno a un tema, come, ad esempio, le zucche.
Inoltre, basandosi sul lavoro text-to-video annunciato il mese scorso, Google ha condiviso il primo rendering di un video che condivide entrambi gli approcci di ricerca text-to-video complementari dell’azienda: Imagen Video e Phenaki. Il risultato combina la capacità di Phenaki di generare video con una sequenza di istruzioni di testo con i dettagli ad alta risoluzione di Imagen.
Altri progressi di Google nell’AI generativa
Eck ha anche discusso del motore di dialogo LaMDA e del Wordcraft Writers Workshop, che ha sfidato gli autori professionisti a scrivere narrativa sperimentale usando LaMDA come strumento.
Google rilascerà presto un documento di ricerca su questo, ha detto Eck.
“Abbiamo scoperto che usare LaMDA per scrivere storie complete è un vicolo cieco”, ha detto. Anche l’interfaccia utente deve essere corretta, ha aggiunto, fungendo da “editor di testo con uno scopo”.
Eck ha anche sottolineato gli sforzi di Google per utilizzare l’intelligenza artificiale per generare codice, così come la ricerca recentemente introdotta da AudioLM che, senza bisogno di uno spartito musicale, estende l’audio da qualsiasi clip audio inserita – e DreamFusion, il rendering text-to-3D recentemente annunciato che combina Imagen con le funzionalità 3D di NeRF.
“Non ho mai visto così tanti progressi nello spazio generativo, il ritmo è davvero incredibile”, ha detto Eck.
Google sta realizzando un traduttore vocale universale
Dopo aver esaminato una serie di progressi di Google nella ricerca sull’intelligenza artificiale linguistica, il leader di Google Brain, Zoubin Ghahramani ha annunciato lo sforzo dell’azienda per riflettere la diversità delle lingue del mondo e un ambizioso tentativo di costruire un modello che supporti le prime 1000 lingue del mondo.
Inoltre, Google sta costruendo un modello vocale universale addestrato su oltre 400 lingue, con l’affermazione che è la “più grande copertura di modelli linguistici vista oggi in un modello vocale”.
Forte attenzione all’AI responsabile
Marian Croak, VP of engineering di Google, e James Manyika, SVP di Google-Alphabet, hanno discusso dell’attenzione di Google sull’AI responsabile. “Penso che se vogliamo essere leader, è estremamente importante spingere lo stato dell’arte sulla tecnologia AI responsabile”, ha affermato Croak.
Google fa test contraddittori “costantemente e continuamente”, ha detto Croak. “Quindi ci assicuriamo anche di stabilire parametri di riferimento quantitativi e che possano essere misurati e verificati in tutte le dimensioni della nostra AI. Quindi, lo facciamo anche su base continuativa”.