È il tempo del lavoro ibrido (hybrid work), combinazione dell’attività lavorativa svolta da remoto e in ufficio, che, grazie all’emergenza sanitaria, ha conosciuto uno sviluppo senza precedenti. In questo contesto di riorganizzazione del lavoro online e a distanza, ha avuto un forte impulso l’adozione di app e piattaforme di videoconferenza da parte di pubblica amministrazione e aziende per gestire riunioni lavorative. E, contemporaneamente, è cresciuto significativamente l’impiego di funzionalità alimentate dall’intelligenza artificiale, integrata nei principali software per meeting online.
La diffusione crescente dello smart working
Secondo Gartner, il numero dei lavoratori a distanza ha raggiunto nel 2021 la percentuale del 32 % rispetto al totale dei dipendenti su scala mondiale contro il 17 % del 2019. In base alle previsioni, nel 2022, negli Stati Uniti, la quota dei lavoratori da remoto sarà pari al 53 % dell’intera forza lavoro del paese. In Italia, di pari passo, è aumentato il ricorso allo smart working. Che equivale, così come definito dalla Legge n. 81/2017, a una modalità che consente di abilitare il lavoro da remoto mediante pc portatili, tablet e smartphone. Durante il lockdown, il lavoro agile (altro nome dello smart working) ha interessato 2,11 milioni di lavoratori nelle grandi imprese, 1,85 milioni nella pubblica amministrazione, 1,13 milioni nelle piccole e medie imprese, e 1,5 milioni nelle microimprese. Come sottolinea una ricerca dell’Osservatorio Smart Working della School of Management del Politecnico di Milano, il lavoro da remoto è destinato a mettere radici diventando una nuova normalità per milioni di lavoratori.
Sviluppo dell’AI nelle piattaforme di videoconferenza
Secondo un’indagine di SensorTower, il numero di utenti attivi mensili mobili di Zoom, Microsoft Teams e Google Meet, tutte insieme, è stato nel primo semestre del 2021 ventuno volte superiore a quello della prima metà del 2019, in epoca pre-pandemia, mentre, stando ai dati diffusi dalla prima edizione del Global Hybrid Work Index di Cisco, da luglio a settembre 2021 si è riscontrato un incremento di oltre il 200 per cento nell’uso delle funzionalità di intelligenza artificiale durante le riunioni tenute con piattaforme di videoconferenza.
L’AI, in particolare, è stata implementata per obiettivi di soppressione del rumore, traduzione automatica e trascrizioni, sondaggi e riconoscimento dei gesti in modo da migliorare la comunicazione e facilitare la partecipazione delle persone alla conversazione.
L’audio intelligente nelle piattaforme di videoconferenza
Google Meet
Tra le piattaforme più utilizzate, Google Meet ha sviluppato, al pari di Microsoft Teams, la tecnologia di cancellazione del rumore che rimuove suoni in grado di disturbare l’audio durante un meeting. Il modello AI, addestrato con migliaia di sessioni di riunioni online, riesce a filtrare i click sulla tastiera e delle penne, fruscii vari, chiusure di porte, lo scricchiolio di patatine fritte prese dal pacchetto e perfino l’abbaiare di cani. La funzionalità è supportata da algoritmi di apprendimento automatico che eliminano in tempo reale i rumori di fondo, una volta identificata la voce principale trasmessa in modo sicuro su cloud.
Webex
Anche l’audio intelligence di Cisco prevede un’ottimizzazione dell’aspetto vocale sulla piattaforma Webex. Che, con deep learning e tecnologia avanzata di BabbelLabs sopprime rumori e voci di sottofondo rendendo più chiara e distinta la voce dell’oratore, indipendentemente dalla lingua utilizzata.
Innovazione AI sulle piattaforme di videoconferenza
Zoom
Allo stesso modo Zoom si è affidata all’intelligenza artificiale per migliorare la qualità dell’audio. Ma l’app, che ha fatto il pieno di download durante la pandemia, ha adottato una strategia ad ampio raggio. L’AI è stata sfruttata nei più diversi aspetti per garantire un prodotto di grado avanzato e rendere più fruibile l’esperienza degli utenti.
Il virtual background (sfondo virtuale), una delle funzionalità di punta che permette di mostrare un video o un’immagine come sfondo dell’inquadratura durante una riunione, si avvale di tecnologia di visione artificiale. Zoom applica inoltre algoritmi di compressione video per dare priorità ai volti della persona quando la larghezza di banda è limitata e utilizza sistemi di elaborazione del linguaggio naturale a fini di sintesi vocale, traduzione, analisi del sentiment e trascrizione live della conversazione utile ai partecipanti in caso di trasmissione imperfetta.
In più, la piattaforma di Eric Yuan usa il machine learning per impedire frodi e zoombombing per prevenire incursioni con immagini pornografiche e spam nel corso dei collegamenti. Zoom integra peraltro l’assistente virtuale di Google che consente di avviare una sessione e ha introdotto una nuova funzione AI per selezionare le parti più importanti di una riunione.
Webex
In misura ancora maggiore, l’innovazione AI è al centro della piattaforma Webex. Più di recente, la funzione di smart voice che esclude il rumore del parlato di sottofondo di estranei è stata aggiornata con la possibilità di includere altre voci nella conversazione, benché si trovino vicino o lontano dal microfono o abbiano tono di voce alto o basso, sempre rimuovendo i fattori audio fastidiosi e di intrusi.
Ma oltre al rilevamento e alla cancellazione del rumore basato sull’apprendimento automatico, Cisco ha integrato il riconoscimento facciale e il tracciamento dello speaker con videocamere intelligenti capaci di seguire automaticamente il relatore quando cammina o si sposta nella sala, mantenendo sempre nell’inquadratura.
Webex ha del resto implementato l’AI conversazionale (tecnologia di sostegno al lavoro ibrido con piattaforme come Movework che sviluppano chatbot più potenti e abili) con un assistente ad attivazione vocale che consente di fare chiamate, avviare riunioni o condividere lo schermo senza toccare nulla. Grazie ai progressi nelle abilità sul linguaggio, Webex Assistant, basato sulla tecnologia di riconoscimento vocale di Voicea (che rende possibile registrazione e trascrizione automatica della conversazione e la trasformazione in sottotitoli real-time in più di 100 lingue durante una chiamata) e di MindMeld, è diventato anche proattivo. Vale a dire, non soltanto capace di rispondere ed eseguire azioni a comando ma anche di attivarsi per l’avvio di una riunione prevista e chiedere di partecipare.
Cisco ha indirizzato la sua attività innovativa in aree fondamentali, quali intelligenza relazionale, tecnologie audio e vocali, bot, assistenti e visione computerizzata, dove l’applicazione del machine learning può fare la differenza.
Microsoft Teams
Su una piattaforma più corrispondente alle esigenze del lavoro ibrido, sostenuta da soluzioni di intelligenza artificiale, punta pure il gruppo di Redmond. Microsoft Teams utilizza un’ampia gamma di tecnologie che vanno dal riconoscimento vocale, al riconoscimento facciale, alla comprensione del linguaggio naturale (NLU) per rendere i chatbot più efficienti, più facili da usare e più veloci (Power Virtual Agents). La piattaforma ha aggiunto funzioni come Together Mode che si affida all’intelligenza artificiale per contrastare la cosiddetta Zoom Fatigue (o “affaticamento da videochiamata”), impostando uno sfondo condiviso con tutti i partecipanti alla videoconferenza.
Video Microsoft Teams
Con Speaker Coach l’AI serve a fornire in tempo reale consigli al relatore e la funzionalità Cameo permette di migliorare le presentazioni in Power Point potendo inserire il flusso video della videocamera nelle slide e posizionare l’immagine al momento e nel punto deciso dal relatore.
Conclusioni
Più il lavoro ibrido si impone, più l’AI plasma le piattaforme che si adattano al nuovo ambiente lavorativo destinato a caratterizzare la realtà dei nostri tempi.