Il riconoscimento facciale è un metodo biometrico di identificazione di un individuo che funziona confrontando i dati di acquisizione in diretta o un’immagine digitale con il record memorizzato per quella persona. Un sistema fino ad oggi utilizzato in ambito security ma che si appresta a rivoluzionare il mondo degli smartphone, i pagamenti digitali, i sistemi di accesso alle app e tanto altro, grazie all’integrazione di nuovi algoritmi di intelligenza artificiale e alla rapida evoluzione delle reti neurali.
Riconoscimento facciale, cos’è
Un sistema di riconoscimento facciale (in inglese face recognition) è una soluzione tecnologica in grado di identificare una persona attraverso la valutazione dell’immagine del suo volto basandosi su una o più immagini che la ritraggono. L’applicazione di algoritmi di intelligenza artificiale ha reso queste soluzioni più sofisticate, rendendo possibile l’identificazione dei volti anche attraverso le variazioni della loro apparenza e il riconoscimento di una serie di informazioni aggiuntive alla mera identificazione, come età, genere, etnia, stato d’animo manifestato, e altro. Secondo alcuni ricercatori, grazie alle reti neurali, oggi un elaboratore può essere in grado di riconoscere una persona in mezzo a milioni di volti meglio di un essere umano.
Come funzionano le soluzioni di riconoscimento facciale?
Ma andiamo con ordine. Dopo aver visto cos’è il riconoscimento facciale, vale innanzitutto la pena di capire come funzionano concretamente questi sistemi.
La maggior parte dei sistemi di riconoscimento facciale attualmente in commercio, spiegano da TechTarget, funzionano con codici numerici chiamati “faceprints”. Tali sistemi identificano un determinato numero di punti chiave o “nodali” su un volto umano. In questo contesto, i punti chiave o nodali sono punti di riferimento utilizzati per misurare le variabili del volto di una persona, come la lunghezza o la larghezza del naso, la profondità degli occhi e la forma degli zigomi. Questi sistemi funzionano catturando dati per i punti nodali su un’immagine digitale del volto di un individuo e memorizzando i dati risultanti come una impronta facciale. L’impronta facciale può quindi essere utilizzata come base per il confronto con i dati acquisiti da facce in un’immagine o un video.
I sistemi di riconoscimento facciale basati sulle “impronte facciali” possono identificare rapidamente e con precisione gli individui “obiettivo” quando le condizioni sono favorevoli. Tuttavia, se il volto del soggetto è parzialmente oscurato o in un profilo anziché rivolto in avanti o se la luce è insufficiente, il software è meno affidabile. La tecnologia sta rapidamente evolvendo per superare questi limiti e ci sono diversi approcci, come la modellazione 3D e l’applicazione di algoritmi di Machine learning che si basano su reti neurali artificiali, che possono accelerarne il progresso. Secondo l’Istituto Nazionale di Standard e Tecnologie (NIST), l’incidenza dei falsi positivi nei sistemi di riconoscimento facciale è stata dimezzata ogni due anni dal 1993 e, a fine 2011, era solo dello 0,003%.
Reti neurali possono essere utilizzate per confrontare i milioni di volti memorizzati nel database in tempi rapidissimi e per consentire al sistema di apprendere autonomamente nuove informazioni utili per le successive analisi, portando i sistemi di riconoscimento facciale ad un livello più evoluto. La caratteristica della rete neurale è quella di apprendere tramite esperienza, similmente a quanto avviene nel cervello umano, e di generalizzare le conoscenze acquisite per poter fare previsioni. Grandi reti neurali necessitano di grandissima capacità di elaborazione. Di recente, Intel ha annunciato ufficialmente la prima famiglia di processori nata appositamente per l’Intelligenza Artificiale, Nervana Neural Network Processor (NNP).
Gli ambiti applicativi del riconoscimento facciale
Come dicevamo, oggi un dispositivo autonomo può rivelarsi più efficace di un essere umano nel riconoscimento del volto di una persona in mezzo a milioni di volti, e nell’acquisizione e l’elaborazione di ulteriori informazioni attraverso la visione. Proprio per queste caratteristiche i sistemi di riconoscimento facciale vengono da sempre e comunemente usati per scopi di sicurezza, e sono sempre più utilizzati anche in una varietà di altre applicazioni.
La videosorveglianza può beneficiare enormemente degli avanzamenti compiuti nell’ambito dell’Intelligenza Artificiale, della computer vision, e del riconoscimento facciale. Movidius, azienda di Intel, ad esempio, ha integrato la sua VPU (Vision Processing Unit) Myriad 2 nelle videocamere di Dahua Technology USA, ottenendo in un dispositivo a basso consumo energetico funzionalità che vanno oltre il monitoraggio e la registrazione delle immagini. Le nuove capacità analitiche avanzate di queste videocamere di sorveglianza comprendono riconoscimento facciale, monitoraggio della densità e conteggio delle persone, visione stereoscopica, esame del comportamento degli individui, riconoscimento di comportamenti illeciti di veicoli. La combinazione della VPU Myriad 2 di Movidius con la soluzione di percezione della profondità di Intel RealSense, consente al sistema di vedere in maniera tridimensionale e di comprendere il contesto ambientale. Una soluzione molto efficace per dispositivi autonomi.
Abbiamo visto in tempi recenti, come applicazioni di riconoscimento facciale si siano estese all’interno del mondo degli smartphone. Alcuni sistemi di pagamento mobile utilizzano il riconoscimento facciale per autenticare gli utenti in modo sicuro e sistemi di riconoscimento facciale possono essere strumenti utili per andare oltre l’annoso problema di dover ricordare numerose password per i login delle diverse applicazioni che ogni utente utilizza, spesso quotidianamente. Il lancio dell’iPhone X di Apple ha acceso i riflettori su questa tecnologia, portandola maggiormente all’interno del dibattito pubblico. Uno smartphone di nuovissima generazione che, tra le sue novità principali, ha proprio un sistema di Face ID. Face ID si propone, in prima istanza, di liberare gli utenti dalla necessità di digitare una password, o premere un pulsante per il riconoscimento dell’impronta digitale, per accedere al proprio device. Ma l’obiettivo dichiarato di casa Apple è portare Face ID a livello di sistemi di pagamento, accesso ecc. Un’evoluzione insomma che poggia le sue fondamenta proprio sui sistemi di riconoscimento facciale e l’Intelligenza Artificiale. Le potenzialità in campo mobile sono molto ampie.
Computer vision e intelligenza artificiale entrano anche in altri modi all’interno del mondo degli smartphone. Motorola, ad esempio, si avvale della computer vision e Deep Learning in un accessorio per i suoi smartphone: la videocamera a 360 gradi Moto Mod. L’accessorio integra una VPU Myriad 2 di Movidius di Intel, di cui abbiamo parlato anche in precedenza, per il video stitching (ovvero il metodo per produrre un’immagine hd complessa a partire da molte immagini acquisite) necessario ad ottenere video a 360 gradi in tempo reale e con un basso consumo energetico.
Le capacità di riconoscimento facciale degli smartphone, oltre agli ambiti già accennati, comprendono l’etichettatura delle immagini e altri scopi di integrazione di social networking nonché il marketing personalizzato.
Riconoscimento facciale nella ristorazione
Baidu, uno dei motori di ricerca più utilizzati in Cina, da pochi mesi ha stretto una partnership con Kfc, famosa catena di fast food. L’obiettivo è sperimentare un nuovo tipo di punto vendita: lo Smart Restaurant. Un nuovo modello di punto vendita dove già oggi, a Pechino, è possibile ricevere raccomandazioni da un computer che studia l’età dei clienti, il loro genere e le espressioni facciali. Un modello che punta a capire i desideri delle persone, le loro preferenze e, attraverso il riconoscimento facciale, determinarne l’umore dei clienti fino ad arrivare a pronosticare, con un livello di errore contenuto, i loro ordini.
Arte, cinema e intrattenimento: la scommessa di Intel con le videocamere 3D RealSense
Un altro interessantissimo caso applicativo, concreto e di successo, delle tecnologie di riconoscimento facciale è quello che riguarda le videocamere a scansione 3D Intel RealSense e il progetto “La storia prende vita” sviluppato in Cina. Un progetto che ha permesso di proiettare film di animazione sulle mura delle città cinesi portando i giovani all’interno di grandi eventi storici.
Eventi che nei mesi scorsi sono stati proiettati sulle mura dell’antica capitale di Xi’an per poi “rivivere” anche in altre città cinesi. Nello specifico, i partecipanti sono stati posizionarsi davanti a un chiosco realizzato con videocamere Intel RealSense. Le videocamere hanno sviluppato le scansioni 3D del volto delle persone per poi integrarlo nei volti dei personaggi di una serie di film di animazione. Tutti i dettagli sul progetto sono disponibili a questo indirizzo.
Droni che riconoscono oggetti e animali possono salvare l’ambiente
Computer vision e Intelligenza Artificiale integrata sono anche due caratteristiche molto utili per i droni di ultima generazione. Quest’anno DJI ha presentato il suo mini drone Spark, con a bordo una VPU Myriad 2 Movidius di Intel, in grado di localizzare oggetti, avere consapevolezza del contesto e produrre mappature 3D. Spark è capace inoltre di riconoscere il volto di chi lo utilizza e di capire quando alzarsi in volo, e può essere controllato attraverso i gesti. Tutte queste funzionalità lo rendono fra i droni più intelligenti disponibili.
Droni e intelligenza artificiale si rivelano molto utili anche per spedizioni di ricerca in luoghi pericolosi e studio della salute di specie animale. Lo dimostra il programma di Intel e Parley for the Ocean per proteggere gli oceani del mondo e le specie marine. In particolare, la collaborazione ha dato origine a Parley SnotBot, una piattaforma tecnologica basata sul Machine Learning di Intel capace di riconoscere un determinato animale e dare indicazioni sulla sua salute in tempo reale.
E non solo animali e ambiente. Riconoscimento facciale e intelligenza artificiale posso aiutare anche a salvare vite umane. Intel collabora con un’organizzazione no-profit per difendere i bambini dagli abusi sessuali in Rete. Attraverso un sistema in grado di riconoscere in breve tempo tantissime immagini di bambini, deducendone età, tratti somatici e altre variabili, e confrontandole con database di bambini scomparsi, gli investigatori riescono ad operare con maggiore velocità per salvare la vita dei bambini, laddove il tempo può essere un fattore davvero determinante.