Un database di oltre 20 miliardi di immagini, un algoritmo progettato per funzionare anche se il volto è coperto o non guarda in camera: Clearview AI è il software che ha reso il riconoscimento facciale di massa non più solo un’ipotesi.
Vediamo nei dettagli com’è nato, come funziona e i suoi aspetti controversi.
Cos’è Clearview AI
Clearview AI è una società statunitense che ha sviluppato l’omonimo software di riconoscimento facciale basato sull’intelligenza artificiale.
Si descrive come “la più grande rete facciale del mondo” perché possiede oltre 20 miliardi di immagini di volti, provenienti da fonti web come social media, media, siti web, acquisite tramite web scraping.
Secondo quanto riportato da AP Press, a gennaio 2022 Clearview ha ottenuto il primo brevetto per “Metodi per il reperimento di informazioni su una persona basati sul riconoscimento facciale” dallo US Patent and Trademark Office.
Su 650 algoritmi da tutto il mondo testati dal NIST – National Institute Standards of Technology, facendo la media delle diverse categorie, Clearview AI si è classificata seconda, dietro la cinese SenseTime, secondo quanto dichiarato dal co-fondatore della società, Hoan Ton-That, al Washington Post.
Nata nel 2017, Clearview AI è stata oggetto a gennaio 2020 di un’inchiesta del New York Times che l’ha fatta conoscere al grande pubblico.
L’azienda, che commercializza il software alle forze dell’ordine, ha contratti con l’FBI, il Dipartimento della Sicurezza Nazionale, l’esercito e più di 3100 agenzie di polizia degli Stati Uniti.
Almeno fino a febbraio 2020 la tecnologia è stata proposta a 88 forze dell’ordine in almeno 24 Paesi fuori dagli USA, compresa la polizia italiana, come ha svelato un’inchiesta di BuzzFeed.
Sempre Buzzfeed ha rivelato a febbraio 2020 che nella lista di account Clearview comparivano non solo forze dell’ordine o enti governativi ma anche società private in settori come l’intrattenimento (Madison Square Garden e Eventbrite), il gioco (Las Vegas Sands e Pechanga Resort Casino), lo sport (NBA), il fitness (Equinox), le criptovalute (Coinbase), la distribuzione commerciale (Kohl’s, Walmart), il settore bancario (Wells Fargo, Bank of America).
In una presentazione finanziaria di dicembre 2021, ottenuta dal Washington Post, sono state messe nero su bianco le previsioni della società: 100 miliardi di foto nel database entro 12 mesi e l’espansione del business oltre la scansione di volti per la polizia, come l’identificazione tramite il movimento o la geolocalizzazione da una fotografia.
Clearview sta affrontando diverse cause legali negli Stati Uniti, e il suo uso delle foto delle persone senza il loro consenso è stato dichiarato illegale in Canada, Francia, Australia, Gran Bretagna e Italia. Gli ultimi due Paesi hanno anche applicato sanzioni.
Facebook, Twitter e YouTube hanno chiesto all’azienda di smettere di prendere foto dai loro siti e di cancellare quelle che erano state precedentemente prese. Clearview non lo ha fatto finora perché, ha dichiarato al Washington Post Hoan Ton-That, “Crediamo che il modo in cui raccogliamo le immagini sia proprio come qualsiasi altro motore di ricerca. E questa è roba di dominio pubblico. Gli scopi per cui vengono usate penso possano essere di vero beneficio alla società”.
Video: Hoan Ton-That spiega la tecnologia di riconoscimento facciale utilizzata da Clearview
La storia di Clearview AI
Secondo quanto riportato dal New York Times, Clearview AI è nata dall’incontro tra i due co-fondatori, Hoan Ton-That e Richard Schwartz.
Ton-That, nato in Australia ma di origini vietnamite, nel 2016 si è trasferito da San Francisco a New York, dopo un paio di tentativi falliti di applicazioni per social media.
Ad una presentazione di libri al Manhattan Institute, un think tank conservatore, ha conosciuto Richard Schwartz, già consulente dell’ex sindaco di New York Rudolph Giuliani ed editorialista del New York Daily News.
Ton-That stava approfondendo intelligenza artificiale e riconoscimento facciale, Schwartz aveva molti contatti per sollecitare l’interesse commerciale verso una soluzione tecnologica: i due hanno quindi deciso di entrare in società.
Nel corso dello stesso anno, Ton-That ha coinvolto due ingegneri, uno per il programma di raccolta automatica delle immagini dei volti dal web, il web scraping, e l’altro per il perfezionamento di un algoritmo facciale derivato da paper accademici.
Alla fine del 2017 lo strumento di riconoscimento facciale, Smartcheckr, era pronto. Al primo round di investimenti hanno partecipato Peter Thiel, co-fondatore di Paypal, nel consiglio di amministrazione di Facebook, e la società di private equity Kirenaga Partners.
Nel 2019 il secondo round di investimenti, il cambio di nome in Clearview AI e il primo cliente, la Polizia di Stato dell’Indiana. A febbraio, infatti, secondo quanto dichiarato da Ton-That al New York Times, l’ente ha sperimentato Clearview e ha risolto un caso di rissa in un parco in venti minuti.
La società da allora ha coinvolto i contatti repubblicani di Schwartz per avvicinare i funzionari e le forze di polizia, con passaparola, prove gratuite di trenta giorni e licenze annuali da 2000 dollari.
A gennaio 2020 il New York Times ha pubblicato l’inchiesta “L’azienda segreta che potrebbe porre fine alla privacy come la conosciamo”.
Come funziona la sua tecnologia di riconoscimento facciale
Clearview AI è una società privata con algoritmo proprietario.
Ha un database di miliardi di immagini di volti raccolte attraverso tecniche di web scraping (dall’inglese “grattare” o “raschiare”), l’estrazione di informazioni specifiche da pagine web.
Queste immagini sono servite ad allenare l’algoritmo di matching facciale.
Secondo quanto dichiarato da Ton-That al New York Times nel 2020, il riconoscimento facciale di ClearView AI si basa sulla trasformazione dell’immagine di ciascun volto in un insieme di vettori geometrici: segmenti orientati, che misurano, ad esempio, la distanza tra gli occhi.
Sappiamo anche che il database di Clearview AI è diviso in “neighborhoods”, “quartieri”: sembra quindi che ciascun “quartiere” sia un cluster, un “raggruppamento” di foto con vettori simili.
La scomposizione del volto in vettori geometrici rende quindi possibile il clustering, una forma di apprendimento automatico (machine learning) non supervisionato, privo cioè di “etichette predefinite” che necessitano di supervisione da parte degli esseri umani.
È l’algoritmo che “impara” da solo allenandosi con grandi quantità di dati, in questo caso fotografie, a suddividerle in gruppi (cluster) con caratteristiche simili.
Quando un utente carica una foto di un volto nel sistema di Clearview, il volto viene convertito in insieme di vettori e confrontato (matching) con quelli delle foto già in memoria: il risultato della ricerca saranno le foto prese dal quartiere più simile all’insieme di vettori inserito, con i link ai siti da cui provengono le immagini trovate.
Con le parole del Garante Privacy italiano, “le fotografie vengono elaborate con tecniche biometriche per estrarre i caratteri identificativi e associare 512 vettori che ricalcano le fattezze del volto, sottoposte a hashing per indicizzarle e arricchite con metadati (come geolocalizzazione, link della fonte, genere, nazionalità o lingua della persona rappresentata)”.
L’algoritmo riesce a identificare la persona anche se non guarda verso l’obiettivo o ha il viso parzialmente coperto. Ovvero, “è progettato per tenere conto della progressione dell’età, delle variazioni di pose e posizioni, dei cambiamenti nella peluria del viso e di molte condizioni visive”, come descritto dalla società sul proprio sito internet.
Il codice del computer alla base dell’applicazione ClearviewAI, analizzato dal New York Times, include un linguaggio di programmazione per occhiali in realtà aumentata. Con fotocamera incorporata, sarebbero capaci di procedere all’identificazione in tempo reale dei volti che inquadrano.
Il Garante privacy sanziona Clearview in Italia
Il garante per la protezione dei dati personali ha sanzionato Clearview AI per 20 milioni di euro “per aver messo in atto”, si legge dal comunicato dell’Autorità, “un vero e proprio monitoraggio biometrico anche di persone che si trovano nel territorio italiano”.
Il provvedimento di marzo 2022, frutto di un’istruttoria avviata anche a seguito di diverse segnalazioni, comprende l’obbligo di cancellazione dei dati dei cittadini italiani, il divieto di ulteriori raccolte e trattamento dati e l’obbligo di designazione di un rappresentante nell’Unione Europea in aggiunta o sostituzione del titolare del trattamento dati degli Stati Uniti.
Per i dettagli dell’istruttoria e delle violazioni al GDPR accertate, leggi l’articolo dedicato.
Il ruolo nella guerra in Ucraina
A marzo 2022 l’Ucraina ha iniziato a usare la tecnologia di riconoscimento facciale di Clearview AI per identificare i combattenti russi. Lo ha dichiarato all’agenzia Reuters l’amministratore delegato della società, Hoan Ton-That.
I contatti tra Clearview AI e il governo ucraino risalgono a subito dopo l’invasione russa, quando Ton-That ha inviato una lettera a Kiev per offrire assistenza.
Più di due miliardi di foto del database di Clearview sono tratte dal social media russo VKontacte: l’accesso gratuito al motore di ricerca AI per i volti consente al governo ucraino di identificare persone ai posti di blocco, sorvegliare le case, riconoscere i cadaveri dei soldati russi e mandarne le foto ai familiari come arma di propaganda.
L’app è stata tradotta in ucraino e, secondo quanto riportato dal co-fondatore Hoan Ton-That al Washington Post il 27 aprile 2022, Clearview ha creato 410 account per gli utenti di sei agenzie governative ucraine, che hanno condotto più di 14.800 ricerche.
Video: Hoan Ton-That spiega l’utilizzo di Clearview nella guerra in Ucraina
Per approfondire il ruolo di Clearview nella guerra in Ucraina, leggi l’articolo dedicato.