100 milioni di immagini per identificare 1000 oggetti, così si “allena” una rete neurale con algoritmi di Machine Learning che, per il mondo dell’Automotive, devono poter contare su un training lento ma efficace per ridurre al minimo i margini di errore. Si parla di 800 terabyte di dati solo per l’identificazione degli oggetti, dov’è quindi necessaria una Data Platform ottimizzata
Automotive: le auto connesse hanno bisogno del Machine Learning…
È un mercato che si presta a raggiungere un valore di 112,6 miliardi di dollari entro i prossimi quattro anni, con un numero di veicoli connessi in circolazione destinato a toccare gli oltre 220 milioni di unità.
Un mercato, quello dell’Automotive, da cui deriva una mole di dati che si muove nell’ordine dei petabyte. «Queste sono le grandezze con cui ci siamo confrontati con tutti i player del settore con i quali collaboriamo. E sono dati da gestire», sono le considerazioni di Stefan Ebner, Innovation & Strategy Manager di NetApp, azienda che negli ultimi 18 mesi ha intrapreso un grande percorso evolutivo con focalizzazione su mercati verticali come quello dell’Automotive, cui si aggiungo anche i settori Healthcare e Insurance/Banking. «Dobbiamo renderci conto che la macchina è un dispositivo stupido. L’intelligenza viene dalle reti neurali e dalle elaborazioni fatte nel datacenter e poi trasferite alla macchina in tempo reale».
Per fare in modo che queste auto “stupide” diventino intelligenti al punto da ridurre al minimo i margini di errore (per la sicurezza delle persone), servono reti neurali e algoritmi di Machine Learning. Su una rete neurale il training richiede 100 milioni di immagini per poter identificare con precisione circa mille oggetti. Grandezze che tradotte in dati significa circa 800 terabyte (solo per l’identificazione degli oggetti).
…ma il Machine Learning ha bisogno di tempo
Nell’ambito delle connected car, le macchine di test producono fino a 15 terabyte di dati al giorno, quantità che si rendono necessarie per elevare la qualità delle soluzioni, partendo dalla consapevolezza che oltre ai dati è necessario prendere in esame anche i metadati (informazioni che descrivono un oggetto di cui bisogna quindi tenere conto per ogni singola immagine).
«Un sistema di Machine Learning può dare risultati in sei mesi di buon training. Ma quando parlo di sei mesi parlo di un risultato che garantisca all’utente pochi margini di errori. Per avere risultati poco attendibili non serve investire nel Machine Learning: tanto vale indovinare o andare a caso», dice con un misto di ironia e provocazione Ebner. Parole dalle quali si intuisce la strategia dell’azienda: «noi proponiamo una nuova modalità di gestione di questi dati, che ricordiamo non sono strutturati, con object storage ed elastic search».
In concreto, significa – per NetApp – lavorare allo sviluppo e realizzazione di una Data Platform che sia realmente in grado di ospitare tutti i dati di cui c’è bisogno e che vengono generati. In altre parole, una base infrastrutturale che integra tecnologie di Intelligenza Artificiale e Big Data Analytics la quale diventa l’elemento abilitante per sofisticati progetti IoT come quello delle auto connesse nel settore dell’Automotive.