Il ruolo sempre più rilevante che i dati rivestono ha reso necessario creare, nel mercato del lavoro, una nuova figura professionale altamente specializzata: il Data scientist.
Il ruolo di tali professionisti è profondamente innovativo oltre che di fondamentale importanza: ad essi, infatti, si affida sinteticamente il ruolo di compiere un’approfondita analisi sui dati acquisiti da vari sistemi in uso all’azienda e di elaborare, sulla base di tali dati, dei report che possano servire all’azienda per pianificare strategie di natura eterogenea.
In poche parole, si tratta di una figura il cui compito è quello di “riordinare” i dati, i quali altrimenti, data la loro quantità, sarebbero del tutto inutilizzabili oltre che sconnessi fra loro.
Data science: perché è importante
Oggi, ogni organizzazione si serve di innumerevoli dati per poter svolgere le proprie attività. L’utilizzo consapevole dei Big Data, tuttavia, costituisce il vero punto di forza che permette a un’azienda di acquisire un vantaggio competitivo sule altre, pianificando le proprie azioni, perfezionando i processi produttivi e i modi di relazionarsi col cliente, creando nuove soluzioni e nuovi prodotti che consentano di aumentare il fatturato con rischi contenuti, senza ledere la continuità.
Si pensi soltanto che la quantità di dati prodotti nel 2021 si stima ammonti a oltre 1 zettabyte (1021 byte), concretamente corrispondenti a circa 180 milioni di volte il numero di documenti conservati nella Biblioteca del Congresso di Washington.
In questo marasma di dati, comprendere quali e quanti di essi siano fondamentali per la crescita dell’azienda e quali, invece, non lo siano, è un’attività molto più complessa di quanto non si possa pensare.
Per tale motivazione nasce la figura del Data scientist, oramai essenziale specialmente all’interno delle aziende che fanno dei dati il proprio valore principe, affinché i Big Data, nella loro versione grezza, possano essere interpretati in funzione delle necessità e delle peculiarità dell’azienda stessa.
In concreto, la data science può avere molteplici scopi:
- analizzare il tasso di abbandono dei clienti, al fine di comprendere come aumentarne la fidelizzazione;
- rendere i processi produttivi più efficienti, dalla creazione alla consegna finale, contenendo i costi;
- in ambito sanitario, può permettere ai medici di diagnosticare le malattie con maggior anticipo;
- prevedere i guasti meccanici;
- fornire consigli automatizzati ai clienti in base alle preferenze e agli acquisti già fatti.
Le innumerevoli possibilità di utilizzo rendono, così, la data science una delle principali risorse strategiche nelle quali investire per potersi garantire una posizione stabile sul mercato e distinguersi dalla concorrenza.
Chi è il Data scientist
Che cosa fa, dunque, il Data scientist? Come anticipato in premessa, il Data scientist si occupa di riorganizzare ed elaborare i dati forniti dai sistemi aziendali, i quali possono essere di tre tipologie principali:
- Human generated, ossia creati da un utente tramite l’utilizzo di un determinato sistema, come un social o un sito web;
- Machine generated, ovvero prodotti da fonti di natura meccanica, come i sensori);
- Business generated, ossia derivanti sia da fonti umane che meccaniche.
A loro volta, tali dati possono essere:
- Strutturati: organizzati secondo categorie e, quindi, intelligibili anche da parte di un sistema automatizzato, come i dati di geolocalizzazione, i numeri di vendita e il traffico generato su un sito web;
- Non strutturati, ossia non organizzati in categorie e maggiormente difficili da classificare, come le recensioni, i video, i messaggi lasciati dai clienti sui social media, e altro.
È proprio in relazione ai dati non strutturati che assume maggior valore la figura del Data scientist, il quale, tramite le proprie competenze, codificherà e classificherà tali dati, rendendoli così un valore aggiunto.
L’analisi dei dati e la loro trasposizione in elaborati comprensibili, tramite l’utilizzo di linguaggi di programmazione, permettono all’azienda di sviluppare dei veri e propri modelli strategici predittivi, che permettono di prevedere e ridurre i rischi (derivanti, ad esempio, dall’interruzione di un processo produttivo a causa di un malfunzionamento delle macchine), creare delle campagne di marketing mirate sugli interessi del cliente target, comprendere i trend del mercato.
Come diventare Data scientist
Poiché trattasi di una figura professionale altamente specializzata, i Data scientist sono soggetti dotati sempre di una laurea, preferibilmente magistrale e, nella grande maggioranza dei casi, anche di un PhD. Poiché non ha competenze meramente tecniche, le lauree principali che consentono di sviluppare le conoscenze di base possono essere Ingegneria, Informatica, matematica, Statistica e perfino Economia.
Essendo una figura di recente creazione, si rende necessario in ogni caso integrare il proprio percorso di studi con corsi di specializzazione interdisciplinari, che consentano di maturare soft skills e competenze tecniche peculiari, oltre che altamente specialistiche.
Sulla base dell’analisi svolta da Forbes, al fine di diventare un data scientist è consigliabile:
- Scegliere un percorso di studi universitario che preveda l’approfondimento della Data science (oggi presenti in alcune delle principali università italiane, anche come Master di II livello, tra cui anche il master in “Business Analytics And Big Data” offerto dal Politecnico di Milano), o che consenta di maturare competenze informatico-statistiche;
- Apprendere il funzionamento dei principali sistemi di programmazione, come SQL, Python e R;
- Svolgere degli studi approfonditi in relazione al settore in cui si intende cercare lavoro (ad es: il settore dell’energia, della finanza, della sanità o dei social media), ai punti di forza e di debolezza dello stesso;
- Approfondire le proprie conoscenze anche tramite gli innumerevoli strumenti che sono disponibili online, come video, corsi, articoli specialistici e interviste ai professionisti del settore;
- Nel caso in cui non si abbia un titolo di studio universitario, seguire un corso intensivo come Bootcamp che consenta di maturare le necessarie competenze tecniche;
- Unirsi alle community di data scientist presenti online, anche al fine di scambiare preziosi pareri e consigli;
- Affinare le soft skills legate alla comunicazione, dovendo il data scientist necessariamente lavorare all’interno di un team, oltre che interfacciarsi costantemente con i diversi reparti aziendali e con il management per la definizione delle strategie aziendali.
Il ruolo del Data scientist nell’intelligenza artificiale
Sulla base di quanto affermato da Forbes, è possibile pertanto comprendere che il Data scientist deve possedere competenze del tutto eterogenee, di natura sia tecnica che economica. Dati, questi, confermati dall’analisi, svolta dall’Osservatorio Big Data & Business Analytics, delle offerte di lavoro presenti su LinkedIn, nelle quali si richiedono quali requisiti fondamentali:
- conoscere e saper utilizzare almeno un linguaggio di programmazione, come R o Python, in quanto consente al Data scientist di tradurre concretamente i dati in statistiche e report;
- capacità di sviluppare e implementare algoritmi di Machine Learning;
- capacità di comunicare e presentare i risultati agli utenti di business;
- conoscenza approfondita di modelli matematico-statistici e del funzionamento degli algoritmi, in particolar modo di Machine Learning;
- capacità di esporre le evidenze risultanti dall’analisi dei dati in modo sintetico e semplice.
A tali competenze base possono aggiungersi poi, in base al settore di riferimento, ulteriori competenze trasversali, connesse ad esempio alle migliori tecniche di marketing o agli strumenti di diagnosi utilizzati nel settore sanitario, o maggiormente specialistiche, come:
- capacità di lavorare in squadra e di saper accogliere positivamente i feedback ricevuti dai vari settori aziendali;
- capacità di condividere le proprie conoscenze e competenze con gli altri membri del team;
- capacità di comprendere i servizi e i prodotti di punta dell’azienda, allo scopo di contestualizzare correttamente le analisi dei dati, prevedere il comportamento dei sistemi e implementare i sistemi di Machine Learning;
- conoscenza di metodi e tecnologie per la gestione di progetti innovativi data-driven.
Da ultimo, si richiede anche al Data scientist di possedere doti creative, in quanto, come ribadito, deve sì analizzare i dati prodotti dai sistemi, ma anche rappresentarli a soggetti che possiedono capacità e competenze differenti dalle proprie, in modo semplice e schematico, secondo un processo strutturato in tre fasi:
- preparazione e comprensione dei dati oggetto di analisi, tramite una scrematura dei dati ottenuti. Per svolgere tale compito sarà possibile anche far uso dei c.d. feature selector, strumenti che consentono di “filtrare” quelle informazioni che hanno scarsa probabilità di incidere sul risultato finale dell’analisi;
- analisi dei dati selezionati per mezzo di algoritmi innovativi che consentano di creare dei modelli predittivi o di fornire delle informazioni sullo stato dei sistemi o delle vendite;
- elaborazione di un report nel quale confluiscano i risultati ottenuti, schematizzato e strutturato in base al destinatario cui quello specifico report è destinato: per tale ragione, occorre che il Data scientist sia anche in grado di relazionarsi efficacemente con soggetti appartenenti ai settori amministrativi aziendali, oltre che con i tecnici.
Quanto guadagna un Data scientist in Italia e negli Usa
Appurata l’importanza del ruolo del Data scientist e l’aumento della richiesta di tale figura professionale all’interno delle aziende, specialmente se strutturate, occorre, da ultimo, analizzare quale sia la retribuzione media sul mercato del lavoro di tali professionisti.
Stando ad una ricerca condotta dall’Osservatorio Big Data Analytics & Business Intelligence, vi è una differenza piuttosto sostanziale fra e gli USA e il resto dei Paesi, inclusa l’Italia, nella retribuzione dei Data scientists: negli USA, un professionista del settore guadagnerebbe, in media, circa 110mila dollari annui (probabilmente a causa della presenza di una seniority media più elevata), contro una retribuzione media, a livello internazionale, di circa 68mila dollari annui (circa 58mila euro). In Italia, si calcola una retribuzione media pari a circa 30mila-40mila euro annui, inferiore quindi alla media internazionale.
Occorre sempre ricordare, tuttavia, che la retribuzione effettiva varia molto in base all’età, all’esperienza maturata dal professionista, al settore di riferimento nel quale si opera, alla posizione ricoperta (che può essere una posizione di responsabilità o di gestione di un intero team di analisti), arrivando talvolta a retribuzioni che superano i 170mila dollari annui, e che lo stipendio medio sta crescendo con l’aumento dell’offerta di lavoro e della specializzazione dei Data scientist nei diversi settori di operatività.
Infatti, stando alle statistiche elaborate dal Bureau of Labor Statistics (BLS) Statunitense, la richiesta di Data scientists è destinata a crescere progressivamente nei prossimi anni, con un aumento dei posti di lavoro dell’11% entro il 2024.