SAS Point of View

Dati sintetici: l’innovazione chiave per superare le sfide dell’AI



Indirizzo copiato

Quando i dati di qualità non sono sufficienti per il training, si può ricorrere a un prodotto dell’AI generativa che ne crea artificialmente tramite algoritmi in grado di imitare fedelmente i dati reali. Per questo, SAS ha acquisito le tecnologie sviluppate da Hazy

Pubblicato il 29 nov 2024



dati sintetici

L’ascesa dell’intelligenza artificiale ha creato, per certi versi, una scarsità di dati. Potrà sembrare strano. Non è una vera e propria mancanza; al contrario, esiste una quantità sorprendente di dati che cresce in modo esponenziale. Il problema non è la quantità, ma l’idoneità. I dati disponibili spesso non sono sufficientemente rappresentativi, completi o sicuri per addestrare modelli di AI avanzati. È qui che entrano in gioco i dati sintetici, un prodotto dell’AI generativa che permette di supplire alla mancanza di dati di qualità.

Cosa sono i dati sintetici e perché sono così importanti

In termini semplici, i dati sintetici sono creati artificialmente tramite algoritmi in grado di imitare fedelmente quelli reali. Pensiamo, per esempio, a generare casualmente 100mila date di nascita.

Le cose si complicano, però, quando i dati sintetici vengono usati per colmare lacune specifiche in un dataset. Supponiamo di avere bisogno di 100mila date di nascita di donne registrate di recente per votare: qui la generazione sintetica si adatta a esigenze molto mirate.

Ma la loro vera forza si manifesta nei casi rari. Ad esempio, consideriamo un dataset sui pazienti sotto i 35 anni con diagnosi di cancro alla prostata, o immagini che mostrano segni di usura nelle bronzine dei pistoni. Questi dati, oltre a essere difficili da raccogliere, possono essere troppo sensibili per un utilizzo diretto. I dati sintetici consentono di superare queste barriere, garantendo informazioni utili senza compromettere la privacy.

Proprio per affrontare queste sfide, SAS ha acquisito le tecnologie di dati sintetici sviluppate da Hazy, un’azienda leader nel settore. Questa mossa strategica rafforza il portafoglio di soluzioni SAS, integrando capacità di generazione di dati sintetici per soddisfare le esigenze di un mercato sempre più regolamentato e competitivo.

foto di_SAS

SAS e Hazy per l’innovazione nei dati

Con questa acquisizione, SAS punta a migliorare i suoi strumenti di analisi e AI generativa, permettendo ai clienti di creare dataset sicuri, rappresentativi e completi, senza il rischio di violare la privacy o le normative. Un approccio che consolida la posizione dell’azienda come leader nella gestione e nell’innovazione dei dati.

Con la tecnologia Hazy integrata in SAS Data Maker, la possibilità di simulare molteplici scenari futuri offrirà ai clienti SAS un vantaggio competitivo significativo grazie a:

  • Maggiore innovazione e ricerca, grazie all’accesso a set di dati sintetici precedentemente inaccessibili, favorendo nuove opportunità e scoperte.
  • Riduzione del time-to-market, attraverso la generazione rapida di dati sintetici di alta qualità, accelerando i cicli di sviluppo dei progetti di AI.
  • Sistemi di AI affidabili, supportati da processi robusti e dataset sintetici diversificati, che consentono alle organizzazioni di sviluppare sistemi di intelligenza artificiale conformi a standard etici.
  • Maggiore privacy e sicurezza dei dati, tramite la generazione di dati sintetici che non rivelano informazioni reali o identificabili, garantendo alle organizzazioni di operare con sicurezza.
  • Riduzione dei costi, minimizzando la dipendenza da metodi costosi di raccolta dati, rendendo i dati per l’analisi più accessibili.

I dati sintetici, abilitatore di innovazione

L’accesso a dataset ampi, diversificati e sicuri è essenziale per lo sviluppo di modelli AI affidabili. Tuttavia, raccogliere, annotare e proteggere i dati reali comporta costi elevati e rischi normativi crescenti. I dati sintetici risolvono questi problemi: sono privi di collegamenti a persone reali, possono essere generati con etichette già pronte e rispondono a esigenze specifiche di qualsiasi settore, dalla sanità alla mobilità.

Grazie a questa tecnologia, le aziende possono creare soluzioni avanzate che non solo rispettano la privacy, ma offrono nuove possibilità in campi complessi e sfidanti. I dati sintetici non sono solo una risorsa tecnologica, ma un vero e proprio abilitatore di innovazione.

Contributo editoriale sviluppato in collaborazione con SAS

Articoli correlati

Articolo 1 di 4