L’AI generativa sta definendo un intero ecosistema, dai fornitori di hardware agli sviluppatori di applicazioni, che contribuirà a concretizzare il suo potenziale di business. Il riscontro di massa ottenuto in poco tempo da questa innovazione AI non ha precedenti. Una indagine di McKinsey cerca di fornire strumenti e informazioni per comprendere la catena del valore dell’AI generativa.
AI generativa, una partenza bruciante
In effetti, siamo davanti a un processo estremamente dinamico nel quale aumentano i modelli, cresce l’adozione delle tecnologia e i casi d’uso si estendono a vari settori, dal marketing alla sanità, dalla manifattura alla moda e alla finanza. Morgan Stanley, per esempio, sta sperimentando i sistemi GPT addestrandoli su un corpus di 100mila rapporti per aiutare i consulenti finanziari a ricavare informazioni utili alla loro attività. SaleForce ha integrato la tecnologia nel suo CRM mentre il governo islandese ha avviato una collaborazione con OpenAI per utilizzare GPT-4 allo scopo di preservare la lingua del paese a rischio di estinzione.
In questo quadro di continua e rapida evoluzione, l’obiettivo dei ricercatori di McKinsey è fornire una prima base di conoscenza per poter valutare le opportunità di investimento dell’AI generativa.
Le valutazioni si basano su ricerche primarie e secondarie, tra cui più di 30 interviste con fondatori di aziende, amministratori delegati, scienziati principali e leader aziendali che lavorano per commercializzare la tecnologia; centinaia di rapporti di mercato e articoli; e dati di ricerca McKinsey proprietari.
AI generativa, le caratteristiche distintive
Per comprendere la catena del valore dell’AI generativa, secondo McKinsey, è fondamentale avere una conoscenza di base della tecnologia. Ma anche capire le differenze con altre tecnologie AI che vengono impiegate nelle aziende sulla fidelizzazione dei clienti o per predire la domanda e il prodotto migliore. Uno degli aspetti distintivi dell’AI generativa è la capacità di creare contenuti. Che possono essere testo, immagini, video e rappresentazioni in 3D (videogiochi).
La maggior parte dei modelli di intelligenza artificiale generativa produce contenuti in uno specifico formato, ma stanno emergendo anche sistemi multimodali che possono, per esempio, creare una slide o una pagina web con testo e grafica basati su prompt dell’utente.
I risultati sono la conseguenza dell’addestramento di reti neurali su enormi volumi di dati e dell’applicazione di meccanismi di attention che rende un modello capace di apprendere quali tra gli elementi di input sono più rilevanti, e quali meno, per il task che si deve svolgere.
Anche l’intelligenza artificiale tradizionale, spiegano i ricercatori di McKinsey, può utilizzare reti neurali e meccanismi di attention, ma i modelli che rientrano in questo ambito non sono progettati per creare nuovi contenuti.
I sei aspetti della catena del valore
Sviluppo e implementazione dell’AI generativa fanno emergere una nuova catena del valore a supporto di training e uso di questa tecnologia. A tutta prima, si potrebbe pensare che sia abbastanza simile a una tradizionale catena del valore dell’AI.
Dei sei aspetti principali, hardware, piattaforme cloud, foundation model, model hub, operazioni di machine learning (MLOps), applicazioni e servizi, soltanto i foundation model sono un elemento in più.
Nondimeno, un’analisi più approfondita rivela differenze significative nelle opportunità di mercato. Le basi dei sistemi di AI generativa, tanto per dare una idea, sono notevolmente più complesse della maggior parte di quelli di intelligenza artificiale tradizionali. Ciò comporta più ostacoli per le piccole aziende mentre big tech e operatori storici in questa tecnologia restano più favoriti e, a giudizio di McKinsey, continueranno a dominare molte aree del settore nel prossimo futuro.
In ogni caso, il mercato delle applicazioni dell’AI generativa costituisce la sezione della catena del valore suscettibile di maggiore e rapido sviluppo offrendo opportunità anche alle nuove imprese che vorranno sfruttare le occasioni di mercato. In questo campo, le aziende che impiegano dati proprietari e specializzati per mettere a punto le app potranno ottenere un vantaggio competitivo sui concorrenti.
Hardware e piattaforme cloud
Entrando nello specifico dei singoli aspetti, va detto che i modelli di AI generativa hanno bisogno di essere addestrati su enormi volumi di dati e questa attività richiede cluster GPU e TPU, cioè acceleratori AI per applicazioni di calcolo nell’ambito delle reti neurali. Una volta completato il training la potenza di calcolo necessaria diminuisce. Tuttavia, i ricercatori di McKinsey fanno notare che il mercato di questo hardware è spesso controllato da pochi player come Google, Nvidia e Taiwan Semiconductor Manufacturing Company Limited. Le aziende che cercano di entrare in questo segmento devono spesso affrontare costi elevati di ricerca e sviluppo.
Essendo GPU e TPU molto costose e risorse scarse, per accedere alla potenza di calcolo per sviluppare i modelli AI le aziende ricorrono alle piattaforme cloud (contro on-premises).
Ciò permette di gestire in maniera più conveniente l’attività e gestire i costi secondo necessità. Ad essere avvantaggiati in questo ambito sono i principali provider di servizi cloud che dispongono di piattaforme migliori in grado di garantire strutture hardware adeguate per i modelli AI. È più difficile per nuovi player specializzati guadagnare quote di mercato anche se in prospettiva potrebbe esserci maggiore spazio grazie al sostegno di grandi imprese.
Foundation model
Al centro dell’AI generativa ci sono i foundation model. Si tratta di modelli su larga scala preaddestrati su enormi set di dati in grado di svolgere compiti di vario genere, utilizzabili per molteplici scopi. Rappresentano i nuovi sviluppi dell’AI, orientata verso “modelli flessibili e riutilizzabili che possono essere applicati a qualsiasi dominio o attività industriale”.
Già moltissime applicazioni se ne avvalgono: da ChatGPT ai generatori di contenuti SaaS Jasper e Copy.ai.
Per sviluppare foundation model occorrono notevoli competenze in differenti campi come la preparazione dei dati, la selezione dell’architettura e la messa a punto del modello per migliorare l’output.
Inoltre, i costi sono elevati, considerando le caratteristiche del processo di sviluppo e le risorse computazionali per supportarlo.
Migliorare i risultati del modello, per esempio, implica operazioni che richiedono mesi di tempo e milioni di dollari di spesa.
Si stima che l’attività di training di GPT-3 di OpenAI abbia un costo in grado di lievitare fino a 12 milioni di dollari. Pertanto, secondo McKinsey, il mercato è appannaggio di pochi giganti tech e start-up che possono godere dell’apporto di investimenti significativi.
Sono, però, in corso cambiamenti che potrebbero aprire il settore a più attori grazie modelli più piccoli mirati a task specifici e con attività di training più efficienti.
Va evidenziato, del resto, come start-up quali Coherer, Anthropic e AI21 creano e addestrano propri LLM mentre i big tech cercano di limitare i modelli LLM nei propri ambienti per mantenere sicurezza e privacy dei dati. L’evoluzione della tecnologia, comunque, sarà condizionata da problemi che riguardano proprietà e diritti dei dati utilizzati dai foundation model.
Model hub e pratiche MLops
Per creare applicazioni da foundation model le aziende hanno bisogno di punti di storage e accesso. Ma anche di strumenti, tecnologie e pratiche MLOps onde garantire affidabilità e adattabilità dei foundation model.
I model hub tendono a fornire questi servizi più ampi per includere dati di addestramento aggiuntivi da incorporare ed etichettare e per realizzare API che permettono alle applicazioni di interagire col sistema.
Per i modelli closed-source è tipicamente lo sviluppatore del foundation model costituire un hub.
Quanto ai modelli open source, emergono model hub indipendenti che offrono una gamma di servizi.
Applicazioni
Esistono una varietà di applicazioni dei modelli di AI generativa per ciascuna diversa modalità (vedi schema sottostante). Queste applicazioni possono essere sviluppate da nuovi operatori di mercato, da provider che implementano le offerte con nuove funzionalità, o da aziende che cercano di raggiungere un vantaggio competitivo nel proprio settore.
Esistono molti modi in cui i provider di applicazioni possono creare valore. Nel breve periodo, è la stima di McKinsey, una categoria di applicazioni offre il maggior potenziale di creazione di valore. E si prevede che le applicazioni sviluppate per determinati settori e funzioni forniscano più valore nei primi giorni dell’AI generativa.
Applicazioni create da modelli ottimizzati
Per McKinsey le applicazioni dell’AI generativa rientrano in due categorie. Nella prima i foundation model vengono utilizzati come nelle applicazioni che si realizzano con elementi di customizzazione. Nelle quali si creano interfacce utente personalizzate, guide o strumenti di ricerca per documenti che aiutano i modelli a comprendere meglio i prompt dei clienti in maniera tale da assicurare output di alta qualità.
Nella seconda categoria sono incluse le applicazioni più importanti dal punto di vista della catena del valore. In questo ambito, ci sono le applicazioni che sfruttano i foundation model affinati e messi a punto, sviluppati con un set di dati specifici e parametri ad hoc, per generare output utili a un particolare caso d’uso. Gli sviluppatori del modello Harvey, ad esempio, hanno addestrato GPT-3 di OpenAI su data set in campo legale riuscendo a creare un modello dotato di una interfaccia in grado di supportare l’attività degli avvocati.
Ma le aziende potrebbero anche sfruttare i dati proprietari, come quelli di una banca, finalizzati a chatbot AI specifici per i settori. E con i feedback dei clienti migliorare i modelli di AI generativa, che ricevendo più dati tendono a svilupparsi perfezionando output e risposte, in un circolo virtuoso che può trasformarsi in un significativo vantaggio competitivo.
Gli sviluppatori di applicazioni, sottolineano i ricercatori di McKinsey, dovranno essere sempre pronti a integrare i progressi dell’AI generativa che evolve rapidamente con nuove versioni e nuovi modelli, valutando costi e benefici degli eventuali aggiornamenti.
Impatto sulle attività aziendali
Malgrado l’impatto a vasto raggio sulle funzioni aziendali a lungo termine, in questa prima fase le applicazioni dell’AI generativa, in base all’analisi di McKinsey, sono destinate a far presa soprattutto su aree come information technology, marketing, vendite, servizio clienti e sviluppo del prodotto.
Nel campo dell’information technology l’AI generativa consente di scrivere codice migliorando in maniera importante la produttività degli sviluppatori (+50%) e contribuendo ad accelerare lo sviluppo del software.
Nel marketing, le applicazioni di intelligenza artificiale generativa si possono usare per creare contenuti per i clienti. Entro il 2025, secondo Gartner, il 30% di tutti i messaggi di marketing sarà prodotto da sistemi di AI generativa.
Quanto al customer service, saranno sempre chatbot e assistenti virtuali a gestire le domande dei clienti e a fornire le informazioni richieste. Mentre nell’ambito del settore sviluppo del prodotto l’AI generativa è in grado, tra l’altro, di ridurre i tempi e rendere più efficiente la fase di progettazione.
Nel breve periodo, comparti come quello dei media e dell’entertainment sono destinati ad avere maggiori vantaggi in termini di efficienza e produzione. Contemporaneamente, anche banche, telecomunicazioni, e società che operano nei settori medici e tecnologici potranno efficientare le loro attività. E, secondo la valutazione di McKinsey, è certo che emergeranno nuovi servizi connessi allo sviluppo dell’AI generativa.
Conclusioni
Siamo davanti a una fase in cui si fa strada la tecnologia dell’AI generativa e il suo ecosistema di supporto in via di evoluzione. In questo contesto, sono le applicazioni a offrire le maggiori opportunità di creazione di valore. Aziende e start-up che riusciranno a sfruttare dati proprietari, specialmente, per la messa a punto dei foundation model ai fini di sviluppo delle applicazioni, saranno in grado di ottenere il massimo vantaggio competitivo.