L’applicazione dell’intelligenza artificiale per la risoluzioni di problemi nell’ambito della chimica o della ricerca di materiali per il settore manufacturing (leghe metalliche, polimeri, ecc.) è ciò su cui si sta concentrando da oltre quattro anni il ricercatore Teodoro Laino, Technical leader for Molecular Simulation, Research Staff Member IBM Zurich Research Laboratory (da oltre 10 anni), che abbiamo avuto la fortuna di intervistare.
«L’intelligenza artificiale non è qualcosa di nuovo ma da qualche anno si iniziano a vedere applicazioni reali che funzionano molto bene», è il positivo messaggio con cui esordisce il ricercatore. «In campo chimico il livello di complessità è piuttosto elevato però anche in quest’ambito l’intelligenza artificiale inizia a mostrare grandissime potenzialità».
L’intera vita quotidiana di ciascuno di noi è un complesso mix di chimica e matematica, ma è una cosa del tutto naturale che possiamo anche ignorare. «Quando però entriamo nel campo scientifico, servono dei parametri di valutazione che attestino la validità degli studi e della ricerca – spiega Laino -; ricercatori e scienziati odierni devono riuscire ad andare ancora oltre cercando di far capire l’importanza di alcuni studi su altre discipline. Nonostante la chimica sia una costante della vita quotidiana, rimane una disciplina che viene studiata ed applicata esattamente come cento anni fa e più. Sono cambiati gli strumenti, naturalmente, ma l’approccio è stanzialmente rimasto lo stesso. Almeno fino ad ora: l’intelligenza artificiale ha il potere non tanto di dare nuovi strumenti ma di cambiare proprio approccio alla ricerca».
L’intelligenza artificiale nella chimica
Teodoro Laino ha iniziato ormai qualche anno fa a lavorare ad un interessante progetto che vede l’intelligenza artificiale applicata alla chimica (che oggi ha dato vita ad una vera e propria soluzione applicativa: IBM RXN for Chemistry che sfrutta l’intelligenza artificiale in cloud) , in particolare allo sviluppo di sistemi cognitivi in grado di “imitare” il comportamento di scienziati e chimici con moltissimi anni di esperienza vissuta al fine di poter dare un supporto tecnologico avanzato a chi quotidianamente lavora sulle molecole, in particolare chi opera nel campo della sintesi di molecole organiche che rimane uno degli ambiti più importanti nella chimica organica (pensiamo per esempio alla farmacologia o allo studio delle droghe).
Le molecole possono essere anche molto complesse e la loro sintesi è tutt’altro che un procedimento semplice, richiede anni di analisi e test. Non solo, le conseguenze della loro integrazione e le reazioni che possono provocare su cellule biologiche (ma non solo) richiedono competenze ultra specializzate e anni di ricerca scientifica.
Gli scienziati del laboratorio di ricerca di IBM a Zurigo hanno quindi pensato a come avrebbero potuto dare un supporto concreto ai chimici che operano direttamente sulle molecole e hanno trovato nell’intelligenza artificiale la risposta più adatta.
«A Zurigo facciamo ricerca a vari livelli – racconta Laino – ma cerchiamo sempre di indirizzare anche la ricerca teorica di base verso casistiche concrete di vita reale (non necessariamente di business ma relative comunque a problematiche reali). Una di queste riguarda il mondo farmaceutico; erroneamente si pensa sempre che la criticità più grande di queste compagnie riguardi l’identificazione di nuovi farmaci, in realtà la problematica più impattante riguarda la produzione delle molecole (quelle che hanno superato i test clinici), che è una questione puramente chimica ma con un impatto diretto sul business: bisogna trovare una sintesi molecolare economicamente sostenibile».
La sintesi molecolare potrebbe essere vista come una sorta di ricetta che prevede diversi passaggi (le reazioni chimiche) grazie ai quali si ottiene un “composto” (pensiamo per esempio al principio attivo di un farmaco). Negli ultimi 50 anni sono stati fatti enormi sforzi nella comunità scientifica per cercare di razionalizzare l’elevatissimo numero di composti chimici e delle relative reazioni che provocano, che rappresentano di fatto la base di conoscenza necessaria per risolvere le problematiche della sintesi molecolare.
Sintesi molecolare: la chimica come un linguaggio da tradurre
La dimostrazione che la sintesi molecolare potesse essere svolta dalle macchine avvenne già nel 1969 ad opera di EJ Corey e WT Wipke, ma all’epoca la tecnologia non era ancora così avanzata da permettere studi così avanzate per opera dei calcolatori. Qualcosa di importante si riuscì a fare negli anni Novanta grazie ai sistemi esperti ma la complessità di alcune molecole e delle reazioni che provocano nei vari passaggi durante la sintesi erano tali da rendere inefficienti anche i sistemi esperti.
Oggi queste barriere sono state superate grazie all’intelligenza artificiale e alle reti neurali (oltre al fatto che la disponibilità di enormi moli di dati è facilmente accessibile e analizzabile grazie a capacità di super calcolo che un tempo mancavano) che hanno raggiunto livelli di maturità sufficienti a dare risultati tangibili e validi proprio nell’ambito della sintesi molecolare.
«Ciò che abbiamo fatto a Zurigo è iniziare a guardare alla chimica organica, in particolare al processo di sintesi molecolare, come ad una sorta di linguaggio naturale, con la sua grammatica, traducibile in altre lingue (tipo di ricerca che la comunità scientifica internazionale ha iniziato ad approfondire circa una quindicina di anni fa)», spiega Laino. «Non c’è una prova matematica che dimostri in maniera inequivocabile che la chimica organica possa corrispondere ad un linguaggio ma ci sono moltissime evidenze, come per esempio la frequenza con cui compaiono dei gruppi oppure la frequenza con cui compaiono le molecole dentro alle varie reazioni chimiche… frequenze molto simili a quelle, per esempio, legate alle ripetizioni di parole, particelle, frasi che compaiono in un libro».
Partendo dalla scoperta di queste analogie il team di ricerca di Zurigo ha deciso di utilizzare l’intelligenza artificiale impiegata nell’ambito del linguaggio naturale (NLP – Natural Language Processing, una delle aree tecnologiche dove l’IA è già matura e abbastanza avanzata) “trasportandola” in ambito chimico, in particolare sfruttando la tecnologia NMT – Neural Machine Translation applicata alle reazioni di chimica organica.
«Esattamente come in uno dei più comuni applicativi di traduzione delle lingue, abbiamo sviluppato un “traduttore” che ha come input i reagenti, ossia le molecole che devono reagire tra di loro, e come output (la traduzione) il prodotto (il composto) della reazione tra quelle molecole, ciò che con probabilità elevate dovrebbe essere il risultato della sintesi molecolare», spiega in dettaglio Laino. «Ad oggi, con i sistemi più avanzati di NMT abbiamo raggiunto oltre il 90% di accuratezza dei risultati (solo un anno fa eravamo intorno all’80-81%)».
L’aiuto per i chimici
Il vantaggio, per i chimici, è riuscire a capire qual è il prodotto più probabile che può derivare dalla reazione di più molecole accelerando ed ottimizzando così i processi di sintesi molecolare che solitamente richiedono molto molto tempo. Non significa lasciare alla macchina la decisione del prodotto di sintesi molecolare, significa farsi aiutare per capire dove indirizzare al meglio i processi di sintesi organica evitando di avviare processi e test dove ha poco senso farlo, cosa che un tempo si poteva capire solo attraverso vari tentativi (che richiedevano appunti ricerca, test, analisi, processi molto molto lunghi).
«Questo sistema aiuta i chimici a capire anche i cosiddetti prodotti secondari – aggiunge in chiusura il ricercatore – che rappresentano un utilissimo bacino di conoscenza. Di solito dalla reazione chimica delle molecole che interagiscono tra loro ne deriva un prodotto principale ma in condizioni minori (reazioni chimiche minori) si possono scoprire altri prodotti, composti secondari che derivano da alcune delle reazioni chimiche di un particolare processo di sintesi (la chimica secondaria per esempio trasforma i prodotti della chimica primaria in prodotti di uso pratico, particolarmente importanti nel settore manifatturiero)».