Per elaborazione del Linguaggio Naturale (Natural Language Processing o NLP) si intende quel ramo dell’intelligenza artificiale che si occupa di dare alle macchine la capacità di comprendere il testo e le parole, abilità propria degli esseri umani. L’elaborazione del Linguaggio Naturale combina la “linguistica computazionale” (basata su regole del linguaggio umano) con modelli statistici, di apprendimento automatico (Machine Learning) e di apprendimento profondo (Deep Learning). Queste tecnologie permettono alle macchine di elaborare il linguaggio umano sotto forma di testo e di comprenderne il suo pieno significato (fino a percepire gli intenti e i sentimenti del soggetto). Tale tecnologia non poteva non approdare in un settore importante come quello sanitario. Per fornire cure di qualità e risultati “positivi” per i pazienti, i ricercatori e i clinici hanno bisogno di dati completi, esatti e aggiornati.
Tuttavia, poiché larga parte dei dati “essenziali” si trova in cartelle cliniche non strutturate, documenti scientifici e articoli tratti da conferenze e convegni di medicina, ottenere un accesso immediato a tali informazioni cliniche può essere difficile. Talché il NLP può essere una chiave d’accesso unica a tali informazioni. I ricercatori possono, infatti, utilizzare l’intelligenza artificiale per “ordinare” i dati non strutturati utilizzando l’elaborazione del Linguaggio Naturale. I dati possono, quindi, fornire intuizioni preziose per la cura dei pazienti, per la ricerca e la diagnosi delle malattie. Ma vediamo, nella pratica, come viene applicata il NLP al settore healthcare.
Il text mining applicato alle cartelle cliniche elettroniche
Per gestire meglio i dati non strutturati nell’ambito della ricerca clinica, lo statunitense Georgetown University Medical Center di Washington D.C. ha da breve tempo adottato strumenti di text-mining (tecnica che utilizza il NLP per trasformare il “testo libero” e non strutturato in dati strutturati) basati sull’intelligenza artificiale applicata alle cartelle cliniche elettroniche. Lo strumento varato dal nosocomio della capitale USA permette ai medici di cercare rapidamente ciò che desiderano partendo da grandi quantità di dati di letteratura medica, affinché vi sia un supporto efficiente del processo decisionale clinico in tempo reale.
Dall’altra parte dell’Atlantico, invece, lo strumento di text-mining dell’azienda di Cambridge (UK) Linguamatics utilizza l’elaborazione del Linguaggio Naturale per ordinare il testo in specifiche “frasi chiave”. Le informazioni estratte possono identificare il miglior corso di trattamento per i pazienti. Utilizzando la tecnologia in esame, i team di ricerca possono cercare nella letteratura e nelle cartelle cliniche per scoprire i geni associati a determinate malattie e migliorare la loro comprensione dei processi molecolari, al fine di avanzare con il “targeting” dei farmaci. Si pensi che i motori di ricerca tradizionali (come il rinomato PubMed) potrebbero cercare e “tirare fuori” cinquanta articoli, la maggior parte dei quali potrebbero non contenere le informazioni che si stanno cercando. Va da sé che i medici dovrebbero leggere l’abstract (la sintesi) o anche il testo completo per identificare (forse) uno o due articoli che contengono le informazioni che stanno cercando. Con la britannica Linguamatics, invece, su quei cinquanta potrebbero identificare immediatamente quei due articoli che interessano senza doverne passare al setaccio altri quarantotto. Inoltre, Linguamatics utilizza capacità di elaborazione del Linguaggio Naturale per cercare l’intero testo di un articolo e identificare concetti e relazioni nella letteratura, al fine di fornire cure di alta qualità. È palese evincere come i tradizionali metodi di ricerca senza capacità di elaborazione del Linguaggio Naturale non siano in grado di eseguire gli stessi compiti. [1]
Applicazione dell’LNP nella diagnosi medica
Ma l’elaborazione del Linguaggio Naturale può anche assistere i medici nelle diagnosi di diverse patologie. Un studio dell’anno scorso della non-profit californiana Kaiser Permanente ha dimostrato quanto può valere la tecnologia di elaborazione del Linguaggio Naturale (NLP) in ospedale con i medici che, grazie ad essa, hanno potuto identificare più di cinquantamila pazienti con stenosi aortica (patologia cardiaca che comporta una riduzione della capacità di apertura della valvola aortica). I ricercatori del gruppo ospedaliero statunitense Permanente Medical Group hanno addestrato il NLP a ordinare e, attraverso oltre un milione di cartelle cliniche elettroniche ed ecocardiogrammi, identificare alcune abbreviazioni, parole e frasi associate alla stenosi aortica. In pochi minuti, il software approntato dal gruppo ospedaliero californiano ha identificato più di cinquantamila pazienti affetti da stenosi aortica; un processo che, manualmente, avrebbe richiesto anni per i medici.
È straordinario pensare a come le tecnologie basate sull’intelligenza artificiale possano migliorare l’efficienza e il rendimento del lavoro dei medici. Esiste una grande quantità di importanti dati clinici nelle cartelle cliniche dei pazienti. Tuttavia, molti dei dati rimangono fuori dalla portata della maggior parte dei ricercatori a causa della loro natura non strutturata (connessa all’incapacità di essere facilmente ricercati). Le tecnologie basate sull’elaborazione del Linguaggio Naturale possono superare questa sfida, migliorando l’efficienza e la fattibilità della ricerca e permettendo di costruire grandi coorti di pazienti da studiare senza la lettura “manuale” delle cartelle cliniche. Questo processo produce, inevitabilmente, anche dataset molto più grandi che possono produrre risultati più precisi. Il NLP può anche aiutare i ricercatori a superare le limitazioni dei codici di procedura e diagnosi. Codici che, attualmente, non sono progettati per includere dati dettagliati su una specifica condizione medica. Per esempio, lo status medico di un paziente con stenosi aortica moderata o grave è completamente diverso da un paziente con una lieve malattia che colpisce la valvola aortica. Queste variabili non sono “incluse” nei codici di diagnosi o di procedura. Inoltre, alcuni codici possono semplicemente etichettare la patologia come “malattia della valvola aortica”, che potrebbe essere applicato a un problema clinico completamente diverso dalla stenosi aortica.
La gestione della salute della popolazione e la ricerca sulle condizioni croniche non sono possibili senza un’identificazione accurata e sistematica dei casi clinici. A causa della presenza di dati non strutturati nelle cartelle cliniche, la soluzione più logica per identificare le condizioni nei pazienti è quella di sviluppare metodi di elaborazione del Linguaggio Naturale applicati alle cartelle cliniche elettroniche. Successivamente, una volta che si sarà in grado di costruire grandi coorti di pazienti affetti da varie condizioni cardiovascolari, si potrà procedere con la concentrazione delle risorse sui pazienti più gravi; così come, peraltro, si potranno identificare i nuovi predittori che influenzano i risultati o la progressione della malattia, in modo da poter identificare e intervenire tempestivamente per aiutare i pazienti che possono avere maggiori probabilità di progredire verso una malattia più grave.[2]
L’NLP nella comprensione del disturbo bipolare
Infine, una recente pubblicazione[3] sulla rivista accademica canadese “Journal of Medical Internet Research” ha esplorato come i metodi di elaborazione del Linguaggio Naturale sono stati utilizzati dai ricercatori per comprendere meglio il disturbo bipolare, ponendo le basi per nuove opportunità circa l’utilizzo del NLP in campo sanitario. I ricercatori hanno raccolto trentacinque studi che hanno descritto come opera l’applicazione di un metodo NLP allo studio del disturbo bipolare. I ricercatori hanno usato la “sintesi narrativa” per mappare la letteratura secondo quattro domande di ricerca. Queste domande riguardavano le tendenze che potevano essere osservate, i metodi di NLP che sono stati utilizzati, le applicazioni cliniche e pratiche riportate e le considerazioni etiche presenti in letteratura. I ricercatori hanno notato che vi è stato un aumento nella pubblicazione di articoli che analizzano il NLP e il disturbo bipolare (uno studio nel 2004 e cinque studi nel 2020). Dal 2015, hanno notato i ricercatori, l’interesse per l’argomento ha raggiunto un picco ed è rimasto relativamente costante. Gli obiettivi primari degli studi potevano essere suddivisi in quattro categorie: previsione e classificazione, caratterizzazione del linguaggio del disturbo bipolare, uso di cartelle cliniche elettroniche per misurare i risultati nonché per la fenotipizzazione (partendo dal DNA è possibile risalire a caratteristiche fisiche di una persona determinata o meno).
L’obiettivo più importante dello studio pubblicato sulla rivista canadese era la previsione e la classificazione relative al disturbo bipolare, nonché caratterizzare il linguaggio del disturbo bipolare. Gli articoli analizzati in questo studio hanno indicato molteplici implicazioni cliniche e pratiche. Una delle applicazioni più comuni è stata che l’utilizzo di metodi di elaborazione del Linguaggio Naturale “a servizio” dei dati presi dai social media potrebbe persino aiutare la diagnosi precoce, la valutazione clinica e la prevenzione dei suicidi, oltre a integrare i metodi esistenti per affrontare le varie dinamiche. L’uso di NLP combinata alle cartelle cliniche elettroniche potrebbe anche potenzialmente portare alla creazione di algoritmi diagnostici predittivi per il disturbo bipolare. Inoltre, i risultati potrebbero essere utilizzati per segnalare il peggioramento della salute mentale e creare “marcatori di urgenza” per interventi mirati. I dati potrebbero anche essere utilizzati per aiutare a distribuire il trattamento a popolazioni tradizionalmente difficili da raggiungere attraverso la cura “tele-mentale”.
Alcuni degli studi hanno indicato che i social media stessi potrebbero essere utilizzati per ridurre l’isolamento sociale e migliorare la conoscenza del paziente sulla sua condizione. Tuttavia, le applicazioni dei metodi di NLP relative al disturbo bipolare, in particolare quelle che utilizzano i dati dei social media, richiedono considerazioni etiche per proteggere i dati personali del paziente, con inevitabili risvolti circa le valutazioni normative (si pensi al GDPR).
Le considerazioni legali ed etiche, peraltro, sono diventate più comuni negli ultimi anni, con gli articoli scientifici recenti più propensi a includere discussioni dettagliate sul processo decisionale etico e sulla progettazione dello studio, insieme a considerazioni sugli impatti sociali positivi e negativi che potrebbero derivare dalla ricerca. I ricercatori hanno concluso che i benefici dell’elaborazione del Linguaggio Naturale, in particolare quelli utilizzati in combinazione con la ricerca sul disturbo bipolare, indicano che l’analisi del linguaggio potrebbe aiutare a fornire assistenza a coloro che sono affetti da questa condizione. L’uso del NLP per indagare circa l’assunzione di rischi, i servizi basati sul web e l’aspetto sociale e lavorativo potrebbero far beneficiare la comunità medica e i pazienti affetti disturbo bipolare.[4]
Note
- What Are the Benefits of Natural Language Processing Technology? HealthITAnalytics.com by TechTarget. https://healthitanalytics.com/features/what-are-the-benefits-of-natural-language-processing-technology ↑
- Identifying Disease with Natural Language Processing Technology. HealthITAnalytics.com by TechTarget. ↑
- Natural Language Processing Methods and Bipolar Disorder: Scoping Review. Journal of Medical Internet Research. https://mental.jmir.org/2022/4/e35928 ↑
- Natural Language Processing Can Improve Bipolar Disorder Care. HealthITAnalytics.com by TechTarget. https://healthitanalytics.com/news/natural-language-processing-can-improve-bipolar-disorder-care ↑