Come ha reagito la popolazione di fronte alla sfida del COVID-19? Cosa passa cioè per la testa (e il cuore) della gente in questo periodo di pandemia? Per saperlo serve scandagliare il web alla ricerca di commenti e pensieri postati sui social media, dove la popolazione racconta (forse ancora di più in questo periodo di distanziamento sociale) il proprio vissuto quotidiano. Ma risulta impossibile farlo manualmente, considerando il numero sterminato di informazioni disponibili: ecco allora che serve l’aiuto di una tecnologia “intelligente”, in grado di analizzare automaticamente il contenuto di migliaia di testi scritti dagli utenti. Così è stato possibile monitorare per due mesi il sentiment e le emozioni degli italiani, esaminando i tweet pubblicati nelle settimane più critiche della pandemia e durante la Fase 2.
Una tecnologia di artificial intelligence per capire l’umore delle persone
Non serve chissà quale studio o esperto della materia per arrivare alla logica conclusione che non può certo essere dei migliori l’umore di un paese che ha vissuto la pandemia (e che ancora – e non si sa per quanto – impatta pesantemente le dinamiche economiche e sociali). Ma per avere uno spaccato in tempo reale delle reazioni dei cittadini e del modo in cui sono cambiate le loro emozioni (categorizzate in 80 diverse tipologie) nel corso delle settimane, serve un’analisi costante e un monitoraggio puntuale di migliaia di commenti e pareri pubblicati sui social media. Una “emotion analysis” ai tempi del Coronavirus, effettuata tramite una tecnologia di artificial intelligence (AI) in grado di elaborare automaticamente migliaia di testi, può darci la sintesi di quello che passa per la mente e il cuore dei cittadini che scrivono sui social media. È quello che ha fatto Expert System, in collaborazione con Sociometrica, per oltre 2 mesi (dal 23 marzo al 29 maggio): sono stati raccolti e classificati, in tempo reale, migliaia e migliaia di testi pubblicati su Twitter, per cogliere, in real time, l’evoluzione dei pensieri e dei sentimenti della popolazione di giorno in giorno.
La “mappa delle emozioni”
Le due immagini seguenti mostrano la mappa delle emozioni principali degli italiani rispetto al Covid-19 rispettivamente il primo giorno dell’analisi (23 marzo 2020) e il giorno dell’ultima rilevazione effettuata (29 maggio 2020).
Mappa delle emozioni – 23 marzo 2020
Mappa delle emozioni – 29 maggio 2020
Vediamo in dettaglio quali sono le logiche di analisi e le funzionalità degli algoritmi di AI che hanno consentito di svolgere questa analisi.
Il calcolo del sentiment
“Quando vedo vincere la Ferrari e la Juventus sono felice”
“Sono Felice Ferrari, e quando vedo vincere la Juventus…”.
Per il cervello umano è molto facile distinguere il significato della sequenza di queste sei lettere: “f”, “e”, “l”, “i”, “c”, “e”.
Anche se in due contesti diversi, ma (artificiosamente) caratterizzati praticamente dalle stesse parole, per noi umani è facile distinguere tra l’aggettivo e il nome proprio maschile.
L’innovazione tecnologica nel campo del trattamento del linguaggio naturale (NLP, Natural Language Processing) consente però anche a molte tecnologie di AI di contraddistinguere le due accezioni. E non solo grazie alla presenza, talvolta decisiva, dell’iniziale maiuscola che chiaramente differenzia in modo lampante il nome proprio dall’aggettivo.
Ma cosa succede quando dobbiamo processare il testo con algoritmi di NLP per ottenere “funzionalità più avanzate”, come ad esempio la sentiment analysis di un testo?
I principali fattori da considerare
Molti sono gli elementi semantici e lessicali che entrano in gioco nella sentiment analysis, utili a determinare l’attitudine di chi scrive rispetto a un evento specifico, un avvenimento, una situazione, ecc.
Uno degli elementi chiave è rappresentato dagli aggettivi con accezione intrinsecamente positiva o negativa (ad es. “bello” e “brutto”), insieme con l’intensità con cui essi esprimono tale polarità. Si prenda, ad esempio, l’aggettivo “brutale”: esso viene ovviamente percepito con un’intensità diversa rispetto all’aggettivo “dolce”. Altrettanta rilevanza hanno i sostantivi o i verbi utilizzati che, come gli aggettivi, possono veicolare un sentimento positivo o negativo, come ad esempio “violenza”, “uccisione”, “matrimonio”, “aggredire”, “vincere”.
Esistono, però, termini che possono avere accezione diversa a seconda del contesto di riferimento. Prendiamo ad esempio l’aggettivo “economico”, usato frequentemente in molti contesti diversi. In uno dei suoi significati letterali indica “che comporta una modica spesa”. Concentriamoci ora sulle due seguenti frasi: “Ho comprato il miglior frullatore sul mercato. Devo dire che, per la qualità dei suoi componenti, è anche abbastanza economico” e “Ho soggiornato in una località di mare per un paio di notti in un hotel di infima qualità. Probabilmente era il più economico di tutta la città”. Nella prima frase, il termine “economico” si riferisce a un pregio dello strumento acquistato; nella seconda, lo stesso aggettivo assume una valenza negativa.
Ad aggiungere complessità intervengono i modificatori di intensità, che possono rafforzare o diminuire la portata di certi termini (“molto brutto”, “leggermente fastidioso”), e le negazioni, che possono arrivare a sovvertire completamente il giudizio espresso da un aggettivo o un sostantivo. Si pensi a una frase come “Oggi non sono felice perché, nonostante io abbia messo tutto il mio impegno nella partita, non siamo riusciti a vincere”. Quest’ultima frase è costellata di parole con accezione positiva (“felice”, “impegno”, “vincere”), ma il sentiment che ne emerge è complessivamente negativo.
Gli algoritmi semantici devono quindi considerare tutti i fattori precedenti, e bilanciare le connotazioni positive, negative, neutre, per interpretare l’attitudine di chi scrive rispetto ad una scala di polarità organizzata su cinque livelli: negativo (“orrendo”), parzialmente negativo (“duro”), neutro (“antico”), positivo (“buono”), molto positivo (“eccelso”), che è il tipico risultato della sentiment analysis.
Purtroppo, nella realtà dei fatti, non sempre si ha a che fare con contenuti che esprimono un tono di sentiment chiaro e definito. E questo vale anche nel caso del Coronavirus poiché, per quanto sia una situazione tragicamente nuova in un contesto generale negativo, ha suscitato anche sentiment positivi (ad esempio nei confronti degli operatori sanitari). La maggior parte delle frasi ricorrenti nel testo scritto si caratterizza quindi per un equilibrio di connotazioni diverse. Pensiamo a una frase come “Mario piange di felicità”. La corretta valutazione del contesto nell’analisi complessiva del sentiment è la chiave per orientare il processo di bilanciamento e differenziazione del sentimento, specialmente quando si tratta di frasi che emettono connotazioni eterogenee.
E che dire poi della soggettività dei sentimenti? Il processo comunicativo prevede un mittente del messaggio e un suo destinatario. E se da un lato abbiamo uno scrivente che cerca di comunicare un certo messaggio, dall’altro abbiamo lettori diversi che interpreteranno lo stesso messaggio secondo le proprie convinzioni, conoscenze, credenze, competenze. Di conseguenza, anche il tono che lo scrivente vuole conferire al testo può essere interpretato diversamente da lettori diversi (e ancora di quando il contenuto riguarda una sfera emozionale molto forte e del tutto nuova, come quella causata dal COVID-19). Prendiamo una frase semplice come “La Juventus si aggiudica l’ennesimo scudetto. A Torino piazza gremita di tifosi esultanti e felici”. Tale frase suscita sentimenti positivi nella maggior parte dei lettori tifosi della Juventus, mentre stimola una reazione negativa nei lettori che tifano altre squadre e non sarà di alcun interesse per i lettori che non seguono il calcio.
Il problema dell’assenza di fattori contestuali
Molto spesso l’assenza di fattori contestuali, la breve lunghezza della frase (tipica dei tweet o dei post), la prevalenza di concetti senza connotazione specifica o definita, complicano decisamente il processo di analisi, anche quando esso viene svolto dalla mente umana.
Immaginate di dover analizzare il testo “LKY non sarà dimenticato!”
La condizione in cui un evento o una persona non verrà mai dimenticata potrebbe avere sia connotazione positiva che negativa. Molto dipende dalle informazioni contestuali che ci vengono fornite. Tali fattori sono completamente assenti nella frase di esempio, composta di solo 4 parole.
La gestione delle ambiguità
Un altro elemento critico sono le ambiguità, spesso presenti in frasi abbastanza complesse. Proviamo a soffermarci sulla frase seguente.
“Martedì la Supercom ha registrato un aumento del 13% delle perdite relative alle entrate del secondo trimestre. Le quotazioni delle azioni Supercom sono scese e poi è stata registrata una escalation dell’8%, al termine di ore di negoziazione. Negli ultimi dodici mesi, il prezzo delle azioni ha subito una diminuzione vicina al 20% “
Questo è ovviamente un evento negativo per “SuperCompany”, ma la presenza di parole come “aumento”, “entrate”, “escalation” potrebbero interferire con la corretta ponderazione del sentiment.
Inoltre, questa è sicuramente una situazione negativa dalla prospettiva di Supercom, ma potrebbe essere è una notizia positiva per i competitor di Supercom.
“Domani, durante la processione del funerale di Stato, cerchiamo di essere uniti e rispettosi nel dare a Sir LKW il nostro sincero saluto durante il suo viaggio finale. Mostriamo il nostro apprezzamento, non le nostre telecamere.”
Questo dovrebbe essere un sentimento negativo perché il leader è appena morto? Non potrebbe essere un sentimento positivo a causa dell’alto rispetto mostrato in quelle righe? La collocazione linguistica “viaggio finale” è abbastanza esplicita da convalidare un sentimento negativo?
L’analisi basata su emotion
L’analisi basata sulle emotion garantisce un maggiore livello di dettaglio poiché consente di andare oltre i limiti di bilanciamento delle connotazioni positive e negative. Se infatti la sentiment analysis supporta la comprensione della connotazione positiva / negativa nascosta in un giudizio o in un’opinione, le emotion riescono a riconoscere l’emozione specifica espressa nel testo, garantendo un risultato dell’analisi molto più preciso, e quindi fruibile a livello operativo. Immaginiamo per esempio di voler applicare la sentiment analysis a un insieme di tweet che commentano una decisione del governo comunicata di recente, come è accaduto in questo periodo di pandemia in cui molti cittadini hanno riportato sui social i pareri su tutte le normative promulgate su distanziamento sociale, uso delle mascherine, bonus economici, smart working ecc.
Utilizzando la tradizionale sentiment analysis si potrà arrivare a definire se il giudizio dei cittadini sia complessivamente positivo, negativo o neutro. In caso di esito negativo, occorrerà andare in dettaglio per capire cosa di quel provvedimento non è piaciuto ai cittadini. L’approccio basato sull’emotion detection ci darà invece un’immagine molto più chiara del punto di vista dei cittadini, suggerendo ad esempio che il provvedimento ha suscitato rabbia oppure ansia oppure speranza e consentirà quindi di attuare una strategia comunicativa in risposta, che possa andare a placare o rassicurare i cittadini, oppure a lavorare sul consenso che tale annuncio ha attivato.
Concentrandosi sulle parole e sul contenuto emotivo all’interno, l’intera prospettiva di analisi si sposta sulle emozioni specifiche presenti nel testo.
La frase: “LKY non sarà dimenticato, RIP e sentite condoglianze” è caratterizzata dalla totale assenza di fattori contestuali ed elementi lessicali.
Inoltre, il testo è breve. Un insieme di fattori che rendono quasi impossibile eseguire un’efficace analisi del sentiment.
Applicando la logica delle emotions, invece, è possibile fare affidamento sul significato delle parole (semantica) e sul contenuto emotivo che viene trasmesso, ed in particolare di dati emotivi “nascosti” all’interno di lemmi come “RIP”, “sentite condoglianze” per ottenere un risultato di “tristezza”.
La tecnologia di artificial intelligence di Expert System classifica i testi secondo una tassonomia di circa 80 diverse categorie che descrivono emozioni o comportamenti come paura, tristezza, ansia, desiderio, empatia, odio, vergogna, modernità, maleducazione, amore, felicità,…
Questa tecnologia è in grado di sfruttare tutti gli elementi chiave della sentiment analysis descritti sopra, come la presenza di parole con polarità positiva e negativa, negazioni e modificatori; sfruttando poi la capacità di comprensione profonda del testo, prova a risolvere le ambiguità terminologiche guardando al contesto. L’esito finale però non sarà solo un indicatore di polarità (positivo, negativo, neutro) ma una mappa emozionale del testo.
Tornando alle prime due frasi con cui abbiamo iniziato questo articolo, ecco il risultato dell’elaborazione della tecnologia di analisi semantica di Expert System:
Capace peraltro, a fronte di una piccola variazione del testo, di rivoluzionare il risultato della categorizzazione emotion: da “felicità” dell’esempio iniziale a “tristezza” della nuova frase modificata nel finale come “…NON sono felice” .
Le emozioni degli italiani e il Coronavirus
Tornando al caso specifico del Coronavirus, dall’analisi portata avanti da Expert System è chiaro che gli italiani sono stati travolti da una tempesta emotiva. Dopo le prime settimane di paura, ansia e sofferenza di fronte alla crescita dei malati e a tutte le incertezze portate da questa pandemia, sono cresciute molto le emozioni neutrali, e soprattutto quella indicata con il termine “maleducazione” che include parole offensive e poco civili. Si sono scatenate infatti lamentele per le condizioni della riapertura, le lentezze burocratiche, le regole giudicate troppo invadenti, le violazioni delle regole stesse ecc. Non sono mancate emozioni positive (l’amore dimostrato da medici e infermieri, l’atteggiamento di positività, la speranza del futuro), anche se le emozioni negative hanno sempre avuto un peso maggiore. Un mix molto variegato di emozioni che ha fornito interessanti spunti di osservazione del fenomeno e della sua evoluzione, e che non si sarebbe potuto ottenere senza il contributo dell’artificial intelligence.
Spunti di osservazione che vanno oltre il contesto specifico dello scenario COVID-19 e che investono molti altri ambiti che da tempo impiegano l’emotion analysis per decidere tattiche e strategie. Tra questi, il customer care, l’analisi reputazionale, la profilazione del consumatore, e come ci hanno insegnato le cronache, anche del proprio elettorato…