I ricercatori di AI di Meta hanno sviluppato un modello in grado di verificare l’accuratezza delle citazioni in Wikipedia, la più grande enciclopedia online del mondo. Mentre gli strumenti automatizzati possono individuare citazioni incomprensibili o mancanti, il modello di intelligenza artificiale di Meta fa un ulteriore passo avanti: può scansionare automaticamente centinaia di migliaia di citazioni contemporaneamente, per vedere se supportano i fatti della pagina Wikipedia. Il modello è stato costruito su un set di dati composto da 134 milioni di pagine Web pubbliche.
“Richiama l’attenzione su citazioni discutibili, consentendo agli editori umani di valutare i casi che hanno maggiori probabilità di essere imperfetti senza dover setacciare migliaia di affermazioni correttamente citate”, dichiara la società in un post sul blog. “Se una citazione sembra irrilevante, il nostro modello suggerirà una fonte più applicabile, anche indicando il passaggio specifico che supporta l’affermazione”.
Dato lo scopo finale del modello, Meta ha scelto di seguire la strada open source, rendendolo disponibile tramite GitHub sotto una licenza MIT. Leggi il documento di ricerca.
Meta: “Insegnare alla tecnologia a comprendere il nostro mondo”
Secondo Meta, gli strumenti automatizzati possono essere utilizzati per identificare le affermazioni che mancano di citazioni, ma è più difficile per l’AI determinare se una fonte esegue effettivamente il backup di un’affermazione. Ma se gestito con successo, aiuterebbe la comunità di ricerca.
Il modello di citazione è stato addestrato utilizzando pagine di dichiarazioni, accompagnate da siti Web che possono o meno supportare le affermazioni fatte nella voce. Utilizzando pagine web complete su una manciata di frasi, Meta afferma che il suo modello ha raggiunto “un salto nelle prestazioni in termini di rilevamento dell’accuratezza delle citazioni”.
Ad esempio, il modello è stato in grado di rilevare un’imprecisione in un riferimento alla nomina del CEO della Los Angeles Philharmonic nel 2018. L’AI è stata in grado di dedurre che il comunicato stampa citato non era rilevante per l’affermazione, e ha invece suggerito un’altra possibile fonte, un post sul blog sul sito web della Filarmonica di Los Angeles.
“Una volta pronti per essere distribuiti, i nostri modelli rafforzeranno la qualità della conoscenza su Wikipedia, contribuendo a preservare l’accuratezza di una risorsa che praticamente tutti usano”, hanno detto i ricercatori.
I ricercatori di intelligenza artificiale di Meta prevedono di perfezionare ulteriormente il modello e renderlo in grado di suggerire l’auto-completamento del testo e offrire correzione di bozze.
“Idealmente, i modelli comprenderebbero più lingue e sarebbero in grado di elaborare diversi tipi di media, tra cui video, immagini e tabelle di dati”, ha concluso il post sul blog. “Queste funzionalità sono tra i nuovi obiettivi di Meta AI, mentre aiutiamo a insegnare alla tecnologia a comprendere il nostro mondo”.