tecnologia

Ecco “Italia 9b”, l’AI generativa addestrata interamente in italiano



Indirizzo copiato

iGenius, azienda deep-tech italiana, lancia un Foundational Large Language Model addestrato su fonti in lingua italiana e rilasciato come open source. Il modello è progettato per settori regolamentati come i servizi finanziari, l’industria e la PA

Pubblicato il 6 giu 2024



Italia 9b iGenius

Si chiama “Italia 9b” il Foundational Large Language Model (LLM) di IGenius ed è stato addestrato su fonti in lingua italiana e rilasciato come open source sotto licenza MIT.

Cos’è “Italia 9b”, l’LLM di iGenius

“Italia 9b” è un modello linguistico creato in linea con le normative europee sull’intelligenza artificiale. È stato progettato per supportare le imprese nell’introduzione dell’AI generativa in settori fortemente regolamentati come i servizi finanziari, l’industria e la Pubblica Amministrazione. Il processo di addestramento di “Italia” proseguirà anche dopo il suo lancio iniziale. Infatti, iGenius sta lavorando a versioni future che saranno ancora più potenti, precise e versatili, oltre a una versione multilingue.

Italia 9B: il nostro primo LLM 100% Open Source

Training

Il modello “Italia 9b” è stato sviluppato in cinque mesi dal team di iGenius, attivo nel campo dei modelli linguistici dal 2016. Il modello è stato addestrato sul supercomputer Leonardo del Consorzio Interuniversitario Cineca, una delle strutture di calcolo più potenti al mondo. Inoltre, iGenius ha collaborato con Editoriale Nazionale, parte del gruppo Monrif, per utilizzare il loro archivio storico di articoli di stampa come risorsa aggiuntiva per migliorare il modello. Questa collaborazione continuerà con l’addestramento delle future versioni di “Italia”, per ampliare ulteriormente la sua base di conoscenza.

“Italia 9b” è stato addestrato da zero in italiano su oltre mille miliardi di parole, utilizzando una varietà di fonti: dati pubblici, dati sintetici e contenuti settoriali forniti da partner commerciali selezionati da iGenius.

Per assicurare l’integrità etica dei contenuti generati dal modello, sono stati implementati specifici filtri di sicurezza per la lingua italiana. Questi sono stati progettati per eliminare contenuti sensibili, espliciti e potenzialmente prevenire bias, oltre a limitare al massimo l’esposizione di contenuti protetti da copyright.

Le caratteristiche di “Italia 9b” di iGenius

La prima versione di “Italia 9b” è un Foundational LLM basato su un’architettura Transformer con 9 miliardi di parametri (da cui “9b” come billions), una finestra contestuale di 4.096 token e un vocabolario composto da 50.000 token. A differenza degli altri modelli linguistici, “Italia9b” si distingue per la sua efficacia nel gestire le parole italiane. Grazie a un Tokenizer proprietario sviluppato dal team iGenius appositamente per questo modello, può processare e generare token in italiano con prestazioni equivalenti a un incremento del 60% della sua finestra contestuale.

Questo si traduce in un’efficienza significativa in termini di costi e risorse necessarie per gestire il modello, un aspetto fondamentale per una soluzione AI pensata per l’ambiente aziendale.

“Italia9b” può essere scaricato dal sito web di iGenius e sarà presto disponibile anche su Hugging Face e sulle principali piattaforme di sviluppo di prodotti AI, come i Model Catalog o gli AI Studio.

Foto: iGenius

A breve una versione da 10 mld di parametri

“La scelta di sviluppare Italia come modello open source rispecchia pienamente la nostra missione di umanizzare i dati e democratizzare la conoscenza aziendale. Crediamo che Italia rappresenti il primo passo verso un nuovo Rinascimento digitale, in cui le soluzioni di AI siano progettate mettendo al centro le persone, non la tecnologia. Adesso il nostro obiettivo è investire in nuovi modelli che siano rappresentativi di altre lingue e culture. Stiamo lavorando per rilasciare a breve una versione di Italia da 10 miliardi di parametri e, successivamente, una versione multilingua”, ha spiegato Uljan Sharka, fondatore e CEO di iGenius.

“Un’azienda italiana, con un progetto innovativo e di notevole interesse, ha avuto la possibilità di accedere alla potenza di calcolo di Leonardo, uno dei supercomputer più avanzati al mondo: tutto ciò a conferma del ruolo di Cineca come abilitatore dell’innovazione digitale e della competitività del Paese. La nostra infrastruttura, che è pubblica e aperta per definizione, trova in questa avventura una delle sue espressioni meno scontate, ma certamente più coerenti con la volontà di progettare il futuro, innovando e generando valore per la nostra comunità.” ha sottolineato Alessandra Poggiani, direttrice generale di Cineca.

Articoli correlati

Articolo 1 di 4