Chatbot Arena Italia, la prima piattaforma dedicata alla comparazione di modelli di linguaggio di grandi dimensioni (LLM) specificamente per la lingua italiana è ufficialmente disponibile. Ispirata all’iniziativa globale Chatbot Arena, questa versione italiana, realizzata da Indigo.ai, mira a diventare il punto di riferimento nazionale per il benchmarking dei principali modelli di linguaggio. La piattaforma si rivolge ai contributor della comunità AI italiana, offrendo loro la possibilità di confrontare i modelli di linguaggio in un contesto specifico per l’italiano, contribuendo così a migliorare la qualità e l’efficacia degli LLM.
Indice degli argomenti:
Crescita dei modelli di linguaggio
Secondo l’AI Index Report 2024, il numero di modelli linguistici di grandi dimensioni rilasciati a livello mondiale è raddoppiato nel 2023 rispetto all’anno precedente. Questo trend è in continua crescita, con nuovi modelli annunciati di recente sia a livello globale che specificamente per l’Italia. La necessità di strumenti di valutazione per confrontare e migliorare questi modelli è quindi evidente. Chatbot Arena Italia risponde a questa esigenza, permettendo alla comunità AI locale di testare e comparare i modelli disponibili, migliorando così le capacità di questi strumenti per la lingua italiana.
Claude: Claude by Anthropic | Gemini: Gemini, famiglia di Foundational Language Models sviluppati da Google | GPT-4o: Il modello di punta per l’audio, la visione e il testo di OpenAI |
o-series: I modelli di punta progettati da OpenAI per elaborare ragionamenti complessi prima di rispondere | GPT-4-Turbo: GPT-4-Turbo by OpenAI | GPT-3.5: GPT-3.5-Turbo by OpenAI |
Gemma: Gemma2 by Google | Mixtral of experts: Un modello Mixture-of-Experts sviluppato da Mistral AI | DeepSeek LLM: Un modello di linguaggio avanzato sviluppato da DeepSeek |
Llama-3.1: La famiglia Llama 3.1 di Large Language Models open source sviluppati da Meta | Llama-3.2: La famiglia Llama 3.2 di Large Language Models open source sviluppati da Meta | LLaMAntino: LLM pecializzato nella lingua italiana sviluppato all’interno del progetto ANITA dall’Università degli Studi di Bari e dallo SWAP research group. Il modello è addestrato a partire da Llama-3-8b-instruct di Meta. |
Minerva-3B: Famiglia di LLMs sviluppati da Sapienza NLP in collaborazione con FAIR e CINECA. Addestrati da zero interamente su dati in italiano e inglese. | Maestrale-chat-v0.4: LLM italiano sviluppato da membri della community mii-llm di huggingface in collaborazione con Digitiamo.ai | Modello-Italia-9B: LLM italiano sviluppato da iGenius in collaborazione con Cineca |
Llama-3.3: La famiglia Llama 3.3 di Large Language Models open source sviluppati da Meta | Qwen2.5: Famiglia Qwen2.5 di Large Language Models open source sviluppati da Alibaba | Deepseek-R1: Il modello più avanzato rilasciato da DeepSeek, con spiccate doti di ragionamento |
Mistral Small 3: Il modello più veloce rilasciato da Mistral AI | Phi 4: L’ultimo modello di linguaggio rilasciato da Microsoft | Velvet-14B: Modello Italiano sviluppato da Almawave in collaborazione con CINECA |
Funzionalità di Chatbot Arena Italia
Chatbot Arena Italia offre tre modalità di interazione:
- Arena (battaglie)
- Arena (fianco a fianco)
- Chat diretta.
Gli utenti possono inviare prompt e ricevere risposte da diversi modelli, votando i migliori per contribuire alla classifica dei modelli più efficaci. La piattaforma include oltre 30 modelli linguistici, tra cui Deepseek R1, GPT-4o, e altri modelli italiani come Minerva e Modello Italia.
L’azienda Indigo.ai punta a creare un ecosistema collaborativo per la Gen AI in Italia, promuovendo trasparenza e confronto tra gli esperti del settore.
Chatbot Arena Italia è già disponibile cliccando qui.