AI generativa

Tencent lancia HunYuan Turbo S, modello di “pensiero rapido”

Il modello rappresenta un significativo passo avanti nella velocità di risposta e nell’ottimizzazione delle prestazioni dei modelli linguistici di grandi dimensioni. Con miglioramenti notevoli nella velocità di output e nell’efficienza, dimostra prestazioni comparabili a modelli come DeepSeek V3, GPT-4o e Claude

Pubblicato il 27 feb 2025

Redazione

Tencent – una delle più grandi società tecnologiche cinesi, fondata nel novembre 1998 da Ma Huateng e Zhang Zhidong, con sede a Shenzhen – ha recentemente svelato HunYuan Turbo S, un modello di pensiero rapido di nuova generazione che segna un importante progresso nella velocità di risposta e nell’ottimizzazione delle prestazioni dei modelli linguistici di grandi dimensioni.

Indice degli argomenti:

HunYuan Turbo S, le caratteristiche principali

A differenza dei modelli di pensiero lento tradizionali come Deepseek R1 e Hunyuan T1, HunYuan Turbo S offre “risposte istantanee”, migliorando significativamente la velocità di output, raddoppiando la velocità di output delle parole e riducendo la latenza della prima parola del 44%. Questa innovazione consente al modello di eccellere in molteplici aree come la conoscenza, la matematica e la creazione, fornendo una nuova soluzione per la capacità di risposta rapida dei grandi modelli.

WHITEPAPER

Scopri le Top 10 piattaforme per raccogliere fondi con il Crowdfunding Immobiliare!

Smart building

Real Estate

HunYuan Turbo S, ispirazione e capacità di risoluzione dei problemi

L’ispirazione per HunYuan Turbo S deriva dal modello di pensiero rapido, su cui gli esseri umani fanno affidamento per il 90% delle decisioni quotidiane basate sull’intuizione. Combinato con il modello di pensiero lento dell’analisi razionale, fornisce al LLM capacità di risoluzione dei problemi più intelligenti ed efficienti. Attraverso la fusione di catene di ragionamento lunghe e corte, il modello non solo mantiene un’esperienza veloce sui problemi umanistici, ma migliora significativamente anche le sue capacità di ragionamento scientifico, risultando in un notevole miglioramento complessivo delle prestazioni.

In diversi test di riferimento pubblici ampiamente usati, HunYuan Turbo S dimostra prestazioni comparabili a modelli leader come DeepSeek V3, GPT-4o e Claude.

HunYuan Turbo S, innovazione architetturale

In termini di innovazione architettonica, HunYuan Turbo S adotta una modalità di fusione Hybrid-Mamba-Transformer, riducendo efficacemente la complessità computazionale e l’occupazione della cache KV-Cache dell’architettura Transformer tradizionale, abbassando significativamente i costi di addestramento e inferenza. Questa architettura ibrida supera le sfide dei costi elevati di addestramento e inferenza associati ai modelli di grandi dimensioni tradizionali per testi lunghi, sfruttando i vantaggi dell’architettura Mamba nella gestione di lunghe sequenze pur mantenendo la capacità del Transformer di catturare contesti complessi.

Questo segna la prima applicazione riuscita dell’architettura Mamba a modelli MoE ultra-grandi nel settore senza perdita di prestazioni.

HunYuan Turbo S, disponibilità e prezzi

Come fondamento centrale della serie Hunyuan di Tencent, HunYuan Turbo S fornirà capacità di base per modelli derivati in inferenza, testi lunghi e codice in futuro. Basato su Turbo S, Tencent ha anche lanciato il modello di inferenza T1 con capacità di pensiero profondo. Questo modello è stato completamente lanciato su Tencent Yuanbao e sarà presto disponibile tramite accesso API.

Attualmente, sviluppatori e utenti aziendali possono accedere a HunYuan Turbo S tramite API sul sito web di Tencent Cloud e godere di una prova gratuita di una settimana. Il prezzo è di 0,8 yuan/milione di token per input e 2 yuan/milione di token per output, una riduzione significativa rispetto alla generazione precedente del modello Hunyuan Turbo. Inoltre, HunYuan Turbo S sarà gradualmente lanciato su Tencent Yuanbao, dove gli utenti possono selezionare il modello “Hunyuan”.

Clicca per partecipare al trial

@RIPRODUZIONE RISERVATA