OpenAI ha annunciato OpenAIo1, una nuova serie di modelli per risolvere problemi sempre più complicati: da compiti complessi alla migliore risoluzione di problematiche rispetto alle versioni precedenti della tecnologia. Questa rappresenta una early preview di questa serie che include o1-preview e o1-mini, su ChatGPT e nelle API.
Attraverso il processo di training questi modelli imparano a rifinire il metodo di elaborazione attraverso l’utilizzo di varie possibilità e riconoscendo gli errori. Nei test questi modelli si comportano come gli studenti dei dottorati alle prese con complesse questioni di fisica, chimica e biologia. Inoltre, i nuovi modelli riscontrano buoni risultati in ambito matematico e di coding.
Video OpenAIo1
OpenAIo1: limiti, sicurezza e disponibilità
Limitazioni
Essendo un modello preliminare, OpenAIo1 non dispone ancora di molte delle funzionalità che rendono ChatGPT utile, come la navigazione sul web per la ricerca di informazioni o il caricamento di immagini e file. Assenti anche rilevanti feature nell’API come il supporto all’utilizzo di strumenti, la funzione di chiamata, lo streaming e la personalizzazione dei messaggi. Per molti casi più comuni, per ora GPT-4o rimane più funzionale.
Sicurezza
Grazie a funzionalità ulteriormente potenziate sono state rafforzate le misure di sicurezza, nonché migliorata la governance interna e incrementato la collaborazione con gli enti governativi. Il processo di apprendimento di questi modelli rende più efficace l’allineamento agli standard di sicurezza e alle linee guida previste.
Un modo in cui OpenAI misura la sicurezza è testare quanto bene il modello continua a seguire le sue regole di sicurezza se un utente tenta di aggirarle (noto come “jailbreaking”). In uno dei test di jailbreak più difficili, GPT-4o ha ottenuto un punteggio di 22 (su una scala da 0 a 100) mentre il modello o1-preview ha ottenuto un punteggio di 84. Per saperne di più su questo argomento consultare la scheda del sistema e nel post di ricerca.
Disponibilità
- All’interno di ChatGPT, gli utenti Plus e Team possono accedere fin da ora alla early preview di uno dei nuovi modelli selezionando “o1-preview” dalle opzioni di modelli disponibili.
- È stato rilasciato anche “OpenAI o1 mini”, un modello ancora più veloce progettato per indirizzare le domande STEM.
- Entrambi i modelli sono disponibili a partire dal 12 settembre. Gli utenti di ChatGPT Enterprise ed Edu avranno accesso ad entrambi i modelli a partire dalla prossima settimana.
- Il rilascio di questi modelli avverrà anche all’interno delle API per gli sviluppatori che vogliono iniziare a sviluppare prototipi, con limiti e limitazioni tariffarie.
OpenAIo1-mini
La serie o1 eccelle nella generazione e nel debug accurati di codice complesso. Per offrire una soluzione più efficiente agli sviluppatori, OpenAI sta rilasciando anche OpenAIo1-mini, un modello di ragionamento più veloce ed economico che è particolarmente efficace nella codifica. Essendo un modello più piccolo, o1-mini è più economico dell’80% rispetto a o1-preview, il che lo rende un modello potente ed economico per applicazioni che richiedono ragionamento ma non un’ampia conoscenza del mondo.
Come usare OpenAIo1
Gli utenti di ChatGPT Plus e Team potranno accedere ai modelli o1 in ChatGPT. Sia o1-preview che o1-mini possono essere selezionati manualmente nel selettore di modelli e, al momento del lancio, i limiti di frequenza settimanali saranno di 30 messaggi per o1-preview e 50 per o1-mini. OpenAI sta lavorando per aumentare queste tariffe e consentire a ChatGPT di scegliere automaticamente il modello giusto per un determinato prompt.
Come fare i prompt su GPT-o1
L’utilizzo di GPT-o1 sarà leggermente diverso rispetto al prompt di GPT-4 o anche di GPT-4o. Dal momento che questo modello ha maggiori capacità di ragionamento, alcuni normali metodi di ingegneria del prompt non funzioneranno altrettanto bene. I modelli precedenti necessitavano di maggiori indicazioni e si sfruttavano finestre contestuali più lunghe per fornire ai modelli più istruzioni.
Secondo la documentazione API di OpenAI, i modelli o1 “funzionano meglio con richieste semplici”. Tuttavia, tecniche come l’istruzione del modello e la richiesta di informazioni “possono non migliorare le prestazioni e a volte le ostacolano”.
Quattro consigli per il prompting di o1
OpenAI consiglia agli utenti di o1 di pensare a quattro cose quando si richiedono i nuovi modelli:
- Mantenere le istruzioni semplici e dirette e non guidare troppo il modello perché capisce bene le istruzioni.
- Evitare le richieste a catena di pensiero, poiché i modelli di o1 ragionano già internamente.
- Usare delimitatori come le triple virgolette, i tag XML e i titoli delle sezioni, in modo che il modello possa avere chiarezza sulle sezioni che sta interpretando.
- Limitare il contesto aggiuntivo per la generazione aumentata del reperimento (RAG) perché OpenAI ha affermato che l’aggiunta di ulteriori contesti o documenti quando si utilizzano i modelli per compiti RAG potrebbe complicare eccessivamente la risposta.
I consigli di OpenAI per o1 sono molto diversi da quelli forniti agli utenti dei modelli precedenti. In precedenza, l’azienda suggeriva di essere molto specifici, includendo dettagli e dando ai modelli istruzioni passo-passo, GPTo1 farà meglio a “pensare” da solo a come risolvere le query.
GPT-o1 è ancora nuovo e le persone stanno ancora cercando di capire esattamente come usarlo.
Per saperne di più su OpenAIo1 consultare la System Card.