- OpenAI o1 è una nuova serie di modelli (a partire da o1-preview e o1-mini) focalizzata sul ragionamento in tempo reale, non solo sul pre-training.
- o1 supera GPT-4o nei compiti STEM, ottenendo l'83% nelle qualificazioni IMO contro il 13% di GPT-4o, e si colloca all'89° percentile su Codeforces.
- o1 utilizza nativamente il ragionamento chain-of-thought, risultando più lento ma molto più preciso nei compiti complessi.
- o1 è molto più difficile da aggirare, ottenendo 84/100 nei test di sicurezza avversaria rispetto ai 22 di GPT-4o.
Dopo mesi di speculazioni tra i fan di ChatGPT, è stata rilasciata la nuova versione Strawberry LLM di OpenAI – e non si chiama GPT-5.
In precedenza nota con nomi in codice criptici e intriganti come Q* e Strawberry, la nuova serie di modelli ha finalmente adottato il nome OpenAI o1.
Il maggiore aggiornamento del nuovo modello di OpenAI riguarda le sue capacità di ragionamento avanzate. OpenAI ha spiegato che o1 è stato addestrato per dedicare più tempo al ragionamento rispetto ai modelli precedenti, avvicinandosi così all’intelligenza umana.
Cos'è OpenAI o1?
OpenAI o1 è la nuova serie di modelli linguistici di grandi dimensioni rilasciata da OpenAI il 12 settembre 2024, attualmente composta da due modelli: o1-preview e o1-mini.
La principale differenza tra o1 e i modelli precedenti dell'azienda è il suo ragionamento avanzato. Anche se non è ancora stato rilasciato completamente, le versioni preview e mini superano già GPT-4o nei test di matematica, scienze e programmazione.
Modelli OpenAI o1
Il rilascio di settembre ha incluso due modelli, o1-preview e o1-mini. Sono i primi di una serie che continuerà a essere pubblicata mentre OpenAI perfeziona il suo nuovo LLM.
La differenza? Il modello o1-mini è più piccolo e costa l’80% in meno rispetto al modello di anteprima. È pensato per compiti che richiedono ragionamento avanzato, ma non conoscenze generali. È perfetto per attività che coinvolgono codice o matematica.
Quanto è intelligente OpenAI o1?
OpenAI ha presentato una serie di benchmark STEM che evidenziano le capacità di ragionamento di o1, tra cui:
- Prestazioni simili a quelle di studenti di dottorato nei test di riferimento su fisica, chimica e biologia.
- Classificarsi tra i primi 500 studenti nella selezione statunitense per la USA Math Olympiad.
- Classificato nell’89° percentile su Codeforces, un test di programmazione competitiva.
Puoi approfondire le capacità di ragionamento di o1 nel comunicato di ricerca di OpenAI.
Che cos'è il ragionamento a catena di pensieri (chain of thought reasoning)?
I modelli o1 utilizzano il ragionamento a catena di pensieri, un modo più lungo e approfondito di scomporre le richieste.
Se il modello o1 riceve un prompt, non risponde subito – da qui l’attesa prolungata. Invece, ragiona su ogni passaggio, valutando attentamente ogni informazione e le sue implicazioni prima di decidere come procedere. Non fornirà una risposta finché non avrà considerato tutta la sequenza di passaggi richiesta.
In cosa o1 è diverso da GPT-4o?
1) Capacità di ragionamento
Al centro della sua intelligenza generale c’è la nuova capacità di ragionamento di o1. “Forse le aree di progresso più importanti saranno proprio quelle legate al ragionamento,” ha detto Altman a Gates. “Al momento, GPT-4 può ragionare solo in modi estremamente limitati.”
Il ragionamento è notoriamente difficile. Anche per gli esseri umani. E OpenAI o1 è il primo modello a dichiarare di riuscirci.
I modelli o1 sono in grado di ragionare in tempo reale, invece di affidarsi solo ai dati di pre-addestramento. Per questo il nuovo modello è migliore nei compiti di scienza, matematica e programmazione rispetto ai precedenti modelli OpenAI.
2) Più difficile da aggirare
Con la crescita di popolarità e potenza degli LLM, la sicurezza è diventata una priorità nello sviluppo più recente di OpenAI. L’azienda ha collaborato con gli AI Safety Institutes di USA e UK durante lo sviluppo della serie o1, oltre che con il governo americano per stabilire le dovute procedure di verifica.
Come passo avanti importante, la serie o1 è molto più difficile da sbloccare – cioè aggirare le misure di sicurezza – rispetto ai modelli precedenti.
In uno dei loro test di jailbreaking più difficili, il modello o1-preview ha ottenuto un punteggio di 84 su 100, rispetto al deludente 22 di GPT-4o.
3) Nuova convenzione di denominazione
Anche se il nome non è la cosa più entusiasmante del nuovo LLM di OpenAI, rappresenta comunque un cambiamento intenzionale e significativo.
OpenAI o1 è il primo modello a rinunciare al nome 'GPT', perché l'azienda sostiene che rappresenti la prima fase di un nuovo 'paradigma di ragionamento', mentre i modelli precedenti facevano parte di un 'paradigma di pre-addestramento'.
Il nuovo modello dedica tempo al ragionamento in tempo reale, invece di affidarsi solo ai dati di pre-addestramento.
4) Più efficiente nei compiti di problem-solving STEM
Con un ragionamento migliore arrivano anche migliori capacità di calcolo.
Sia o1 che GPT-4o hanno sostenuto un esame di qualificazione per l’Olimpiade Internazionale di Matematica. GPT-4o ha risolto il 13% dei problemi, mentre o1 l’83%.
5) Tempi di attesa più lunghi
Il ragionamento in tempo reale richiede più tempo rispetto al semplice richiamo dei dati di training e alla generazione di una risposta. Se fai una domanda a OpenAI o1-preview rispetto ad altri modelli, dovrai aspettare sensibilmente di più.
Tuttavia, poter delegare il ragionamento è un piccolo prezzo da pagare. La velocità dei modelli o1 probabilmente migliorerà con il rilascio dei prossimi modelli della serie.
Chi può usare o1?
Dal 12 settembre, gli utenti ChatGPT Plus e Team possono accedere ai modelli o1 in ChatGPT.
OpenAI ha annunciato che renderà o1-mini disponibile anche agli utenti gratuiti, anche se non è stata ancora fissata una data.
Gli attuali limiti settimanali sono 30 messaggi per 01-preview e 50 per o1-mini, ma presto aumenteranno.
Per cosa dovrei usare o1?
Le capacità di ragionamento avanzate di o1 sono particolarmente utili per risolvere problemi complessi di matematica, scienza e programmazione. Come spiega OpenAI :
Limitazioni di OpenAI o1
Come anteprima, questo modello non ha ancora tutte le funzionalità di GPT-4o. Se vuoi usare un LLM per navigare sul web o caricare file o immagini, dovrai continuare a usare GPT-4o fino al rilascio delle versioni successive di o1.
Come fare prompt su OpenAI o1
I suggerimenti di prompt di OpenAI sono cambiati per o1 rispetto ai modelli precedenti, grazie a una maggiore capacità di ragionamento.
Mantieni i prompt semplici. È un modello intelligente e non ha bisogno di tante istruzioni come la serie GPT-4. Quindi evita input con catene di ragionamento: il modello ragiona già internamente.
Crea agenti AI basati su GPT
E se il tuo agente AI si sincronizzasse automaticamente con ogni aggiornamento di OpenAI?
Botpress è una piattaforma AI agent completamente aperta ed estendibile. Il nostro stack permette agli sviluppatori di creare chatbot e agenti IA con qualsiasi capacità, su qualsiasi flusso di lavoro.
L’unica piattaforma che va dalla configurazione low-code a una personalizzazione ed estendibilità senza limiti, Botpress ti permette di ottenere automaticamente la potenza dell’ultima versione di GPT sul tuo chatbot – senza alcuno sforzo.
Inizia a costruire oggi. È gratis.
Domande frequenti
1. Cosa significa “o1”? Esiste una logica di denominazione per i modelli futuri (ad es. o2, o3)?
Il nome “o1” probabilmente sta per “OpenAI 1”, a indicare l’inizio di una nuova famiglia di modelli. Da ciò, è ragionevole aspettarsi una nomenclatura sequenziale come “o2”, “o3”, ecc. per le future versioni di questa serie.
2. Perché OpenAI si è allontanata dalla convenzione di denominazione “GPT”?
OpenAI è passata dalla denominazione “GPT” a “o1” per segnalare un cambio di focus: dai modelli linguistici generali pre-addestrati a modelli ottimizzati per il ragionamento in tempo reale e le capacità interattive.
3. OpenAI o1 è il successore di GPT-4 o una linea di prodotti completamente nuova?
OpenAI o1 non è un successore diretto di GPT-4 ma rappresenta l’inizio di una nuova linea di prodotti pensata per il ragionamento in tempo reale e l’efficienza, pur basandosi sui progressi fatti con GPT-4 e GPT-4o.
4. o1 gestisce meglio gli input multilingue rispetto a GPT-4?
OpenAI non ha dichiarato ufficialmente come o1 si confronti con GPT-4 nelle prestazioni multilingue, ma poiché o1 è ottimizzato per il ragionamento e nuove capacità, è possibile che le future versioni gestiranno l’input multilingue ancora meglio.
5. Quando sarà disponibile o1 per gli utenti del piano gratuito?
OpenAI ha confermato che una versione chiamata “o1-mini” sarà rilasciata agli utenti del piano gratuito, ma al momento non è stata annunciata una data ufficiale per la disponibilità generale.





.webp)
