Dopo mesi di speculazioni, l'ultima release di OpenAIStrawberry LLM è stata rilasciata, e non si chiama GPT-5.
Precedentemente indicata con nomi in codice criptici e intriganti come Q* e Strawberry, l'ultima serie di modelli si è infine stabilizzata sul nome OpenAI o1.
L'aggiornamento più importante del nuovo modello di OpenAI è la sua maggiore capacità di ragionamento. OpenAI ha spiegato che o1 è stato addestrato a passare più tempo a pensare rispetto ai modelli precedenti, avvicinandosi così all'intelligenza umana.
Che cos'è OpenAI o1?
OpenAI o1 è l'ultima serie di modelli linguistici di grandi dimensioni rilasciata da OpenAI il 12 settembre 2024, attualmente composta da due modelli: o1-preview e o1-mini.
La più grande differenza tra o1 e i modelli precedenti dell'azienda è il suo ragionamento avanzato. Anche se non è ancora stato rilasciato nella sua interezza, i modelli preview e mini hanno già superato GPT-4o nei test di matematica, scienze e codifica.
OpenAI modelli o1
Il rilascio di settembre comprendeva due modelli, l'o1-preview e l'o1-mini. Sono i primi di una serie di modelli che continueranno a essere rilasciati man mano che OpenAI perfezionerà il nuovo LLM.
La differenza? Il modello o1-mini è più piccolo e più economico dell'80% rispetto al modello preview. È costruito per compiti che richiedono un ragionamento avanzato, ma non una conoscenza più ampia. È perfettamente adatto a compiti che coinvolgono la codifica o la matematica.
Quanto è intelligente OpenAI o1?
OpenAI ha presentato un elenco di benchmark STEM che evidenziano le capacità di ragionamento di o1, tra cui:
- Prestazioni simili a quelle degli studenti di dottorato nei test di benchmark di fisica, chimica e biologia.
- Posizionamento tra i primi 500 studenti nelle qualificazioni per le Olimpiadi di matematica degli Stati Uniti.
- Classificazione all'89° percentile in Codeforces, un test di codifica competitivo.
Per saperne di più sulle capacità di ragionamento di o1, consultare il comunicato di ricerca di OpenAI.
Che cos'è il ragionamento a catena?
I modelli o1 utilizzano il ragionamento a catena, un modo più lungo e approfondito di scomporre le richieste.
Se il modello o1 riceve una richiesta, non risponderà immediatamente - da qui il lungo tempo di attesa. Al contrario, ragionerà attraverso tutti i passaggi, valutando attentamente ogni informazione e le sue implicazioni prima di decidere la linea d'azione successiva. Non fornirà una risposta finché non avrà riflettuto sull'intera serie di passaggi richiesti dalla domanda.
In che modo o1 è diverso da GPT-4o?
1) Capacità di ragionamento
Al centro della sua intelligenza generale c'è la nuova capacità di ragionamento di o1. "Forse le aree di progresso più importanti riguarderanno la capacità di ragionamento", ha detto Altman a Gates. "Al momento, GPT-4 può ragionare solo in modi estremamente limitati".
Il ragionamento è notoriamente difficile. Anche per gli esseri umani. E OpenAI o1 è il primo modello a rivendicarlo.
I modelli o1 sono in grado di ragionare in tempo reale, anziché basarsi su dati di pre-addestramento. Per questo motivo il nuovo modello è migliore nei compiti di scienza, matematica e codifica rispetto ai precedenti modelli OpenAI .
2) Più difficile da sbloccare
Con l'aumento delle preoccupazioni per la sicurezza, in concomitanza con la crescita della popolarità e della potenza del sito LLMs , la sicurezza è stata uno dei punti chiave dell'ultimo sviluppo di OpenAI. Durante lo sviluppo della serie o1, l'azienda ha collaborato con gli istituti statunitensi e britannici per la sicurezza dell'intelligenza artificiale e ha lavorato con il governo americano per stabilire la dovuta diligenza.
Come importante passo in avanti, la serie o1 è molto più difficile da jailbreakare - bypassando le misure di sicurezza - rispetto ai modelli precedenti.
In uno dei test di jailbreak più difficili, il modello o1-preview ha ottenuto un punteggio di 84 su 100, rispetto al misero 22 ottenuto da GPT-4o.
3) Nuova convenzione di denominazione
Sebbene il nome non sia la cosa più entusiasmante del nuovo OpenAI LLM , si tratta di un cambiamento intenzionalmente significativo.
OpenAI o1 è il primo modello che si è liberato dell'appellativo "GPT", perché l'azienda sostiene che si tratta della prima fase di un nuovo "paradigma di ragionamento", mentre i modelli precedenti facevano parte di un "paradigma di pre-addestramento".
Il nuovo modello passa il tempo a ragionare in tempo reale, invece di affidarsi ai dati di pre-addestramento.
4) Migliori in compiti di risoluzione di problemi STEM
Un migliore ragionamento comporta migliori capacità matematiche.
Sia a o1 che a GPT-4o è stato chiesto di completare un esame di qualificazione per le Olimpiadi Internazionali di Matematica. GPT-4o ha risolto il 13% dei problemi, mentre o1 ha risolto l'83%.
5) Tempi di attesa più lunghi
Ragionare in tempo reale richiede più tempo che fare riferimento ai dati di addestramento e generare una risposta. Se si pone una domanda a OpenAI o1-preview rispetto ad altri modelli, l'attesa sarà significativamente più lunga.
Tuttavia, con la possibilità di esternalizzare il ragionamento, è un piccolo prezzo da pagare. La velocità dei modelli o1 probabilmente migliorerà con l'uscita dei modelli successivi della serie.
Chi può utilizzare o1?
A partire dal 12 settembre, gli utenti di ChatGPT Plus e del Team sono in grado di accedere ai modelli o1 in ChatGPT.
OpenAI ha annunciato che renderà disponibile o1-mini agli utenti liberi, anche se non è stata fissata una data precisa.
Gli attuali limiti tariffari settimanali sono 30 messaggi per 01-preview e 50 per o1-mini, anche se presto aumenteranno.
Per cosa dovrei usare o1?
Le maggiori capacità di ragionamento di o1 sono particolarmente utili per risolvere problemi complessi in matematica, scienze e codifica. Comespiega OpenAI :
Limitazioni di OpenAI o1
Come anteprima, questo modello non dispone ancora di tutte le funzionalità di GPT-4o. Se si desidera utilizzare LLM per navigare sul Web alla ricerca di informazioni o per caricare file o immagini, è necessario attenersi a GPT-4o fino a quando non verranno rilasciati i modelli successivi di o1.
Come richiedere a OpenAI o1
OpenAII suggerimenti di prompting di o1 sono cambiati rispetto ai modelli precedenti, a causa del suo ragionamento potenziato.
Mantenete semplici le indicazioni. Si tratta di un modello intelligente, che non ha bisogno di molte indicazioni come la serie GPT-4. Ciò significa evitare qualsiasi catena di input di pensiero: il modello sta già ragionando internamente.
Costruire agenti IA con poteri di GPT
E se l'agente AI si sincronizzasse automaticamente con ogni aggiornamento di OpenAI ?
Botpress è una piattaforma di agenti AI completamente aperta ed estendibile. Il nostro stack consente agli sviluppatori di creare chatbot e agenti di intelligenza artificiale con qualsiasi capacità, in qualsiasi flusso di lavoro.
L'unica piattaforma che spazia dalla configurazione a basso codice alla personalizzazione e all'estendibilità infinite, Botpress vi permette di ottenere automaticamente la potenza dell'ultima versione di GPT sul vostro chatbot, senza alcuno sforzo.
Iniziare acostruire oggi. È gratis.
Indice dei contenuti
Rimanete aggiornati sulle ultime novità in materia di agenti AI
Condividi questo articolo su: