Il tanto atteso modello GPT-5 di OpenAI è stato rilasciato e si chiama OpenAI o1.
Se siete interessati a saperne di più sulle versioni o1-preview e o1-mini, potete consultare la nostra panoramica del modello o1 qui.
Che cos'è GPT-5?
OpenAI o1 è l'ultima serie di modelli linguistici di grandi dimensioni rilasciata da OpenAI il 12 settembre 2024, attualmente composta da due modelli: o1-preview e o1-mini.
La più grande differenza tra o1 e i modelli precedenti dell'azienda è il suo ragionamento a catena di pensiero. Anche se non è ancora stato rilasciato nella sua interezza, i modelli preview e mini hanno già superato GPT-4o nei test di matematica, scienze e codifica.
Il nuovo modello è il primo del suo genere, in grado di ragionare in tempo reale (proprio come un essere umano).
Che cosa significa per gli utenti la sua capacità di ragionamento? "È davvero ottimo, come se fosse materialmente migliore", ha detto un amministratore delegato con accesso avanzato.
Quando uscirà GPT-5?
OpenAI LLM è stato rilasciato al pubblico il 12 settembre 2024. Il rilascio comprendeva i modelli o1-preview e o1-mini.
Fino al momento dell'uscita, le previsioni erano molto varie: secondo le stime di utenti e giornalisti, la data di uscita era compresa tra l'estate del 2024 e il 2026.
Quanto è intelligente GPT-5?
OpenAI ha presentato un elenco di benchmark STEM che evidenziano le capacità di ragionamento di o1, tra cui:
- Prestazioni simili a quelle degli studenti di dottorato nei test di benchmark di fisica, chimica e biologia.
- Posizionamento tra i primi 500 studenti nelle qualificazioni per le Olimpiadi di matematica degli Stati Uniti.
- Classificazione all'89° percentile in Codeforces, un test di codifica competitivo.
Per saperne di più sulle capacità di ragionamento di o1, consultare il comunicato di ricerca di OpenAI.
Progetto Fragola
OpenAI o1 aveva in precedenza il nome in codice di Strawberry, con una forte componente di misticismo e intrigo. "Il funzionamento di Strawberry è un segreto molto stretto anche all'interno di OpenAI", ha dichiarato una fonte anonima a Reuters.
La versione più piccola di questa nuova IA è stata lanciata il 12 settembre 2024 come parte di un aggiornamento di ChatGPT. La versione più grande è probabilmente utilizzata da OpenAI per generare dati di addestramento per il suo LLMs, sostituendo potenzialmente la necessità di grandi quantità di dati del mondo reale.
In una riunione interna di tutti i membri di OpenAI il 9 luglio è stata presentata una dimostrazione di quello che potrebbe essere il Progetto Strawberry e che, a quanto pare, mostra capacità di ragionamento simili a quelle umane.
Qual è la differenza tra GPT-4 e GPT-5?
OpenAI Il CEO Sam Altman ritiene che il mondo abbia solo scalfito la superficie dell'IA. Al World Government Summit del gennaio 2024, Altman ha paragonato gli attuali modelli di OpenAI agli albori dei telefoni cellulari:
Anche se ci vorrà del tempo per passare dalla versione flip phone di GPT a quella per iPhone, il modello o1 ci porta un passo più vicino.
1) Potenziamento delle capacità di ragionamento
Al centro della sua intelligenza generale c'è la nuova capacità di ragionamento di o1. "Forse le aree di progresso più importanti riguarderanno la capacità di ragionamento", ha detto Altman a Gates. "Al momento, GPT-4 può ragionare solo in modi estremamente limitati".
Il ragionamento è notoriamente difficile. Anche per gli esseri umani. E OpenAI o1 è il primo modello a rivendicarlo.
Su Reddit e Medium non mancano gli utenti che postano i loro fallimenti su GPT-4, da arrosti di gruppo sulla sua capacità di risolvere i problemi a spiegazioni formali sulle sue limitate capacità di ragionamento.
2) Nuova convenzione di denominazione
Sebbene il nome non sia la cosa più entusiasmante del nuovo OpenAI LLM , si tratta di un cambiamento intenzionalmente significativo.
OpenAI o1 è il primo modello che si è liberato dell'appellativo "GPT", perché l'azienda sostiene che si tratta della prima fase di un nuovo "paradigma di ragionamento", mentre i modelli precedenti facevano parte di un "paradigma di pre-addestramento".
Il nuovo modello passa il tempo a ragionare in tempo reale, invece di affidarsi ai dati di pre-addestramento.
3) Tempi di attesa più lunghi
Ragionare in tempo reale richiede più tempo che fare riferimento ai dati di addestramento e generare una risposta. Se si pone una domanda a OpenAI o1-preview rispetto ad altri modelli, l'attesa sarà significativamente più lunga.
Tuttavia, con la possibilità di esternalizzare il ragionamento, è un piccolo prezzo da pagare. La velocità dei modelli o1 probabilmente migliorerà con l'uscita dei modelli successivi della serie.
4) Finestre contestuali identiche
Mentre molti ipotizzavano un aumento delle finestre di contenuto da GPT-4 al modello successivo, l'attuale serie o1 rimane identica alla finestra di contenuto di 128.000 di GPT-4o.
Le finestre di contesto rappresentano il numero di token (parole o sottoparole) che un modello può elaborare contemporaneamente. Una finestra di contesto più ampia consente al modello di assorbire un maggior numero di informazioni dal testo in ingresso, con conseguente maggiore accuratezza della risposta.
Uno dei difetti di GPT-4 è stata la sua capacità relativamente limitata di elaborare grandi quantità di testo. Ad esempio, GPT-4 Turbo e GPT-4o hanno una finestra di contesto di 128.000 token. Ma il modello Gemini di Google ha una finestra di contesto fino a 1 milione di token.
Al momento, se la vostra unica preoccupazione è un modello linguistico di grandi dimensioni in grado di assorbire grandi quantità di informazioni, OpenAI LLMs potrebbe non essere la scelta migliore. Se siete curiosi di sapere quale chatbot LLM fa al caso vostro, date un'occhiata al nostro articolo sui migliori chatbot LLM .
Quali dati di allenamento utilizza GPT-5?
Se c'è stata una resa dei conti per OpenAI nella sua scalata ai vertici del settore, è la serie di cause legali sulla formazione completa delle modelle.
GPT sono addestrati su enormi insiemi di dati presi da Internet, in gran parte protetti da copyright. L'uso non autorizzato dei dati ha portato a numerose lamentele e azioni legali: una causa da parte del New York Times, una causa da parte di una serie di agenzie di stampa statunitensi e affermazioni secondo cui il processo di formazione del modello viola il Regolamento generale sulla protezione dei dati dell'UE.
Un giudice californiano ha già respinto una delle cause sul copyright di OpenAI intentate da un gruppo di scrittori, tra cui le celebrità Sarah Silverman e Ta-Nehisi Coates. Non è ancora detto che OpenAI e compagnia saranno sostanzialmente frenati da queste denunce mentre proseguono i test.
L'ultimo modello è stato addestrato su una combinazione di dati disponibili pubblicamente e di dati acquistati da aziende. OpenAI ha richiesto una maggiore varietà di set di dati per addestrare meglio il modello.
È anche probabile che o1 sia stato usato per creare set di dati per addestrare ulteriormente il modello. OpenAI ha spiegato che Strawberry sarebbe stato usato per addestrare il futuro LLMs.
Quanto costa GPT-5?
Il nuovo modello OpenAI o1 è libero di essere utilizzato su ChatGPT, ma con limiti rigorosi per il momento.
Per l'utilizzo delle API, il modello OpenAI o1-preview costa 15 dollari per 1 milione di token di ingresso e 60 dollari per 1 milione di token di uscita.
Il modello o1-mini costa 3 dollari per 1 milione di gettoni di ingresso e 12 dollari per 1 milione di gettoni di uscita, il che lo rende un modello molto più accessibile per l'uso quotidiano.
Tuttavia, questi modelli sono più costosi delle opzioni precedenti di OpenAI. Il modello GPT-4o ha un prezzo di 5 dollari per 1 milione di gettoni di ingresso e 15 dollari per 1 milione di gettoni di uscita. Il modello GPT-4o mini ha un prezzo di 0,150 dollari per 1 milione di gettoni di ingresso e 0,6 dollari per 1 milione di gettoni di uscita.
Approfondimenti in anteprima da OpenAI
Prima del lancio dell'o1 (precedentemente noto anche come Strawberry e Q*), i dirigenti e gli addetti ai lavori di OpenAI hanno rilasciato sempre più spesso informazioni sul modello di nuova generazione. Ecco una carrellata di ciò che l'azienda ha dichiarato prima del lancio:
- OpenAI L'amministratore delegato giapponese ha annunciato la data di uscita del 2024, oltre a partnership tra il nuovo prodotto e Apple, Spotify e Coca-Cola.
- Il CEO Sam Altman ha dichiarato che il prossimo modello sarà in grado di elaborare e-mail e dettagli del calendario e che sarà più personalizzabile.
- Il CTO Mira Murati ha spiegato in un'intervista a Dartmouth Engineering che GPT-3 ha l'intelligenza di un bambino, GPT-4 è più simile a un liceale intelligente e OpenAI o1 ha un'intelligenza da dottorato (in alcuni compiti).
- Mustafa Suleyman, CEO di Microsoft AI, ha dichiarato che i modelli saranno in grado di "agire" in ambienti nuovi solo all'indirizzo GPT-6, tra due anni.
- La cautela è fondamentale: L'amministratore delegato Sam Altman è stato cauto sulla data di rilascio del modello o1, spiegando che OpenAI aveva "molte altre cose importanti da rilasciare prima". Ha dichiarato che l'azienda rilascerà il modello solo quando avrà la certezza di poterlo fare in modo sicuro e responsabile.
- Nella sua intervista a Stanford, Altman ha scherzato sul fatto che GPT-5 farà sembrare GPT-4 "leggermente imbarazzante" al confronto.
- L'Istituto statunitense per la sicurezza dell'IA ha ricevuto l'accesso anticipato al prossimo modello di OpenAI, in modo che le due organizzazioni possano "portare avanti la scienza delle valutazioni dell'IA".
- Avrà un set di dati esteso. GPT Il modello -5 è stato addestrato su una combinazione di dati disponibili pubblicamente e di dati acquistati da aziende. OpenAI ha richiesto una maggiore varietà di set di dati per addestrare meglio il modello.
Il futuro di ChatGPT
La prossima generazione di modelli linguistici di grandi dimensioni rivoluzionerà il modo in cui interagiamo con l'IA nella nostra vita quotidiana. Alla conferenza Tech di Bloomberg,Brad Lightcap, COO di OpenAI , ha accennato a come l'azienda intende rivoluzionare l'interazione uomo-computer, portando GPT da LLM a un modello con capacità simili a quelle di un agente.
"Nel 2026 esisterà un ingegnere pronto all'uso?". Ha detto Lightcap. "Non si fa l'ingegnere di emergenza con il proprio amico".
Un modello più capace e personalizzato, con maggiori capacità multimodali, promette proprio quello che Altman e OpenAI si aspettano: l'inimmaginabile. Il previsto GPT-5 sarà un passo avanti.
Maggiore personalizzazione
GPT-4 è spesso utilizzato come strumento unico per tutti. Ma le future iterazioni diventeranno più personalizzate. Nel podcast di Gates, Altman ha ribadito che la personalizzazione e la customizzazione saranno la chiave dei futuri modelli OpenAI . "Le persone vogliono cose molto diverse da GPT-4: stili diversi, serie di presupposti diversi".
OpenAI ha già introdotto Custom GPTs, consentendo agli utenti di personalizzare un GPT per un compito specifico, dall'insegnare un gioco da tavolo all'aiutare i bambini a completare i compiti. Sebbene la personalizzazione non fosse in primo piano in OpenAI o1, si prevede che in futuro diventerà una tendenza importante.
Nel frattempo, potete personalizzare gratuitamente un chatbot AI dotato della potenza di GPT-4o. È quello che sappiamo fare meglio. Iniziate qui.
Più multimodale
La multimodalità è stata al centro delle ultime iterazioni di GPT. OpenAI non mostra segni di rallentamento.
OpenAI ha introdotto GPT-4o nel maggio 2024, portando con sé maggiori capacità testuali, vocali e visive. A poca distanza da GPT-4 Turbo, è in grado di sostenere conversazioni naturali, analizzare immagini, descrivere immagini ed elaborare audio complessi.
I cambiamenti nella multimodalità creano enormi cambiamenti nelle modalità di interazione con GPT. Il flusso di conversazione naturale - quando il modello è in grado di interpretare accuratamente i cambiamenti tonali e di seguire modelli di discorso simili a quelli umani, come GPT-4o - rappresenta un enorme passo avanti nell'elaborazione del linguaggio naturale da parte dell'intelligenza artificiale.
E non si tratta solo di voce e testo potenziati. OpenAI non ha esitato a presentare il suo prossimo modello text-to-video Sora. Il modello AI è stato sviluppato per imitare complessi movimenti della telecamera e creare personaggi e scenari dettagliati in clip di 60 secondi.
Se la storia della multimodalità non vi basta, ascoltate il CEO di OpenAI . Altman ha confermato a Gates che l'elaborazione video, insieme al ragionamento, è una priorità assoluta per i futuri modelli GPT .
Il potere di GPT, personalizzato
E se il vostro chatbot AI si sincronizzasse automaticamente con ogni aggiornamento di GPT ?
Botpress fornisce soluzioni di chatbot AI personalizzabili dal 2017, fornendo agli sviluppatori gli strumenti necessari per creare facilmente chatbot con la potenza del più recente LLMs. I chatbot di Botpress possono essere addestrati su fonti di conoscenza personalizzate, come il vostro sito web o il catalogo prodotti, e si integrano perfettamente con i sistemi aziendali.
L'unica piattaforma che spazia dall'assenza di codice alla personalizzazione e all'estendibilità infinite, Botpress vi permette di ottenere automaticamente la potenza dell'ultima versione di GPT sul vostro chatbot, senza alcuno sforzo.
Iniziate a costruire oggi stesso. È gratuito.
Indice dei contenuti
Rimanete aggiornati sulle ultime novità in materia di agenti AI
Condividi questo articolo su: