Lahat ng dapat mong malaman tungkol sa OpenAI o1 (dating kilala bilang Strawberry)

Q: What does “o1” stand for? Is there a naming logic for future models (e.g., o2, o3)?

Ang "o1" ay malamang na nangangahulugang " OpenAI o1" na nagpapahiwatig ng pagsisimula ng isang bagong modelong pamilya. Batay dito, makatuwirang asahan ang sunud-sunod na pagpapangalan tulad ng "o2," "o3," atbp., para sa mga susunod na bersyon sa seryeng ito.

Isinulat ni

Sarah Chudleigh

Researcher at AI Content Lead

Talaan ng mga Nilalaman

Hakbang 1. ang pamagat ng hakbang ay napupunta dito gaya ng inaasahan

Buod

OpenAI Ang o1 ay isang bagong serye ng modelo (nagsisimula sa o1-preview at o1-mini) na nakatuon sa real-time na pangangatwiran, hindi lamang bago ang pagsasanay.
ang o1 ay higit sa pagganap GPT -4o sa mga gawain sa STEM, na nakakuha ng 83% sa mga kwalipikasyon ng IMO vs. GPT -4o's 13%, at nasa ika-89 na percentile sa Codeforces.
Ang o1 ay gumagamit ng chain-of-thought na pangangatwiran sa katutubong paraan, ginagawa itong mas mabagal ngunit makabuluhang mas tumpak sa mga kumplikadong gawain.
Ang o1 ay mas mahirap i-jailbreak, nakakakuha ng 84/100 sa adversarial safety tests vs. GPT -4o's 22.

Pagkatapos ng mga buwan ng haka-haka mula sa mga tagahanga ChatGPT , OpenAI Ang pinakabagong Strawberry LLM bumaba ang release – at hindi ito tinatawag na GPT -5 .

Nauna nang tinukoy sa mga misteryoso, nakakaintriga na mga codename tulad ng Q* at Strawberry, ang pinakabagong serye ng modelo ay naayos na sa moniker na OpenAI o1 .

Ang pinakamalaking update sa OpenAI Ang bagong modelo ay ang pinahusay nitong mga kasanayan sa pangangatwiran. OpenAI ipinaliwanag na ang o1 ay sinanay na gumugol ng mas maraming oras sa pag-iisip kaysa sa mga nakaraang modelo, na inilalapit ito sa katalinuhan ng tao.

Ano ang OpenAI o1?

OpenAI Ang o1 ay ang pinakabagong serye ng malalaking modelo ng wika na inilabas ni OpenAI noong Setyembre 12, 2024, na kasalukuyang binubuo ng dalawang modelo: o1-preview at ang o1-mini.

Ang pinakamalaking pagkakaiba sa pagitan ng o1 at ng mga nakaraang modelo ng kumpanya ay ang advanced na pangangatwiran nito. Bagama't hindi pa ito inilabas nang buo, ang preview at mga mini na modelo ay pumutok na GPT -4o sa labas ng tubig sa mga pagsusulit ng matematika, agham, at coding.

OpenAI o1 mga modelo

Kasama sa release noong Setyembre ang dalawang modelo, ang o1-preview at ang o1-mini. Sila ang una sa isang serye ng mga modelo na patuloy na ipapalabas bilang OpenAI pinipino ang kanilang bago LLM .

Ang pagkakaiba? Ang o1-mini na modelo ay mas maliit at 80% na mas mura kaysa sa preview na modelo. Ito ay binuo para sa mga gawain na nangangailangan ng advanced na pangangatwiran, ngunit hindi mas malawak na kaalaman. Ito ay ganap na angkop para sa mga gawaing may kinalaman sa coding o matematika.

Bumuo ng AI Chatbots

Bumuo ng mga custom na ahenteng chatbot

Magsimula ngayon

Gaano katalino OpenAI o1?

OpenAI ay nagpahayag ng isang listahan ng mga benchmark ng STEM na nagpapakita ng mga kakayahan ng pangangatuwiran ng o1, kabilang ang:

Isang katulad na pagganap sa mga mag-aaral ng PhD sa mga benchmark na pagsusulit sa pisika, kimika, at biology.
Paglalagay sa nangungunang 500 mag-aaral sa US qualifier para sa USA Math Olympiad.
Pagraranggo sa 89th percentile sa Codeforces, isang mapagkumpitensyang pagsubok sa coding.

Maaari kang magbasa nang higit pa tungkol sa mga kakayahan ng pangangatwiran ng o1 sa OpenAI paglabas ng pananaliksik .

Ano ang chain of thought reasoning?

Ang mga modelo ng o1 ay gumagamit ng chain of thought reasoning , isang mas mahaba at mas masusing paraan ng paghiwa-hiwalay ng mga kahilingan.

Kung bibigyan ng prompt ang modelong o1, hindi ito sasagot kaagad - kaya ang mahabang oras ng paghihintay. Sa halip, ito ay mangatuwiran sa bawat isa sa mga hakbang, maingat na isinasaalang-alang ang bawat piraso ng impormasyon at ang mga implikasyon nito bago magpasya sa susunod na hakbang ng aksyon. Hindi ito magbibigay ng sagot hangga't hindi nito naiisip ang buong serye ng mga hakbang na kinakailangan sa tanong.

Naglalagay ng mga Ahente ng AI?

Basahin ang aming Blueprint para sa AI Agent Implementation

Basahin Ngayon

Paano naiiba ang o1 sa GPT -4o?

1) Mga kakayahan sa pangangatwiran

Sa gitna ng pangkalahatang katalinuhan nito ay ang bagong kakayahan ng o1 na mangatuwiran. "Siguro ang pinakamahalagang bahagi ng pag-unlad ay nasa paligid ng kakayahan sa pangangatwiran," ibinahagi ni Altman kay Gates. “Sa ngayon, GPT -4 ay maaaring mangatuwiran sa mga limitadong paraan lamang."

Ang pangangatwiran ay kilala na mahirap. Kahit para sa mga tao. At OpenAI Ang o1 ang unang modelo na nag-claim nito.

Nagagawa ng mga modelong o1 na mangatuwiran sa real time, sa halip na umasa sa data ng pre-training. Ito ang dahilan kung bakit ang bagong modelo ay mas mahusay sa mga gawain sa agham, matematika, at coding kaysa dati OpenAI mga modelo.

Nangangatuwiran sa OpenAI o1

2) Mas mahirap i-jailbreak

Sa pagtaas ng mga alalahanin sa kaligtasan bilang LLMs lumago sa katanyagan at kapangyarihan, ang seguridad ay naging pangunahing pokus ng OpenAI ang pinakabagong pag-unlad. Nakipagsosyo ang kumpanya sa US at UK AI Safety Institutes habang binubuo ang serye ng o1, gayundin nakipagtulungan sa gobyerno ng Amerika upang maitaguyod ang kanilang angkop na pagsusumikap.

Bilang isang pangunahing hakbang sa pasulong, ang serye ng o1 ay mas mahirap i-jailbreak - i-bypass ang mga hakbang sa kaligtasan - kaysa sa mga nakaraang modelo.

Sa isa sa kanilang pinakamahirap na pagsubok sa pag-jailbreak, ang modelo ng o1-preview ay nakakuha ng 84 sa 100, kumpara sa isang malungkot na 22 na marka mula sa GPT -4o.

3) Bagong kombensiyon ng pagbibigay ng pangalan

Habang ang pangalan nito ay hindi ang pinaka kapana-panabik na bagay tungkol sa bago OpenAI LLM , isa itong sadyang makabuluhang pagbabago.

OpenAI Ang o1 ay ang unang modelo na nag-alis ng ' GPT ' moniker, at iyon ay dahil inaangkin ng kumpanya na ito ang unang yugto ng isang bagong 'paradigma ng pangangatwiran', samantalang ang mga mas lumang modelo ay bahagi ng isang 'paradigm bago ang pagsasanay'.

Ang bagong modelo ay gumugugol ng oras sa pangangatuwiran sa real time, sa halip na umasa sa data nito bago ang pagsasanay.

4) Mas mahusay sa mga gawain sa paglutas ng problema ng STEM

Sa mas mahusay na pangangatwiran ay may mas mahusay na mga kasanayan sa matematika.

Parehong o1 at GPT -4o ay hiniling na kumpletuhin ang isang kwalipikadong pagsusulit para sa International Mathematics Olympiad. GPT -4o nalutas ang 13% ng mga problema, habang ang o1 ay nalutas ang 83%.

OpenAI o1 at Coding

5) Mas mahabang oras ng paghihintay

Ang pangangatwiran sa real time ay tumatagal ng mas matagal kaysa sa pagtukoy sa data ng pagsasanay at pagbuo ng tugon. Kung magtatanong ka sa OpenAI o1-preview kumpara sa ibang mga modelo, mas matagal kang maghihintay.

Gayunpaman, sa kakayahang mag-outsource ng pangangatwiran, ito ay isang maliit na presyo na babayaran. Ang bilis ng mga modelo ng o1 ay malamang na mapabuti habang ang mga susunod na modelo sa serye ay inilabas.

Sino ang maaaring gumamit ng o1?

Mula noong Setyembre 12, ChatGPT Plus at ang mga user ng Team ay naa-access ang mga o1 na modelo sa ChatGPT .

OpenAI inihayag na gagawin nilang available ang o1-mini sa mga libreng user, bagama't walang natukoy na petsa.

Ang kasalukuyang lingguhang mga limitasyon sa rate ay 30 mensahe para sa 01-preview at 50 para sa o1-mini, bagama't malapit nang tumaas ang mga ito.

Para saan ko dapat gamitin ang o1?

Ang pinahusay na mga kakayahan sa pangangatwiran ng o1 ay partikular na kapaki-pakinabang para sa paglutas ng mga kumplikadong problema sa matematika, agham, at coding. Bilang OpenAI nagpapaliwanag :

"Ang o1 ay maaaring gamitin ng mga mananaliksik sa pangangalagang pangkalusugan upang i-annotate ang data ng pagkakasunud-sunod ng cell, ng mga physicist upang bumuo ng mga kumplikadong mathematical formula na kailangan para sa quantum optics, at ng mga developer sa lahat ng larangan upang bumuo at magsagawa ng mga multi-step na daloy ng trabaho."

Mga limitasyon ng OpenAI o1

Bilang isang preview, ang modelong ito ay wala pang lahat ng kakayahan ng GPT -4o. Kung nais mong gumamit ng isang LLM upang mag-browse sa web para sa impormasyon, o gusto mong mag-upload ng mga file o larawan, kailangan mong manatili GPT -4o hanggang sa paglabas ng mga modelo ng o1.

Paano mag-prompt OpenAI o1

OpenAI Nagbago ang mga iminumungkahing mungkahi ni o1 kumpara sa kanilang mga nakaraang modelo, dahil sa pinahusay na pangangatwiran nito.

Panatilihing simple ang iyong mga prompt. Ito ay isang matalinong modelo, at hindi nangangailangan ng maraming patnubay gaya ng GPT -4 na serye. Nangangahulugan iyon na iwasan ang anumang chain of thought input – ang modelo ay nasa loob na ng pangangatuwiran.

Bumuo GPT -powered AI agent

Paano kung awtomatikong mag-synchronize ang iyong AI agent sa bawat OpenAI update?

Botpress ay isang ganap na bukas at napapalawak na platform ng ahente ng AI. Ang aming stack nagbibigay-daan sa mga developer na bumuo ng mga chatbot at mga ahente ng AI na may anumang mga kakayahan, sa anumang daloy ng trabaho.

Ang tanging platform na mula sa mababang code set-up hanggang sa walang katapusang pagpapasadya at pagpapalawig, Botpress nagbibigay-daan sa iyong awtomatikong makuha ang kapangyarihan ng pinakabago GPT bersyon sa iyong chatbot – walang kinakailangang pagsisikap.

Simulan ang pagtatayo ngayon. Ito'y LIBRE.

Bumuo ng AI Chatbots

Bumuo ng mga custom na ahenteng chatbot

Magsimula ngayon

Mga FAQ

1. Ano ang ibig sabihin ng “o1”? Mayroon bang lohika ng pagbibigay ng pangalan para sa mga modelo sa hinaharap (hal., o2, o3)?

Ang pangalang "o1" ay malamang na nangangahulugang " OpenAI 1," na nagpapahiwatig ng pagsisimula ng isang bagong modelong pamilya. Batay dito, makatuwirang asahan ang sunud-sunod na pagpapangalan tulad ng "o2," "o3," atbp., para sa mga susunod na bersyon sa seryeng ito.

2. Bakit ginawa OpenAI lumayo sa " GPT ” kombensiyon ng pagpapangalan?

OpenAI lumipat mula sa " GPT ” pagpapangalan ng convention sa “o1” upang magpahiwatig ng pagbabago sa focus – mula sa pangkalahatang pre-trained na mga modelo ng wika hanggang sa mga modelong na-optimize para sa real-time na pangangatwiran at interactive na mga kakayahan.

3. Ay OpenAI o1 ang kahalili sa GPT -4 o isang ganap na bagong linya ng produkto?

OpenAI o1 ay hindi isang direktang kahalili sa GPT -4 ngunit kumakatawan sa simula ng isang bagong linya ng produkto na idinisenyo sa paligid ng real-time na pangangatwiran at kahusayan, bagama't ito ay bumubuo sa pag-unlad na ginawa gamit ang GPT -4 at GPT -4o.

4. Maaari o1 pangasiwaan ang mga multi-language input na mas mahusay kaysa sa GPT -4?

OpenAI ay hindi pormal na nakasaad kung paano inihahambing ang o1 sa GPT -4 sa pagganap sa multilinggwal, ngunit dahil ang o1 ay na-optimize para sa pangangatwiran at mga mas bagong kakayahan, posibleng mas epektibong pangasiwaan ng mga pag-ulit sa hinaharap ang multilingual na input.

5. Kailan karaniwang magagamit ang o1 para sa mga gumagamit ng libreng antas?

OpenAI ay nakumpirma na ang isang bersyon na tinatawag na "o1-mini" ay ilalabas sa mga free-tier na user, ngunit sa ngayon, walang opisyal na petsa na inihayag para sa pangkalahatang availability.