Pagkatapos ng mga buwan ng haka-haka, OpenAI Ang pinakabagong Strawberry LLM bumaba ang release – at hindi ito tinatawag na GPT -5 .
Nauna nang tinukoy sa mga misteryoso, nakakaintriga na mga codename tulad ng Q* at Strawberry, ang pinakabagong serye ng modelo ay naayos na sa moniker na OpenAI o1 .
Ang pinakamalaking update sa OpenAI Ang bagong modelo ay ang pinahusay nitong mga kasanayan sa pangangatwiran. OpenAI ipinaliwanag na ang o1 ay sinanay na gumugol ng mas maraming oras sa pag-iisip kaysa sa mga nakaraang modelo, na inilalapit ito sa katalinuhan ng tao.
Ano ang OpenAI o1?
OpenAI Ang o1 ay ang pinakabagong serye ng malalaking modelo ng wika na inilabas ni OpenAI noong Setyembre 12, 2024, na kasalukuyang binubuo ng dalawang modelo: o1-preview at ang o1-mini.
Ang pinakamalaking pagkakaiba sa pagitan ng o1 at ng mga nakaraang modelo ng kumpanya ay ang advanced na pangangatwiran nito. Bagama't hindi pa ito inilabas nang buo, ang preview at mga mini na modelo ay pumutok na GPT -4o sa labas ng tubig sa mga pagsusulit ng matematika, agham, at coding.
OpenAI o1 mga modelo
Kasama sa release noong Setyembre ang dalawang modelo, ang o1-preview at ang o1-mini. Sila ang una sa isang serye ng mga modelo na patuloy na ipapalabas bilang OpenAI pinipino ang kanilang bago LLM .
Ang pagkakaiba? Ang o1-mini na modelo ay mas maliit at 80% na mas mura kaysa sa preview na modelo. Ito ay binuo para sa mga gawain na nangangailangan ng advanced na pangangatwiran, ngunit hindi mas malawak na kaalaman. Ito ay ganap na angkop para sa mga gawaing may kinalaman sa coding o matematika.
Gaano katalino OpenAI o1?
OpenAI ay nagpahayag ng isang listahan ng mga benchmark ng STEM na nagpapakita ng mga kakayahan ng pangangatuwiran ng o1, kabilang ang:
- Isang katulad na pagganap sa mga mag-aaral ng PhD sa mga benchmark na pagsusulit sa pisika, kimika, at biology.
- Paglalagay sa nangungunang 500 mag-aaral sa US qualifier para sa USA Math Olympiad.
- Pagraranggo sa 89th percentile sa Codeforces, isang mapagkumpitensyang pagsubok sa coding.
Maaari kang magbasa nang higit pa tungkol sa mga kakayahan ng pangangatwiran ng o1 sa OpenAI paglabas ng pananaliksik .
Ano ang chain of thought reasoning?
Ang mga modelo ng o1 ay gumagamit ng chain of thought reasoning , isang mas mahaba at mas masusing paraan ng paghiwa-hiwalay ng mga kahilingan.
Kung bibigyan ng prompt ang modelong o1, hindi ito sasagot kaagad - kaya ang mahabang oras ng paghihintay. Sa halip, ito ay mangatuwiran sa bawat isa sa mga hakbang, maingat na isinasaalang-alang ang bawat piraso ng impormasyon at ang mga implikasyon nito bago magpasya sa susunod na hakbang ng aksyon. Hindi ito magbibigay ng sagot hangga't hindi nito naiisip ang buong serye ng mga hakbang na kinakailangan sa tanong.
Paano naiiba ang o1 sa GPT -4o?
1) Mga kakayahan sa pangangatwiran
Sa gitna ng pangkalahatang katalinuhan nito ay ang bagong kakayahan ng o1 na mangatuwiran. "Siguro ang pinakamahalagang bahagi ng pag-unlad ay nasa paligid ng kakayahan sa pangangatwiran," ibinahagi ni Altman kay Gates. “Sa ngayon, GPT -4 ay maaaring mangatuwiran sa mga limitadong paraan lamang."
Ang pangangatwiran ay kilala na mahirap. Kahit para sa mga tao. At OpenAI Ang o1 ang unang modelo na nag-claim nito.
Nagagawa ng mga modelong o1 na mangatuwiran sa real time, sa halip na umasa sa data ng pre-training. Ito ang dahilan kung bakit ang bagong modelo ay mas mahusay sa mga gawain sa agham, matematika, at coding kaysa dati OpenAI mga modelo.
2) Mas mahirap i-jailbreak
Sa pagtaas ng mga alalahanin sa kaligtasan bilang LLMs lumago sa katanyagan at kapangyarihan, ang seguridad ay naging pangunahing pokus ng OpenAI ang pinakabagong pag-unlad. Nakipagsosyo ang kumpanya sa US at UK AI Safety Institutes habang binubuo ang serye ng o1, gayundin nakipagtulungan sa gobyerno ng Amerika upang maitaguyod ang kanilang angkop na pagsusumikap.
Bilang isang pangunahing hakbang sa pasulong, ang serye ng o1 ay mas mahirap i-jailbreak - i-bypass ang mga hakbang sa kaligtasan - kaysa sa mga nakaraang modelo.
Sa isa sa kanilang pinakamahirap na pagsubok sa pag-jailbreak, ang modelo ng o1-preview ay nakakuha ng 84 sa 100, kumpara sa isang malungkot na 22 na marka mula sa GPT -4o.
3) Bagong kombensiyon ng pagbibigay ng pangalan
Habang ang pangalan nito ay hindi ang pinaka kapana-panabik na bagay tungkol sa bago OpenAI LLM , isa itong sadyang makabuluhang pagbabago.
OpenAI Ang o1 ay ang unang modelo na nag-alis ng ' GPT ' moniker, at iyon ay dahil inaangkin ng kumpanya na ito ang unang yugto ng isang bagong 'paradigma ng pangangatwiran', samantalang ang mga mas lumang modelo ay bahagi ng isang 'paradigm bago ang pagsasanay'.
Ang bagong modelo ay gumugugol ng oras sa pangangatuwiran sa real time, sa halip na umasa sa data nito bago ang pagsasanay.
4) Mas mahusay sa mga gawain sa paglutas ng problema ng STEM
Sa mas mahusay na pangangatwiran ay may mas mahusay na mga kasanayan sa matematika.
Parehong o1 at GPT -4o ay hiniling na kumpletuhin ang isang kwalipikadong pagsusulit para sa International Mathematics Olympiad. GPT -4o nalutas ang 13% ng mga problema, habang ang o1 ay nalutas ang 83%.
5) Mas mahabang oras ng paghihintay
Ang pangangatwiran sa real time ay tumatagal ng mas matagal kaysa sa pagtukoy sa data ng pagsasanay at pagbuo ng tugon. Kung magtatanong ka sa OpenAI o1-preview kumpara sa ibang mga modelo, mas matagal kang maghihintay.
Gayunpaman, sa kakayahang mag-outsource ng pangangatwiran, ito ay isang maliit na presyo na babayaran. Ang bilis ng mga modelo ng o1 ay malamang na mapabuti habang ang mga susunod na modelo sa serye ay inilabas.
Sino ang maaaring gumamit ng o1?
Mula noong Setyembre 12, ChatGPT Plus at ang mga user ng Team ay naa-access ang mga o1 na modelo sa ChatGPT .
OpenAI inihayag na gagawin nilang available ang o1-mini sa mga libreng user, bagama't walang natukoy na petsa.
Ang kasalukuyang lingguhang mga limitasyon sa rate ay 30 mensahe para sa 01-preview at 50 para sa o1-mini, bagama't malapit nang tumaas ang mga ito.
Para saan ko dapat gamitin ang o1?
Ang pinahusay na mga kakayahan sa pangangatwiran ng o1 ay partikular na kapaki-pakinabang para sa paglutas ng mga kumplikadong problema sa matematika, agham, at coding. Bilang OpenAI nagpapaliwanag :
Mga limitasyon ng OpenAI o1
Bilang isang preview, ang modelong ito ay wala pang lahat ng kakayahan ng GPT -4o. Kung nais mong gumamit ng isang LLM upang mag-browse sa web para sa impormasyon, o gusto mong mag-upload ng mga file o larawan, kailangan mong manatili GPT -4o hanggang sa paglabas ng mga modelo ng o1.
Paano mag-prompt OpenAI o1
OpenAI Nagbago ang mga iminumungkahing mungkahi ni o1 kumpara sa kanilang mga nakaraang modelo, dahil sa pinahusay na pangangatwiran nito.
Panatilihing simple ang iyong mga prompt. Ito ay isang matalinong modelo, at hindi nangangailangan ng maraming patnubay gaya ng GPT -4 na serye. Nangangahulugan iyon na iwasan ang anumang chain of thought input – ang modelo ay nasa loob na ng pangangatuwiran.
Bumuo GPT -powered AI agent
Paano kung awtomatikong mag-synchronize ang iyong AI agent sa bawat OpenAI update?
Botpress ay isang ganap na bukas at napapalawak na platform ng ahente ng AI. Ang aming stack nagbibigay-daan sa mga developer na bumuo ng mga chatbot at mga ahente ng AI na may anumang mga kakayahan, sa anumang daloy ng trabaho.
Ang tanging platform na mula sa mababang code set-up hanggang sa walang katapusang pagpapasadya at pagpapalawig, Botpress nagbibigay-daan sa iyong awtomatikong makuha ang kapangyarihan ng pinakabago GPT bersyon sa iyong chatbot – walang kinakailangang pagsisikap.
Simulan ang pagtatayo ngayon. Ito'y LIBRE.
Talaan ng mga Nilalaman
Manatiling napapanahon sa pinakabago sa mga ahente ng AI
Ibahagi ito sa: