- Ang OpenAI o1 ay bagong serye ng modelo (nagsisimula sa o1-preview at o1-mini) na nakatuon sa real-time na pangangatwiran, hindi lang basta pre-training.
- Mas magaling ang o1 kaysa GPT-4o sa mga STEM na gawain, nakakuha ng 83% sa IMO qualifiers kumpara sa 13% ng GPT-4o, at nasa ika-89 na porsyento sa Codeforces.
- Gumagamit ang o1 ng chain-of-thought reasoning nang natural, kaya mas mabagal ngunit mas tumpak sa mahihirap na gawain.
- Mas mahirap i-jailbreak ang o1, nakakuha ng 84/100 sa adversarial safety tests kumpara sa 22 ng GPT-4o.
Matapos ang buwan ng hula-hula mula sa mga tagahanga ng ChatGPT, inilabas na ng OpenAI ang pinakabagong Strawberry LLM – at hindi ito tinawag na GPT-5.
Dati itong tinutukoy sa mga misteryoso at nakakaintrigang codename gaya ng Q* at Strawberry, ngunit ngayon ay opisyal nang tinawag na OpenAI o1.
Ang pinakamalaking pagbabago sa bagong modelo ng OpenAI ay ang pinahusay nitong kakayahan sa pangangatwiran. Ipinaliwanag ng OpenAI na sinanay ang o1 na maglaan ng mas maraming oras sa pag-iisip kaysa sa mga naunang modelo, kaya mas malapit ito sa katalinuhan ng tao.
Ano ang OpenAI o1?
Ang OpenAI o1 ay ang pinakabagong serye ng malalaking language model na inilabas ng OpenAI noong Setyembre 12, 2024, na binubuo ngayon ng dalawang modelo: o1-preview at o1-mini.
Ang pinakamalaking kaibahan ng o1 sa mga naunang modelo ng kumpanya ay ang mas mataas nitong antas ng pangangatwiran. Bagamat hindi pa ito ganap na inilalabas, ang preview at mini na mga modelo ay mas mahusay na kaysa GPT-4o sa mga pagsusulit sa matematika, agham, at pagko-code.
Mga modelo ng OpenAI o1
Kasama sa Setyembre na release ang dalawang modelo, ang o1-preview at o1-mini. Sila ang unang batch ng serye ng mga modelong patuloy pang ilalabas habang pinapahusay ng OpenAI ang kanilang bagong LLM.
Ang kaibahan? Ang o1-mini na modelo ay mas maliit at 80% mas mura kaysa sa preview model. Ginawa ito para sa mga gawain na nangangailangan ng mas mataas na antas ng pangangatwiran, ngunit hindi ng mas malawak na kaalaman. Tamang-tama ito para sa mga gawain sa pagko-code o matematika.
Gaano katalino ang OpenAI o1?
Ipinagmamalaki ng OpenAI ang listahan ng mga STEM benchmark na nagpapakita ng kakayahan ng o1 sa pangangatwiran, kabilang ang:
- Katulad ng performance ng mga PhD student sa mga benchmark test sa pisika, kemistri, at biyolohiya.
- Napabilang sa top 500 na estudyante sa US qualifier para sa USA Math Olympiad.
- Nasa ika-89 na porsyento sa Codeforces, isang kompetisyon sa pagko-code.
Maaari mong basahin pa ang tungkol sa kakayahan ng o1 sa pangangatwiran sa research release ng OpenAI.
Ano ang chain of thought reasoning?
Gumagamit ang mga o1 model ng chain of thought reasoning, isang mas mahaba at mas masusing paraan ng paghimay ng mga kahilingan.
Kapag binigyan ng prompt ang o1 model, hindi ito agad sasagot – kaya mahaba ang paghihintay. Sa halip, dadaanan nito ang bawat hakbang, maingat na pinag-iisipan ang bawat detalye at epekto bago magpasya sa susunod na gagawin. Hindi ito magbibigay ng sagot hangga't hindi natatapos ang buong proseso ng pag-iisip na kailangan sa tanong.
Paano naiiba ang o1 sa GPT-4o?
1) Kakayahan sa pangangatwiran
Sa sentro ng katalinuhan nito ay ang bagong kakayahan ng o1 sa pangangatwiran. “Marahil ang pinakamahalagang pag-unlad ay sa kakayahan sa pangangatwiran,” ani Altman kay Gates. “Sa ngayon, ang GPT-4 ay limitado lang ang kakayahan sa pangangatwiran.”
Mahirap talaga ang pangangatwiran – kahit para sa tao. At ang OpenAI o1 ang unang modelong nagsabing kaya nito ito.
Kaya ng mga o1 model na mag-isip nang real time, hindi lang umaasa sa pre-training data. Kaya mas mahusay ang bagong modelong ito sa agham, matematika, at pagko-code kaysa sa mga naunang modelo ng OpenAI.
2) Mas mahirap i-jailbreak
Dahil sa tumataas na alalahanin sa kaligtasan habang sumisikat at lumalakas ang mga LLM, naging pokus ng OpenAI ang seguridad sa pinakabagong development. Nakipagtulungan ang kumpanya sa U.S. at U.K. AI Safety Institutes habang ginagawa ang o1 series, at nakipag-ugnayan din sa gobyerno ng Amerika para tiyakin ang kanilang due diligence.
Bilang malaking hakbang, mas mahirap nang i-jailbreak – o lampasan ang mga safety measure – ang o1 series kaysa sa mga naunang modelo.
Sa isa sa pinakamahirap nilang jailbreak test, nakakuha ang o1-preview ng 84 sa 100, kumpara sa mababang 22 ng GPT-4o.
3) Bagong paraan ng pagbibigay ng pangalan
Bagamat hindi kapana-panabik ang pangalan ng bagong OpenAI LLM, sinadya itong baguhin upang magdala ng mahalagang pagbabago.
Ang OpenAI o1 ang unang modelong hindi na gumagamit ng 'GPT' na pangalan, dahil ayon sa kumpanya, ito ang unang yugto ng bagong 'reasoning paradigm', samantalang ang mga lumang modelo ay bahagi ng 'pre-training paradigm'.
Ang bagong modelo ay naglalaan ng oras sa pangangatwiran nang real time, sa halip na umasa lamang sa pre-training data.
4) Mas mahusay sa paglutas ng mga problema sa STEM
Dahil sa mas mahusay na pangangatwiran, mas gumaling din ito sa matematika.
Parehong pinasagot ang o1 at GPT-4o sa qualifying exam ng International Mathematics Olympiad. 13% lang ng mga problema ang nasolusyunan ng GPT-4o, habang 83% naman ang nasagot ng o1.
5) Mas mahaba ang paghihintay
Mas matagal ang real-time na pangangatwiran kaysa pag-refer lang sa training data at paggawa ng sagot. Kung magtatanong ka sa OpenAI o1-preview kumpara sa ibang modelo, mas mahaba ang iyong hihintayin.
Gayunpaman, dahil kaya nitong mag-outsource ng pangangatwiran, maliit na bagay lang ang dagdag na paghihintay. Malamang ay bibilis pa ang mga o1 model habang lumalabas ang mga susunod na bersyon.
Sino ang maaaring gumamit ng o1?
Simula Setyembre 12, maaaring gamitin ng ChatGPT Plus at Team users ang o1 models sa ChatGPT.
Inanunsyo ng OpenAI na gagawing available ang o1-mini sa mga libreng user, ngunit wala pang tiyak na petsa.
Sa ngayon, ang lingguhang limitasyon ay 30 mensahe para sa o1-preview at 50 para sa o1-mini, ngunit madaragdagan pa ito.
Para saan dapat gamitin ang o1?
Ang pinahusay na kakayahan ng o1 sa pangangatwiran ay lalo pang kapaki-pakinabang sa paglutas ng mga komplikadong problema sa matematika, agham, at pagko-code. Gaya ng paliwanag ng OpenAI sa :
Mga limitasyon ng OpenAI o1
Bilang preview, wala pa sa modelong ito ang lahat ng kakayahan ng GPT-4o. Kung gusto mong gumamit ng LLM para mag-browse ng web o mag-upload ng file o larawan, manatili muna sa GPT-4o hanggang lumabas ang mga susunod na bersyon ng o1.
Paano mag-prompt sa OpenAI o1
Nagbago ang mga mungkahi ng OpenAI sa pag-prompt para sa o1 kumpara sa mga naunang modelo, dahil sa pinahusay nitong pangangatwiran.
Panatilihing simple ang iyong prompt. Matalino na ang modelong ito at hindi na kailangan ng maraming gabay gaya ng GPT-4 series. Iwasan ang chain of thought input – nagaganap na ang pangangatwiran sa loob ng modelo.
Bumuo ng AI agent na pinapagana ng GPT
Paano kung awtomatikong sumasabay ang iyong AI agent sa bawat update ng OpenAI?
Ang Botpress ay isang ganap na bukas at napapalawak na plataporma ng AI agent. Pinapayagan ng aming stack ang mga developer na bumuo ng mga chatbot at AI agent na may anumang kakayahan, sa anumang workflow.
Ang tanging plataporma na sumasaklaw mula low code set-up hanggang walang katapusang kakayahan sa pag-customize at pagpapalawak, nagbibigay-daan ang Botpress na awtomatikong makuha ang pinakabagong bersyon ng GPT sa iyong chatbot – walang kahirap-hirap.
Simulan ang paggawa ngayon. Libre ito.
FAQs
1. Ano ang ibig sabihin ng “o1”? May lohika ba sa pagpapangalan ng mga susunod na modelo (hal., o2, o3)?
Malamang na ang “o1” ay nangangahulugang “OpenAI 1,” hudyat ng simula ng bagong pamilya ng mga modelo. Base rito, makatuwirang asahan na ang mga susunod ay tatawaging “o2,” “o3,” atbp.
2. Bakit tinalikuran ng OpenAI ang sistemang “GPT” sa pagbibigay ng pangalan?
Lumipat ang OpenAI mula sa “GPT” na pangalan patungong “o1” upang ipakita ang pagbabago ng pokus – mula sa pangkalahatang pre-trained language models tungo sa mga modelong optimized para sa real-time na pangangatwiran at interactive na kakayahan.
3. Ang OpenAI o1 ba ang kapalit ng GPT-4 o isang bagong linya ng produkto?
Ang OpenAI o1 ay hindi direktang kapalit ng GPT-4 kundi simula ng bagong linya ng produkto na nakatuon sa real-time na pangangatwiran at episyensya, bagamat nakabatay ito sa mga nagawa ng GPT-4 at GPT-4o.
4. Mas mahusay bang tumanggap ng multi-language input ang o1 kaysa GPT-4?
Hindi pa pormal na inihayag ng OpenAI kung paano ikinukumpara ang o1 sa GPT-4 sa pagganap sa maraming wika, ngunit dahil optimized ang o1 para sa pangangatwiran at mas bagong kakayahan, posible na mas mahusay pa itong makakatanggap ng multi-language input sa mga susunod na bersyon.
5. Kailan magiging bukas sa mga libreng gumagamit ang o1?
Kinumpirma ng OpenAI na maglalabas sila ng bersyong tinatawag na “o1-mini” para sa mga libreng gumagamit, ngunit sa ngayon, wala pang opisyal na petsa ng paglulunsad para sa lahat.







