- OpenAI o1 ialah siri model baharu (bermula dengan o1-preview dan o1-mini) yang memberi tumpuan kepada penaakulan masa nyata, bukan sekadar pra-latihan.
- o1 mengatasi GPT-4o dalam tugas STEM, memperoleh 83% dalam kelayakan IMO berbanding 13% untuk GPT-4o, dan berada di persentil ke-89 di Codeforces.
- o1 menggunakan penaakulan berantai secara asli, menjadikannya lebih perlahan tetapi jauh lebih tepat untuk tugas yang kompleks.
- o1 jauh lebih sukar untuk dijailbreak, memperoleh 84/100 dalam ujian keselamatan berlawanan berbanding 22 untuk GPT-4o.
Selepas berbulan-bulan spekulasi daripada peminat ChatGPT, keluaran LLM Strawberry terbaru OpenAI akhirnya tiba – dan ia bukan dinamakan GPT-5.
Sebelum ini dikenali dengan nama kod misteri seperti Q* dan Strawberry, siri model terbaru ini akhirnya menggunakan nama OpenAI o1.
Perubahan terbesar pada model baharu OpenAI ialah kemahiran penaakulannya yang dipertingkatkan. OpenAI menjelaskan bahawa o1 telah dilatih untuk meluangkan lebih banyak masa berfikir berbanding model sebelumnya, menjadikannya lebih hampir kepada kecerdasan manusia.
Apakah itu OpenAI o1?
OpenAI o1 ialah siri model bahasa besar terkini yang dikeluarkan oleh OpenAI pada 12 September 2024, kini terdiri daripada dua model: o1-preview dan o1-mini.
Perbezaan utama antara o1 dan model terdahulu syarikat ini ialah penaakulan lanjutan. Walaupun belum dikeluarkan sepenuhnya, model preview dan mini sudah jauh mengatasi GPT-4o dalam ujian matematik, sains, dan pengekodan.
Model-model OpenAI o1
Keluaran September termasuk dua model, iaitu o1-preview dan o1-mini. Ini adalah model pertama dalam siri yang akan terus dikeluarkan apabila OpenAI memperhalusi LLM baharu mereka.
Perbezaannya? Model o1-mini lebih kecil dan 80% lebih murah daripada model preview. Ia dibina untuk tugas yang memerlukan penaakulan lanjutan, tetapi bukan pengetahuan yang luas. Ia sangat sesuai untuk tugas yang melibatkan pengekodan atau matematik.
Seberapa pintar OpenAI o1?
OpenAI telah memaparkan beberapa penanda aras STEM yang menunjukkan keupayaan penaakulan o1, termasuk:
- Prestasi setara dengan pelajar PhD dalam ujian penanda aras fizik, kimia, dan biologi.
- Berjaya berada dalam 500 pelajar teratas dalam kelayakan US untuk USA Math Olympiad.
- Menduduki persentil ke-89 dalam Codeforces, ujian pengekodan kompetitif.
Anda boleh membaca lebih lanjut tentang keupayaan penaakulan o1 dalam siaran penyelidikan OpenAI.
Apakah maksud penalaran rantai pemikiran?
Model o1 menggunakan penaakulan berantai, iaitu cara yang lebih panjang dan teliti untuk menguraikan permintaan.
Jika model o1 diberi arahan, ia tidak akan menjawab serta-merta – sebab itu masa menunggu lebih lama. Sebaliknya, ia akan meneliti setiap langkah, mempertimbangkan setiap maklumat dan implikasinya sebelum menentukan tindakan seterusnya. Ia tidak akan memberikan jawapan sehingga selesai meneliti keseluruhan siri langkah yang diperlukan.
Bagaimana o1 berbeza daripada GPT-4o?
1) Keupayaan penaakulan
Di tengah-tengah kecerdasan amnya ialah keupayaan penaakulan baharu o1. “Mungkin kemajuan paling penting adalah dalam keupayaan penaakulan,” kata Altman kepada Gates. “Sekarang ini, GPT-4 hanya boleh membuat penaakulan dalam cara yang sangat terhad.”
Penaakulan memang sukar. Malah untuk manusia. Dan OpenAI o1 ialah model pertama yang mendakwa memilikinya.
Model o1 mampu membuat penaakulan secara masa nyata, bukan hanya bergantung pada data pra-latihan. Sebab itulah model baharu ini lebih baik dalam tugas sains, matematik, dan pengekodan berbanding model OpenAI sebelumnya.
2) Lebih sukar untuk dijailbreak
Dengan kebimbangan keselamatan yang semakin meningkat apabila LLM semakin popular dan berkuasa, keselamatan menjadi tumpuan utama pembangunan terbaru OpenAI. Syarikat ini bekerjasama dengan Institut Keselamatan AI AS dan UK semasa membangunkan siri o1, serta bekerjasama dengan kerajaan Amerika untuk memastikan ketekunan wajar mereka.
Sebagai satu langkah besar ke hadapan, siri o1 jauh lebih sukar untuk dijailbreak – iaitu memintas langkah keselamatan – berbanding model sebelumnya.
Dalam salah satu ujian jailbreak paling sukar mereka, model o1-preview memperoleh 84 daripada 100, berbanding hanya 22 untuk GPT-4o.
3) Konvensyen penamaan baharu
Walaupun namanya bukanlah perkara paling menarik tentang LLM OpenAI baharu ini, ia adalah perubahan yang disengajakan dan bermakna.
OpenAI o1 ialah model pertama yang meninggalkan nama 'GPT', kerana syarikat menyatakan ini adalah fasa pertama 'paradigma penaakulan' baharu, manakala model lama adalah sebahagian daripada 'paradigma pra-latihan'.
Model baharu ini meluangkan masa untuk membuat penaakulan secara masa nyata, bukan hanya bergantung pada data pra-latihan.
4) Lebih baik dalam menyelesaikan masalah STEM
Dengan penaakulan yang lebih baik, kemahiran matematik juga meningkat.
Kedua-dua o1 dan GPT-4o diminta menyelesaikan peperiksaan kelayakan untuk International Mathematics Olympiad. GPT-4o menyelesaikan 13% soalan, manakala o1 menyelesaikan 83%.
5) Masa menunggu lebih lama
Penaakulan masa nyata mengambil masa lebih lama berbanding merujuk data latihan dan menjana jawapan. Jika anda bertanya soalan kepada OpenAI o1-preview berbanding model lain, anda akan menunggu lebih lama.
Namun, dengan keupayaan untuk menyerahkan penaakulan, ia adalah harga kecil yang perlu dibayar. Kelajuan model o1 dijangka akan bertambah baik apabila model seterusnya dalam siri ini dikeluarkan.
Siapa yang boleh menggunakan o1?
Mulai 12 September, pengguna ChatGPT Plus dan Team boleh mengakses model o1 dalam ChatGPT.
OpenAI mengumumkan bahawa mereka akan menyediakan o1-mini kepada pengguna percuma, walaupun tiada tarikh ditetapkan lagi.
Had mingguan semasa ialah 30 mesej untuk 01-preview dan 50 untuk o1-mini, namun ia akan dinaikkan tidak lama lagi.
Untuk apa saya patut guna o1?
Keupayaan penaakulan o1 yang dipertingkatkan sangat berguna untuk menyelesaikan masalah kompleks dalam matematik, sains, dan pengekodan. Seperti yang dijelaskan oleh OpenAI:
Had OpenAI o1
Sebagai model preview, model ini belum mempunyai semua keupayaan GPT-4o. Jika anda ingin menggunakan LLM untuk melayari web mencari maklumat, atau anda mahu memuat naik fail atau imej, anda perlu terus menggunakan GPT-4o sehingga model o1 yang seterusnya dikeluarkan.
Cara memberi arahan kepada OpenAI o1
Cadangan pemberian arahan OpenAI telah berubah untuk o1 berbanding model sebelumnya, kerana penaakulan yang dipertingkatkan.
Pastikan arahan anda ringkas. Ia adalah model yang bijak, dan tidak memerlukan banyak panduan seperti siri GPT-4. Ini bermakna elakkan input berantai – model ini sudah membuat penaakulan secara dalaman.
Bina ejen AI berkuasa GPT
Bagaimana jika ejen AI anda sentiasa diselaraskan dengan setiap kemas kini OpenAI?
Botpress ialah platform ejen AI yang sepenuhnya terbuka dan boleh diperluas. Stak kami membolehkan pembangun membina chatbot dan ejen AI dengan sebarang keupayaan, merentasi apa-apa aliran kerja.
Satu-satunya platform yang merangkumi tetapan kod rendah hingga penyesuaian dan peluasan tanpa had, Botpress membolehkan anda secara automatik mendapat kuasa versi GPT terkini pada chatbot anda – tanpa usaha tambahan.
Mula membina hari ini. Ia percuma.
Soalan Lazim
1. Apa maksud “o1”? Adakah terdapat logik penamaan untuk model akan datang (cth, o2, o3)?
Nama “o1” kemungkinan besar bermaksud “OpenAI 1,” menandakan permulaan keluarga model baharu. Berdasarkan ini, adalah munasabah untuk menjangkakan penamaan berurutan seperti “o2,” “o3,” dan seterusnya untuk versi akan datang dalam siri ini.
2. Mengapa OpenAI beralih daripada konvensyen penamaan “GPT”?
OpenAI beralih daripada konvensyen penamaan “GPT” kepada “o1” untuk menandakan perubahan fokus – daripada model bahasa pra-latih umum kepada model yang dioptimumkan untuk penaakulan masa nyata dan keupayaan interaktif.
3. Adakah OpenAI o1 pengganti GPT-4 atau barisan produk baharu sepenuhnya?
OpenAI o1 bukan pengganti langsung GPT-4 tetapi merupakan permulaan barisan produk baharu yang direka untuk penaakulan masa nyata dan kecekapan, walaupun ia dibina atas kemajuan yang dicapai dengan GPT-4 dan GPT-4o.
4. Bolehkah o1 mengendalikan input berbilang bahasa dengan lebih baik daripada GPT-4?
OpenAI belum menyatakan secara rasmi bagaimana o1 berbanding GPT-4 dalam prestasi berbilang bahasa, tetapi kerana o1 dioptimumkan untuk penaakulan dan keupayaan baharu, kemungkinan versi akan datang akan mengendalikan input berbilang bahasa dengan lebih baik.
5. Bilakah o1 akan tersedia secara umum untuk pengguna percuma?
OpenAI telah mengesahkan bahawa versi yang dipanggil "o1-mini" akan dikeluarkan untuk pengguna percuma, tetapi setakat ini, tiada tarikh rasmi diumumkan untuk ketersediaan umum.





.webp)
