- OpenAI o1 adalah seri model baru (dimulai dengan o1-preview dan o1-mini) yang berfokus pada penalaran waktu nyata, bukan sekadar pra-pelatihan.
- o1 mengungguli GPT-4o dalam tugas STEM, meraih skor 83% pada kualifikasi IMO dibandingkan 13% milik GPT-4o, dan berada di persentil ke-89 di Codeforces.
- o1 secara bawaan menggunakan penalaran berantai, sehingga lebih lambat namun jauh lebih akurat untuk tugas-tugas kompleks.
- o1 jauh lebih sulit untuk dijailbreak, dengan skor 84/100 pada uji keamanan adversarial dibandingkan 22 milik GPT-4o.
Setelah berbulan-bulan spekulasi dari para penggemar ChatGPT, rilis LLM Strawberry terbaru dari OpenAI akhirnya hadir – dan namanya bukan GPT-5.
Sebelumnya dikenal dengan nama kode misterius seperti Q* dan Strawberry, seri model terbaru ini akhirnya resmi dinamai OpenAI o1.
Pembaruan terbesar pada model baru OpenAI ini adalah kemampuan penalarannya yang lebih baik. OpenAI menjelaskan bahwa o1 dilatih untuk meluangkan lebih banyak waktu berpikir dibandingkan model sebelumnya, sehingga lebih mendekati kecerdasan manusia.
Apa itu OpenAI o1?
OpenAI o1 adalah seri terbaru dari model bahasa besar yang dirilis OpenAI pada 12 September 2024, yang saat ini terdiri dari dua model: o1-preview dan o1-mini.
Perbedaan utama antara o1 dan model-model sebelumnya adalah penalarannya yang lebih canggih. Meski belum dirilis secara penuh, model preview dan mini sudah jauh mengungguli GPT-4o dalam tes matematika, sains, dan pemrograman.
Model-model OpenAI o1
Rilis bulan September mencakup dua model, o1-preview dan o1-mini. Keduanya adalah awal dari rangkaian model yang akan terus dikembangkan seiring OpenAI menyempurnakan LLM barunya.
Bedanya? Model o1-mini lebih kecil dan 80% lebih murah dibandingkan model preview. Model ini dirancang untuk tugas yang membutuhkan penalaran tingkat lanjut, namun tidak memerlukan pengetahuan luas. Sangat cocok untuk tugas yang melibatkan pemrograman atau matematika.
Seberapa pintar OpenAI o1?
OpenAI menampilkan sejumlah tolok ukur STEM yang menunjukkan kemampuan penalaran o1, di antaranya:
- Performa setara mahasiswa PhD dalam tes benchmark fisika, kimia, dan biologi.
- Masuk dalam 500 besar peserta kualifikasi Olimpiade Matematika Amerika Serikat.
- Berada di persentil ke-89 dalam Codeforces, tes pemrograman kompetitif.
Anda dapat membaca lebih lanjut tentang kemampuan penalaran o1 di rilis riset OpenAI.
Apa itu penalaran rantai pemikiran?
Model o1 menggunakan penalaran berantai, yaitu cara memecah permintaan secara lebih panjang dan mendalam.
Jika model o1 menerima prompt, ia tidak akan langsung menjawab – itulah sebabnya waktu tunggunya lama. Model ini akan menalar setiap langkah, mempertimbangkan setiap informasi dan implikasinya sebelum menentukan langkah berikutnya. Jawaban baru diberikan setelah seluruh rangkaian langkah dalam permintaan dipikirkan matang-matang.
Apa perbedaan o1 dengan GPT-4o?
1) Kemampuan penalaran
Inti dari kecerdasan umumnya adalah kemampuan penalaran baru pada o1. “Mungkin kemajuan terpenting akan ada pada kemampuan penalaran,” kata Altman kepada Gates. “Saat ini, GPT-4 hanya bisa menalar dengan cara yang sangat terbatas.”
Penalaran memang sangat sulit. Bahkan bagi manusia. Dan OpenAI o1 adalah model pertama yang mengklaim mampu melakukannya.
Model o1 mampu menalar secara waktu nyata, bukan hanya mengandalkan data pra-pelatihan. Inilah sebabnya model baru ini lebih baik dalam tugas sains, matematika, dan pemrograman dibandingkan model OpenAI sebelumnya.
2) Lebih sulit dijailbreak
Dengan meningkatnya kekhawatiran soal keamanan seiring popularitas dan kekuatan LLM yang terus bertambah, keamanan menjadi fokus utama dalam pengembangan terbaru OpenAI. Perusahaan ini bekerja sama dengan AI Safety Institutes di AS dan Inggris selama pengembangan seri o1, serta bekerja sama dengan pemerintah Amerika untuk memastikan uji kelayakan mereka.
Sebagai langkah besar, seri o1 jauh lebih sulit untuk dijailbreak – melewati pengamanan – dibandingkan model sebelumnya.
Dalam salah satu uji jailbreak tersulit mereka, model o1-preview meraih skor 84 dari 100, dibandingkan skor 22 yang buruk dari GPT-4o.
3) Konvensi penamaan baru
Meskipun namanya bukan hal paling menarik dari LLM baru OpenAI, ini adalah perubahan yang disengaja dan bermakna.
OpenAI o1 adalah model pertama yang meninggalkan nama 'GPT', karena perusahaan mengklaim ini adalah fase awal dari 'paradigma penalaran' baru, sedangkan model lama termasuk dalam 'paradigma pra-pelatihan'.
Model baru ini meluangkan waktu untuk menalar secara waktu nyata, bukan hanya mengandalkan data pra-pelatihan.
4) Lebih baik dalam tugas pemecahan masalah STEM
Dengan penalaran yang lebih baik, kemampuan matematika juga meningkat.
Baik o1 maupun GPT-4o diminta menyelesaikan ujian kualifikasi Olimpiade Matematika Internasional. GPT-4o menyelesaikan 13% soal, sedangkan o1 menyelesaikan 83%.
5) Waktu tunggu lebih lama
Penalaran secara waktu nyata membutuhkan waktu lebih lama dibandingkan hanya mengambil data pelatihan dan menghasilkan jawaban. Jika Anda mengajukan pertanyaan ke OpenAI o1-preview dibandingkan model lain, Anda akan menunggu lebih lama.
Namun, dengan kemampuan untuk menyerahkan proses penalaran, waktu tunggu ini adalah harga kecil yang harus dibayar. Kecepatan model o1 kemungkinan akan meningkat seiring rilis model-model berikutnya.
Siapa yang bisa menggunakan o1?
Mulai 12 September, pengguna ChatGPT Plus dan Team dapat mengakses model o1 di ChatGPT.
OpenAI mengumumkan bahwa o1-mini akan tersedia untuk pengguna gratis, meski belum ada tanggal pastinya.
Batas mingguan saat ini adalah 30 pesan untuk o1-preview dan 50 untuk o1-mini, namun akan segera dinaikkan.
Untuk apa sebaiknya saya menggunakan o1?
Kemampuan penalaran o1 yang lebih baik sangat berguna untuk memecahkan masalah kompleks di bidang matematika, sains, dan pemrograman. Seperti yang dijelaskan oleh OpenAI:
Keterbatasan OpenAI o1
Sebagai model preview, model ini belum memiliki semua kemampuan GPT-4o. Jika Anda ingin menggunakan LLM untuk menjelajah web atau mengunggah file atau gambar, Anda masih perlu menggunakan GPT-4o hingga model o1 berikutnya dirilis.
Cara membuat prompt untuk OpenAI o1
Saran pembuatan prompt dari OpenAI telah berubah untuk o1 dibandingkan model sebelumnya, karena penalarannya yang lebih baik.
Buat prompt Anda sesederhana mungkin. Model ini sudah cerdas, dan tidak memerlukan banyak arahan seperti seri GPT-4. Artinya, hindari masukan penalaran berantai – model ini sudah menalar secara internal.
Bangun agen AI berbasis GPT
Bagaimana jika agen AI Anda otomatis selalu mengikuti setiap pembaruan OpenAI?
Botpress adalah platform agen AI yang sepenuhnya terbuka dan dapat diperluas. Stack kami memungkinkan pengembang membangun chatbot dan agen AI dengan kemampuan apa pun, untuk alur kerja apa pun.
Satu-satunya platform yang menawarkan pengaturan low code hingga kustomisasi dan perluasan tanpa batas, Botpress memungkinkan Anda otomatis mendapatkan kekuatan GPT versi terbaru di chatbot Anda – tanpa usaha tambahan.
Mulai membangun hari ini. Gratis.
FAQ
1. Apa arti “o1”? Apakah ada logika penamaan untuk model berikutnya (misal, o2, o3)?
Nama “o1” kemungkinan besar merupakan singkatan dari “OpenAI 1”, yang menandakan dimulainya keluarga model baru. Berdasarkan hal ini, masuk akal untuk mengharapkan penamaan berurutan seperti “o2”, “o3”, dan seterusnya untuk versi-versi berikutnya dalam seri ini.
2. Mengapa OpenAI meninggalkan konvensi penamaan “GPT”?
OpenAI beralih dari konvensi penamaan “GPT” ke “o1” untuk menandai perubahan fokus – dari model bahasa pra-latih umum ke model yang dioptimalkan untuk penalaran waktu nyata dan kemampuan interaktif.
3. Apakah OpenAI o1 penerus GPT-4 atau lini produk baru sepenuhnya?
OpenAI o1 bukan penerus langsung GPT-4, melainkan awal dari lini produk baru yang dirancang untuk penalaran waktu nyata dan efisiensi, meskipun tetap membangun kemajuan dari GPT-4 dan GPT-4o.
4. Apakah o1 lebih baik menangani input multibahasa dibandingkan GPT-4?
OpenAI belum secara resmi menyatakan bagaimana o1 dibandingkan GPT-4 dalam performa multibahasa, namun karena o1 dioptimalkan untuk penalaran dan kemampuan baru, kemungkinan versi berikutnya akan lebih efektif menangani input multibahasa.
5. Kapan o1 akan tersedia secara umum untuk pengguna gratis?
OpenAI telah mengonfirmasi bahwa versi bernama “o1-mini” akan dirilis untuk pengguna tingkat gratis, namun hingga saat ini belum ada tanggal resmi yang diumumkan untuk ketersediaan umumnya.





.webp)
