Setelah berbulan-bulan spekulasi, OpenAI's rilis Strawberry LLM terbaru telah turun - dan tidak disebut GPT-5.
Sebelumnya disebut dengan nama sandi yang samar dan menarik, seperti Q* dan Strawberry, seri model terbaru ini akhirnya menggunakan nama OpenAI o1.
Pembaruan terbesar dari model baru OpenAI adalah kemampuan penalarannya yang telah ditingkatkan. OpenAI menjelaskan bahwa o1 telah dilatih untuk menghabiskan lebih banyak waktu untuk berpikir dibandingkan model sebelumnya, sehingga lebih mendekati kecerdasan manusia.
Apa yang dimaksud dengan OpenAI o1?
OpenAI o1 adalah seri terbaru dari model bahasa besar yang dirilis oleh OpenAI pada tanggal 12 September 2024, yang saat ini terdiri dari dua model: o1-preview dan o1-mini.
Perbedaan terbesar antara o1 dan model-model perusahaan sebelumnya adalah penalarannya yang canggih. Meskipun belum dirilis secara penuh, pratinjau dan model mini sudah mengalahkan GPT-4o dalam tes matematika, sains, dan pengkodean.
OpenAI model o1
Rilis bulan September mencakup dua model, o1-preview dan o1-mini. Kedua model ini merupakan yang pertama dari serangkaian model yang akan terus dirilis seiring dengan OpenAI yang menyempurnakan LLM baru mereka.
Perbedaannya? Model o1-mini lebih kecil dan 80% lebih murah daripada model pratinjau. Dibuat untuk tugas-tugas yang membutuhkan penalaran tingkat lanjut, tetapi bukan pengetahuan yang lebih luas. Ini sangat cocok untuk tugas-tugas yang melibatkan pengkodean atau matematika.
Seberapa pintar OpenAI o1?
OpenAI telah memuji daftar tolok ukur STEM yang memamerkan kemampuan penalaran o1, termasuk:
- Performa yang serupa dengan mahasiswa PhD dalam tes benchmark fisika, kimia, dan biologi.
- Berada di posisi 500 siswa teratas dalam kualifikasi AS untuk Olimpiade Matematika AS.
- Peringkat persentil ke-89 dalam Codeforces, sebuah tes pengkodean yang kompetitif.
Anda dapat membaca lebih lanjut tentang kemampuan penalaran o1 di rilis penelitian OpenAI.
Apa yang dimaksud dengan penalaran berantai?
Model o1 menggunakan penalaran rantai pemikiran, cara yang lebih panjang dan lebih menyeluruh dalam menguraikan permintaan.
Jika model o1 diberi perintah, model ini tidak akan langsung menjawab - oleh karena itu, akan membutuhkan waktu yang lama. Sebaliknya, model ini akan memikirkan setiap langkah, dengan hati-hati mempertimbangkan setiap informasi dan implikasinya sebelum memutuskan tindakan selanjutnya. Ia tidak akan memberikan jawaban sampai ia telah memikirkan seluruh rangkaian langkah yang diperlukan dalam pertanyaan.
Apa perbedaan o1 dengan GPT-4o?
1) Kemampuan penalaran
Pusat dari kecerdasan umumnya adalah kemampuan baru o1 untuk bernalar. "Mungkin bidang kemajuan yang paling penting adalah kemampuan penalaran," kata Altman kepada Gates. "Saat ini, GPT-4 hanya dapat bernalar dengan cara yang sangat terbatas."
Penalaran terkenal sangat sulit. Bahkan untuk manusia. Dan OpenAI o1 adalah model pertama yang mengklaim hal itu.
Model o1 mampu menalar secara real time, bukan mengandalkan data pra-pelatihan. Inilah sebabnya mengapa model baru ini lebih baik dalam tugas-tugas sains, matematika, dan pengkodean daripada model OpenAI sebelumnya.
2) Lebih sulit untuk melakukan jailbreak
Dengan meningkatnya masalah keamanan seiring dengan meningkatnya popularitas dan kekuatan LLMs , keamanan telah menjadi fokus utama pengembangan terbaru OpenAI. Perusahaan ini bermitra dengan AI Safety Institutes AS dan Inggris saat mengembangkan seri o1, serta bekerja sama dengan pemerintah Amerika untuk melakukan uji tuntas.
Sebagai langkah maju yang besar, seri o1 jauh lebih sulit untuk dibobol - melewati langkah-langkah keamanan - daripada model sebelumnya.
Pada salah satu tes jailbreaking yang paling sulit, model o1-preview mendapatkan skor 84 dari 100, dibandingkan dengan skor 22 yang suram dari GPT-4o.
3) Konvensi penamaan baru
Meskipun namanya bukanlah hal yang paling menarik dari OpenAI LLM yang baru, namun ini adalah perubahan yang sangat berarti.
OpenAI o1 adalah model pertama yang menanggalkan julukan 'GPT', dan itu karena perusahaan mengklaim bahwa ini adalah tahap pertama dari 'paradigma penalaran' yang baru, sedangkan model yang lebih lama merupakan bagian dari 'paradigma pra-pelatihan'.
Model baru ini menghabiskan waktu untuk melakukan penalaran secara real time, daripada mengandalkan data pra-pelatihan.
4) Lebih baik dalam tugas-tugas pemecahan masalah STEM
Dengan penalaran yang lebih baik, maka akan muncul kemampuan matematika yang lebih baik.
Baik o1 maupun GPT-4o diminta untuk menyelesaikan ujian kualifikasi untuk Olimpiade Matematika Internasional. GPT-4o menyelesaikan 13% soal, sedangkan o1 menyelesaikan 83% soal.
5) Waktu tunggu lebih lama
Penalaran secara real time membutuhkan waktu lebih lama daripada merujuk data pelatihan dan menghasilkan respons. Jika Anda mengajukan pertanyaan ke OpenAI o1-preview dibandingkan dengan model lain, Anda akan menunggu lebih lama.
Namun demikian, dengan kemampuan untuk melakukan outsourcing penalaran, harga yang harus dibayar tidak terlalu mahal. Kecepatan model o1 kemungkinan akan meningkat seiring dengan dirilisnya model berikutnya dalam seri ini.
Siapa saja yang dapat menggunakan o1?
Mulai tanggal 12 September, pengguna ChatGPT Plus dan Team dapat mengakses model o1 di ChatGPT.
OpenAI mengumumkan bahwa mereka akan membuat o1-mini tersedia untuk pengguna gratis, meskipun belum ada tanggal yang ditentukan.
Batas tarif mingguan saat ini adalah 30 pesan untuk 01-preview dan 50 pesan untuk o1-mini, meskipun batas tersebut akan segera meningkat.
Untuk apa saya harus menggunakan o1?
Kemampuan penalaran yang ditingkatkan dari o1 sangat berguna untuk memecahkan masalah yang kompleks dalam matematika, sains, dan pengkodean. Seperti yangdijelaskan OpenAI :
Keterbatasan OpenAI o1
Sebagai pratinjau, model ini belum memiliki semua kemampuan GPT-4o. Jika Anda ingin menggunakan LLM untuk menjelajahi web untuk mencari informasi, atau ingin mengunggah file atau gambar, Anda harus tetap menggunakan GPT-4o sampai model o1 yang lebih baru dirilis.
Cara meminta OpenAI o1
OpenAISaran yang diberikan telah berubah untuk o1 dibandingkan dengan model sebelumnya, karena penalarannya yang telah disempurnakan.
Jaga agar petunjuk Anda tetap sederhana. Ini adalah model yang cerdas, dan tidak memerlukan panduan sebanyak seri GPT-4. Itu berarti hindari input pemikiran berantai - model ini sudah bernalar secara internal.
Membangun agen AI yang bertenaga GPT
Bagaimana jika agen AI Anda secara otomatis disinkronkan dengan setiap pembaruan OpenAI ?
Botpress adalah platform agen AI yang sepenuhnya terbuka dan dapat diperluas. stack kami memungkinkan pengembang untuk membangun chatbot dan agen AI dengan kemampuan apa pun, di semua alur kerja.
Satu-satunya platform yang berkisar dari pengaturan kode yang rendah hingga kemampuan kustomisasi dan perluasan yang tak terbatas, Botpress memungkinkan Anda untuk secara otomatis mendapatkan kekuatan versi GPT terbaru di chatbot Anda - tidak perlu usaha.
Mulaimembangun hari ini. Ini gratis.
Daftar Isi
Dapatkan informasi terbaru tentang agen AI
Bagikan ini: