Selepas berbulan-bulan spekulasi, OpenAI Strawberi terbaru LLM keluaran telah menurun – dan ia tidak dipanggil GPT -5 .
Sebelum ini dirujuk dengan nama kod yang samar dan menarik seperti Q* dan Strawberry, siri model terbaharu akhirnya mendapat nama OpenAI o1 .
Kemas kini terbesar dengan OpenAI Model baharu ialah kemahiran penaakulan yang dipertingkatkan. OpenAI menjelaskan bahawa o1 telah dilatih untuk menghabiskan lebih banyak masa berfikir daripada model sebelumnya, membawanya lebih dekat dengan kecerdasan manusia.
Apa itu OpenAI o1?
OpenAI o1 ialah siri terbaru model bahasa besar yang dikeluarkan oleh OpenAI pada 12 September 2024, pada masa ini terdiri daripada dua model: o1-pratonton dan o1-mini.
Perbezaan terbesar antara o1 dan model syarikat sebelum ini ialah penaakulan lanjutannya. Walaupun ia belum dikeluarkan sepenuhnya, pratonton dan model mini sudah pun bertiup GPT -4o keluar dari air pada ujian matematik, sains dan pengekodan.
OpenAI model o1
Keluaran September termasuk dua model, o1-preview dan o1-mini. Ia adalah yang pertama daripada siri model yang akan terus dikeluarkan sebagai OpenAI memperhalusi baru mereka LLM .
Perbezaannya? Model o1-mini lebih kecil dan 80% lebih murah daripada model pratonton. Ia dibina untuk tugasan yang memerlukan penaakulan lanjutan, tetapi bukan pengetahuan yang lebih luas. Ia amat sesuai untuk tugasan yang melibatkan pengekodan atau matematik.
Betapa bijaknya OpenAI o1?
OpenAI telah menggembar-gemburkan senarai penanda aras STEM yang menunjukkan kebolehan penaakulan o1, termasuk:
- Prestasi yang serupa dengan pelajar PhD dalam ujian penanda aras pada fizik, kimia dan biologi.
- Menempatkan dalam 500 pelajar terbaik dalam kelayakan AS untuk Olimpik Matematik AS.
- Kedudukan dalam persentil ke-89 dalam Codeforces, ujian pengekodan yang kompetitif.
Anda boleh membaca lebih lanjut tentang kebolehan penaakulan o1 dalam OpenAI keluaran penyelidikan .
Apakah penaakulan rantaian pemikiran?
Model o1 menggunakan rantaian penaakulan pemikiran , cara yang lebih panjang dan teliti untuk memecahkan permintaan.
Jika model o1 diberi gesaan, ia tidak akan menjawab serta-merta - oleh itu masa menunggu yang lama. Sebaliknya, ia akan membuat alasan melalui setiap langkah, mempertimbangkan dengan teliti setiap maklumat dan implikasinya sebelum memutuskan tindakan seterusnya. Ia tidak akan memberikan jawapan sehingga ia telah memikirkan keseluruhan siri langkah yang diperlukan dalam soalan.
Bagaimana o1 berbeza daripada GPT -4o?
1) Kebolehan menaakul
Di tengah-tengah kecerdasan amnya ialah kebolehan baru untuk menaakul. "Mungkin bidang kemajuan yang paling penting adalah sekitar keupayaan penaakulan," Altman berkongsi dengan Gates. “Sekarang ini, GPT -4 boleh menaakul dengan cara yang sangat terhad.”
Penaakulan adalah terkenal sukar. Malah untuk manusia. Dan OpenAI o1 ialah model pertama yang menuntutnya.
Model o1 dapat membuat alasan dalam masa nyata, dan bukannya bergantung pada data pra-latihan. Inilah sebabnya mengapa model baharu lebih baik dalam tugasan sains, matematik dan pengekodan berbanding sebelumnya OpenAI model.
2) Lebih sukar untuk jailbreak
Dengan kebimbangan keselamatan yang semakin meningkat sebagai LLMs berkembang dalam populariti dan kuasa, keselamatan telah menjadi tumpuan utama OpenAI perkembangan terkini. Syarikat itu bekerjasama dengan Institut Keselamatan AI AS dan UK semasa membangunkan siri o1, serta bekerjasama dengan kerajaan Amerika untuk mewujudkan usaha wajar mereka.
Sebagai langkah besar ke hadapan, siri o1 jauh lebih sukar untuk dijailbreak - memintas langkah keselamatan - berbanding model sebelumnya.
Pada salah satu ujian jailbreaking yang paling sukar, model pratonton o1 mendapat markah 84 daripada 100, berbanding skor 22 yang suram daripada GPT -4o.
3) Konvensyen penamaan baru
Walaupun namanya bukanlah perkara yang paling menarik tentang yang baharu OpenAI LLM , ia adalah perubahan yang sengaja bermakna.
OpenAI o1 ialah model pertama yang membuang ' GPT ' moniker, dan itu kerana syarikat itu mendakwa ia adalah fasa pertama 'paradigma penaakulan' serba baharu, manakala model lama adalah sebahagian daripada 'paradigma pra-latihan'.
Model baharu ini menghabiskan masa untuk membuat pertimbangan dalam masa nyata, dan bukannya bergantung pada data pra-latihannya.
4) Lebih baik dalam tugas penyelesaian masalah STEM
Dengan penaakulan yang lebih baik datang kemahiran matematik yang lebih baik.
Kedua-dua o1 dan GPT -4o diminta untuk melengkapkan peperiksaan kelayakan untuk Olimpik Matematik Antarabangsa. GPT -4o menyelesaikan 13% masalah, manakala o1 menyelesaikan 83%.
5) Masa menunggu lebih lama
Penaakulan dalam masa nyata mengambil masa lebih lama daripada merujuk data latihan dan menjana respons. Jika anda bertanya soalan kepada OpenAI o1-pratonton berbanding model lain, anda akan menunggu dengan ketara lebih lama.
Walau bagaimanapun, dengan keupayaan untuk mencari sumber luar, ia adalah harga yang kecil untuk dibayar. Kelajuan model o1 mungkin akan bertambah baik apabila model seterusnya dalam siri ini dikeluarkan.
Siapa yang boleh menggunakan o1?
Mulai 12 September, ChatGPT Plus dan pengguna Pasukan boleh mengakses model o1 dalam ChatGPT .
OpenAI mengumumkan bahawa mereka akan menyediakan o1-mini kepada pengguna percuma, walaupun tiada tarikh yang ditentukan.
Had kadar mingguan semasa ialah 30 mesej untuk pratonton 01 dan 50 untuk o1-mini, walaupun ia akan meningkat tidak lama lagi.
Untuk apa saya perlu menggunakan o1?
Keupayaan penaakulan yang dipertingkatkan bagi o1 amat berguna untuk menyelesaikan masalah kompleks dalam matematik, sains dan pengekodan. Sebagai OpenAI menerangkan :
Had daripada OpenAI o1
Sebagai pratonton, model ini belum lagi mempunyai semua keupayaan GPT -4o. Jika anda ingin menggunakan a LLM untuk menyemak imbas web untuk mendapatkan maklumat, atau anda ingin memuat naik fail atau imej, anda perlu mematuhinya GPT -4o sehingga model o1 kemudian dikeluarkan.
Bagaimana untuk menggesa OpenAI o1
OpenAI Cadangan gesaan telah berubah untuk o1 berbanding model terdahulu mereka, disebabkan oleh penaakulannya yang dipertingkatkan.
Pastikan gesaan anda mudah. Ia adalah model pintar, dan tidak memerlukan bimbingan seperti model GPT -4 siri. Ini bermakna elakkan sebarang input rantaian pemikiran - model itu sudah membuat penaakulan secara dalaman.
bina GPT -ejen AI berkuasa
Bagaimana jika ejen AI anda secara automatik disegerakkan dengan setiap OpenAI kemas kini?
Botpress ialah platform ejen AI yang terbuka dan boleh dilanjutkan sepenuhnya. kami stack membolehkan pembangun membina chatbots dan ejen AI dengan sebarang keupayaan, merentasi mana-mana aliran kerja.
Satu-satunya platform yang terdiri daripada penyediaan kod rendah kepada kebolehsesuaian dan kebolehlanjutan yang tidak berkesudahan, Botpress membolehkan anda mendapatkan kuasa terkini secara automatik GPT versi pada chatbot anda – tiada usaha diperlukan.
Mula membina hari ini. Ia percuma.
Senarai Kandungan
Ikuti perkembangan terkini tentang ejen AI
Kongsi ini pada: