بعد أشهر من التكهنات، تم إطلاق أحدث إصدارات Strawberry LLM من OpenAI- وهو لا يسمى GPT-5.
كان يُشار إليها في السابق بأسماء رمزية غامضة ومثيرة للاهتمام مثل Q* و Strawberry، وقد استقرت أحدث سلسلة من الطرازات أخيراً على اللقب OpenAI o1.
يتمثل التحديث الأكبر في نموذج OpenAI الجديد في تعزيز مهارات التفكير لديه. OpenAI أوضح أنه تم تدريب o1 على قضاء وقت أطول في التفكير مقارنة بالنماذج السابقة، مما يجعله أقرب إلى الذكاء البشري.
ما هو OpenAI o1؟
OpenAI o1 هي أحدث سلسلة من الموديلات اللغوية الكبيرة التي أصدرتها OpenAI في 12 سبتمبر 2024، وتتألف حاليًا من طرازين: o1-المعاينة و o1-الميني.
يتمثل الاختلاف الأكبر بين o1 ونماذج الشركة السابقة في منطقه المتقدم. على الرغم من أنه لم يتم إصداره بالكامل بعد، إلا أن الطرازين التجريبي والمصغر يتفوقان بالفعل على GPT-4o في اختبارات الرياضيات والعلوم والبرمجة.
OpenAI طرازات o1
تضمن إصدار سبتمبر نموذجين هما o1-preview و o1-mini. وهما أول نموذجين من سلسلة من النماذج التي سيستمر إصدارها مع قيام OpenAI بتحسين LLM.
الفرق؟ نموذج o1-mini أصغر حجمًا وأرخص بنسبة 80% من نموذج المعاينة. إنه مصمم للمهام التي تتطلب تفكيرًا متقدمًا، ولكن ليس معرفة أوسع. إنه مناسب تمامًا للمهام التي تتضمن البرمجة أو الرياضيات.
ما مدى ذكاء OpenAI o1؟
OpenAI قائمة بمعايير العلوم والتكنولوجيا والهندسة والرياضيات (STEM) التي تُظهر قدرات o1 المنطقية، بما في ذلك
- أداء مماثل لأداء طلاب الدكتوراه في الاختبارات المعيارية في الفيزياء والكيمياء والأحياء.
- الحصول على مركز ضمن أفضل 500 طالب في تصفيات الولايات المتحدة الأمريكية لأولمبياد الرياضيات بالولايات المتحدة الأمريكية.
- احتلت المرتبة 89 في المئة في اختبار البرمجة التنافسي "Codeforces".
يمكنك قراءة المزيد عن قدرات التفكير لدى o1 في الإصدار البحثي OpenAI.
ما هي سلسلة التفكير المنطقي؟
تستخدم النماذج o1 المنطق التسلسلي للتفكير، وهي طريقة أطول وأكثر شمولاً لتحليل الطلبات.
إذا أُعطي نموذج o1 مطالبة، فلن يجيب على الفور - ومن هنا يأتي وقت الانتظار الطويل. بدلاً من ذلك، سيقوم بالتفكير في كل خطوة من الخطوات، مع التفكير بعناية في كل معلومة من المعلومات وآثارها قبل اتخاذ قرار بشأن مسار العمل التالي. لن يقدم إجابة حتى يفكر في سلسلة الخطوات الكاملة المطلوبة في السؤال.
كيف يختلف o1 عن GPT-4o؟
1) القدرات المنطقية
في مركز ذكائه العام قدرة o1 الجديدة على التفكير. قال ألتمان في حديثه مع جيتس: "ربما تكون أهم مجالات التقدم هي القدرة على التفكير". "في الوقت الحالي، يمكن لـ GPT-4 التفكير بطرق محدودة للغاية فقط."
من المعروف أن الاستدلال صعب للغاية. حتى بالنسبة للبشر. و OpenAI o1 هو أول نموذج يدعي ذلك.
نماذج o1 قادرة على التفكير في الوقت الحقيقي، بدلاً من الاعتماد على بيانات ما قبل التدريب. وهذا هو السبب في أن النموذج الجديد أفضل في مهام العلوم والرياضيات والترميز من نماذج OpenAI السابقة.
2) أصعب في الهروب من السجن
مع تزايد المخاوف المتعلقة بالسلامة مع تزايد شعبية وقوة LLMs ، كان الأمن محورًا رئيسيًا في أحدث تطويرات OpenAI. وقد دخلت الشركة في شراكة مع معاهد سلامة الذكاء الاصطناعي في الولايات المتحدة والمملكة المتحدة أثناء تطوير سلسلة o1، كما عملت مع الحكومة الأمريكية لإثبات سلامة هذه الأجهزة.
كخطوة كبيرة إلى الأمام، فإن سلسلة o1 أصعب بكثير في كسر الحماية - تجاوز إجراءات السلامة - من الموديلات السابقة.
في أحد أصعب اختبارات كسر الحماية التي أجروها، حصل نموذج o1-preview على 84 من 100، مقارنةً بـ 22 درجة كئيبة من GPT-4o.
3) اصطلاح جديد للتسمية
على الرغم من أن اسمها ليس أكثر ما يثير الاهتمام في السيارة الجديدة OpenAI LLM ، إلا أنه تغيير ذو مغزى مقصود.
OpenAI o1 هو أول نموذج يتخلص من لقب "GPT"، وذلك لأن الشركة تدعي أنه المرحلة الأولى من "نموذج التفكير" الجديد، في حين أن النماذج القديمة كانت جزءًا من "نموذج ما قبل التدريب".
يقضي النموذج الجديد وقتاً في التفكير في الوقت الفعلي، بدلاً من الاعتماد على بيانات ما قبل التدريب.
4) أفضل في مهام حل مشكلات العلوم والتكنولوجيا والهندسة والرياضيات
مع المنطق الأفضل تأتي مهارات الرياضيات الأفضل.
طُلب من كل من o1 و GPT-4o إكمال امتحان تأهيلي لأولمبياد الرياضيات الدولي. GPT حلّ -4o 13% من المسائل، بينما حلّ o1 83% من المسائل.
5) وقت انتظار أطول
يستغرق الاستدلال في الوقت الفعلي وقتًا أطول من الرجوع إلى بيانات التدريب وتوليد استجابة. إذا طرحت سؤالًا على OpenAI o1-preview مقارنةً بالنماذج الأخرى، فسوف تنتظر وقتًا أطول بكثير.
ومع ذلك، مع القدرة على الاستعانة بمصادر خارجية للتفكير المنطقي، فإن هذا ثمن زهيد. من المرجح أن تتحسن سرعة موديلات o1 مع إصدار الموديلات التالية في السلسلة.
من يمكنه استخدام o1؟
اعتبارًا من 12 سبتمبر، ChatGPT Plus ويمكن لمستخدمي وفريق العمل الوصول إلى نماذج o1 في ChatGPT.
OpenAI أعلنوا أنهم سيجعلون o1-mini متاحًا للمستخدمين مجانًا، على الرغم من عدم تحديد موعد محدد لذلك.
الحدود الأسبوعية الحالية للمعدل الأسبوعي هي 30 رسالة لـ 01-مراجعة و50 لـ o1-mini، على الرغم من أنها ستزيد قريبًا.
في ماذا يجب أن أستخدم o1؟
تُعد قدرات التفكير المعززة لـ o1 مفيدة بشكل خاص في حل المشكلات المعقدة في الرياضيات والعلوم والبرمجة. كمايوضح OpenAI :
حدود OpenAI o1
كمعاينة، لا يحتوي هذا النموذج حتى الآن على جميع إمكانيات GPT-4o. إذا كنت تتطلع إلى استخدام LLM لتصفح الويب للحصول على معلومات، أو كنت ترغب في تحميل الملفات أو الصور، فستحتاج إلى التمسك بـ GPT-4o حتى يتم إصدار الطرازات اللاحقة من o1.
كيفية المطالبة OpenAI o1
OpenAIلقد تغيرت اقتراحات المطالبة الخاصة بـ o1 مقارنةً بنماذجها السابقة، وذلك بسبب تعزيزها للمنطق.
اجعل مطالباتك بسيطة. إنه نموذج ذكي، ولا يحتاج إلى الكثير من التوجيهات مثل سلسلة GPT-4. وهذا يعني تجنب أي سلسلة من المدخلات الفكرية - فالنموذج يفكر داخليًا بالفعل.
بناء وكلاء ذكاء اصطناعي GPT
ماذا لو تمت مزامنة وكيل الذكاء الاصطناعي تلقائياً مع كل تحديث OpenAI ؟
Botpress هي منصة وكلاء ذكاء اصطناعي مفتوحة بالكامل وقابلة للتوسيع. يتيح موقعنا stack للمطورين إنشاء روبوتات الدردشة الآلية ووكلاء الذكاء الاصطناعي بأي إمكانيات عبر أي سير عمل.
النظام الأساسي الوحيد الذي يتراوح بين الإعداد المنخفض للأكواد البرمجية وقابلية التخصيص والتوسيع اللانهائية، Botpress يتيح لك الحصول تلقائيًا على قوة أحدث إصدار GPT على chatbot الخاص بك - دون الحاجة إلى بذل أي جهد.
ابدأالبناء اليوم. إنه مجاني.
جدول المحتويات
ابق على اطلاع دائم بأحدث ما توصل إليه وكلاء الذكاء الاصطناعي
شارك هذا على: