ضعف السرعة وبنصف السعر - ماذا يعني GPT-4o لروبوتات الدردشة الآلية التي تعمل بالذكاء الاصطناعي؟
بعد إعلانها الغامض، أطلقت OpenAI أحدث إصدار من طرازها الرائد: GPT-4o.
لم يحصل الموديل الأحدث على مجرد توهج لامع في القدرات متعددة الوسائط. إنه أسرع وأرخص من GPT-4 Turbo. في حين أن التغطية الإعلامية السائدة مبهورة بقدرات الفيديو والصوت في الطراز الرائد الجديد، إلا أن التكلفة والسرعة الجديدتين مؤثرتان بنفس القدر بالنسبة لأولئك الذين يستخدمون GPT لتشغيل تطبيقاتهم.
قال Patrick Hamelin ، وهو مهندس برمجيات رئيسي في شركة 4o: "إن توفر 4o لديه القدرة على تحسين كل من المنشئ وتجربة المستخدم بشكل كبير". Botpress. "إن التأثير أبعد مدى مما نعتقد."
لذا دعونا نتعمق في كيفية تغيير النموذج الجديد للذكاء الاصطناعي chatbots.
قدرات النموذج
يأتي الطراز الرائد الجديد بقائمة مثيرة من التحديثات والميزات الجديدة: قدرات صوتية وفيديو محسّنة، وترجمة في الوقت الفعلي، وقدرات لغوية طبيعية أكثر. ويمكنه تحليل الصور، وفهم مجموعة أكبر من المدخلات الصوتية، وتقديم المساعدة في التلخيص، وتسهيل الترجمة في الوقت الفعلي، وإنشاء الرسوم البيانية. يمكن للمستخدمين تحميل الملفات وإجراء محادثة صوتية إلى صوتية. حتى أنه يأتي مع تطبيق لسطح المكتب.
في سلسلة فيديوهات الإطلاق، يعرض موظفو OpenAI (وشركاؤهم مثل سال خان من أكاديمية خان) أحدث إصدار من GPT الذي يقوم بإعداد مستخدم لمقابلة عمل، والغناء، وتحديد المشاعر الإنسانية من خلال تعابير الوجه، وحل معادلات الرياضيات المكتوبة، وحتى التفاعل مع مستخدم آخر ChatGPT-4o.
لقد أوضح الإطلاق واقعًا جديدًا يكون فيه نموذج الذكاء الاصطناعي قادرًا على تحليل الكتابة في دفتر طفلك والقدرة على الاستجابة. يمكن أن يشرح مفهوم جمع الكسور لأول مرة، ويغير لهجته وأساليبه بناءً على فهم طفلك - يمكن أن يتجاوز الخط من chatbot إلى معلم شخصي.
ماذا يعني GPT-4o لروبوتات الدردشة الآلية LLM ؟
يتم منح روبوتات الدردشة الآلية التي تعمل بالذكاء الاصطناعي التي تعمل على LLMs تحديثاً في كل مرة تقوم فيها شركات مثل OpenAI بتحديث نماذجها. إذا كان chatbot متصلاً بمنصة بناء الروبوتات مثل Botpress ، فإنهم يحصلون على جميع مزايا أحدث نموذج GPT في روبوتات الدردشة الخاصة بهم.
مع إصدار GPT-4o، يمكن الآن لروبوتات الدردشة القائمة على الذكاء الاصطناعي اختيار العمل على النموذج المتقدم، مما يغير من قدراتها وسعرها وسرعتها. يتميز الطراز الجديد بحدود معدل أعلى 5 أضعاف من GPT-4 Turbo، مع القدرة على معالجة ما يصل إلى 10 ملايين توكن في الدقيقة.
بالنسبة للروبوتات التي تستخدم عمليات تكامل الصوت مثل Twilio على Botpress ، ظهر عالم جديد من التفاعل المدعوم بالصوت. فبدلاً من الاقتصار على المعالجة الصوتية التي كانت سائدة في الماضي، أصبحت chatbots أقرب إلى محاكاة التفاعل البشري.
ولعل الأهم من ذلك هو التكلفة المنخفضة للمستخدمين المدفوعة. يمكن أن يؤدي تشغيل chatbot بنفس القدرة بنصف التكلفة إلى زيادة كبيرة في إمكانية الوصول والقدرة على تحمل التكاليف في جميع أنحاء العالم. ولا يدفع مستخدمو Botpress أي إنفاق إضافي للذكاء الاصطناعي على روبوتاتهم - لذا فإن هذه الوفورات تذهب مباشرةً إلى البناة.
وعلى جانب المستخدم من المعادلة، GPT-4o يعني تجربة مستخدم أفضل بكثير. لا أحد يحب الانتظار. أوقات استجابة أقصر تعني رضا مستخدمين أعلى لمستخدمي الذكاء الاصطناعي chatbot .
المستخدمون يحبون السرعة
أحد المستلزمات الرئيسية لاعتماد chatbot هو تحسين تجربة المستخدم. وما الذي يحسن تجربة المستخدم أكثر من تقليل أوقات الانتظار؟
قال هاملين: "ستكون تجربة أفضل بالتأكيد". "آخر شيء تريد القيام به هو انتظار شخص ما."
يكره البشر الانتظار. فحتى في عام 2003، وجدت دراسة أن الناس كانوا على استعداد للانتظار لمدة ثانيتين فقط لتحميل صفحة ويب. ومن المؤكد أن صبرنا لم يزد منذ ذلك الحين.
والجميع يكره الانتظار
هناك عدد كبير من النصائح المتعلقة بتجربة المستخدم لتقليل وقت الانتظار المتصور. في كثير من الأحيان لا يمكننا تحسين سرعة الأحداث، لذلك نركز على كيفية جعل المستخدمين يشعرون بأن الوقت يمر بشكل أسرع. توجد ملاحظات مرئية، مثل صورة شريط التحميل، لتقصير وقت الانتظار المتصور.
في قصة شهيرة عن أوقات انتظار المصاعد، كان أحد المباني القديمة في نيويورك يتلقى وابلاً من الشكاوى. كان على السكان الانتظار من دقيقة إلى دقيقتين حتى يصل المصعد. لم يكن المبنى قادراً على ترقية المصعد إلى طراز أحدث، وكان السكان يهددون بفسخ عقود الإيجار.
اكتشف أحد الموظفين الجدد المدربين في علم النفس أن المشكلة الحقيقية لم تكن دقيقتين من الوقت الضائع، بل كانت الملل. واقترح تركيب مرايا حتى يتمكن السكان من النظر إلى أنفسهم أو إلى الآخرين أثناء الانتظار. توقفت الشكاوى حول المصعد، والآن أصبح من الشائع رؤية المرايا في ردهات المصاعد.
بدلاً من اتخاذ طرق مختصرة لتحسين تجربة المستخدم - مثل التغذية الراجعة المرئية - قام OpenAI بتحسين التجربة من مصدرها. السرعة أمر أساسي لتجربة المستخدم، ولا توجد حيلة تضاهي الرضا عن التفاعل الفعال.
التوفير للجميع
أصبح استخدام هذا النموذج الجديد للذكاء الاصطناعي لتشغيل التطبيقات أرخص فجأة. أرخص بكثير.
يمكن أن يكون تشغيل الذكاء الاصطناعي chatbot على نطاق واسع مكلفاً. يحدد LLM الذي يتم تشغيل الروبوت الخاص بك بواسطة المبلغ الذي ستدفعه مقابل كل تفاعل مستخدم على نطاق أوسع (على الأقل في Botpress ، حيث نطابق إنفاق الذكاء الاصطناعي 1:1 مع تكاليف LLM ).
وهذه الوفورات ليست فقط للمطورين الذين يستخدمون واجهة برمجة التطبيقات. ChatGPT-4o هو أحدث إصدار مجاني من LLM ، إلى جانب GPT-3.5. يمكن للمستخدمين المجانيين استخدام تطبيق ChatGPT بدون تكلفة.
ترميز أفضل
إذا كنت تتفاعل مع النموذج بلغة لا تستخدم الأبجدية الرومانية، فإن GPT-4o يقلل من تكاليف واجهة برمجة التطبيقات بشكل أكبر.
يأتي النموذج الجديد مع حدود استخدام محسّنة. وهو يوفر قفزة كبيرة في كفاءة الترميز، تتركز إلى حد كبير في بعض اللغات غير الإنجليزية.
يتطلب نموذج الترميز الجديد عددًا أقل من الرموز لمعالجة نص الإدخال. وهو أكثر كفاءة بكثير بالنسبة للغات اللوغوغوغرافية (أي اللغات التي تستخدم الرموز والأحرف بدلاً من الحروف الفردية).
تتركز هذه الفوائد إلى حد كبير على اللغات التي لا تستخدم الأبجدية الرومانية. وقد قدرت التخفيضات في الوفورات على النحو التالي:
- اللغات الهندية، مثل الهندية أو التاميلية أو الغوجاراتية، لديها انخفاض في الرموز بمعدل 2.9 إلى 4.4 أضعاف
- اللغة العربية أقل من الرموز بحوالي 2 ضعف تقريبًا
- تتميز لغات شرق آسيا، مثل الصينية واليابانية والفيتنامية بتخفيض 1.4 إلى 1.7 مرة في الرموز
سد الفجوة الرقمية للذكاء الاصطناعي
لقد جلب العصر الرقمي معه امتدادًا لفجوة الثروة القديمة والموثقة جيدًا - الفجوة الرقمية. فكما أن الوصول إلى الثروة والبنية التحتية القوية مقصور على فئات معينة من السكان، كذلك الوصول إلى الذكاء الاصطناعي والفرص والفوائد التي تصاحبه.
وأوضح روبرت أوب، كبير المسؤولين الرقميين في برنامج الأمم المتحدة الإنمائي (UNDP)، أن وجود منصات الذكاء الاصطناعي لديه القدرة على إنجاح أو إفشال مقاييس التنمية في بلد بأكمله:
من خلال خفض تكلفة GPT-4o إلى النصف وتقديم فئة مجانية، يتخذ OpenAI خطوة حاسمة نحو تحييد إحدى أكبر المشاكل في مجال الذكاء الاصطناعي - ومعالجة عدم المساواة التي تشغل بال صانعي السياسات والاقتصاديين بشكل مباشر.
خطوة العلاقات العامة الإيجابية للذكاء الاصطناعي الكبير ضرورية أكثر مما قد يعتقده المتحمسون. مع ازدياد حضور الذكاء الاصطناعي في حياتنا اليومية أكثر من أي وقت مضى، تساءل المدافعون والمشككون على حد سواء عن كيفية استخدام الذكاء الاصطناعي "من أجل الخير".
وفقًا للدكتوراه في الذكاء الاصطناعي والمعلم لويس بوشار، فإن توزيع الوصول إلى الذكاء الاصطناعي على نطاق أوسع هو الطريقة التي يمكننا من خلالها تحقيق ذلك بالضبط: "إن إتاحة الوصول إلى الذكاء الاصطناعي هي إحدى الطرق، إن لم تكن أفضلها، لاستخدام الذكاء الاصطناعي من أجل الخير". ما هو منطقه؟ إذا كنا غير قادرين على السيطرة الكاملة على الآثار الإيجابية والسلبية لتكنولوجيا الذكاء الاصطناعي - على الأقل في أيامها الأولى - فيمكننا بدلاً من ذلك ضمان المساواة في الوصول إلى فوائدها المحتملة.
إمكانات موسعة متعددة الوسائط
الطريقة الشائعة للتفاعل مع الشركة chatbot هي عبر الرسائل النصية، ولكن القدرات المعززة متعددة الوسائط لنموذج الذكاء الاصطناعي الجديد OpenAIتشير إلى أن هذا قد يتغير في المستقبل.
في العام القادم، سنشهد على الأرجح موجة من المطورين الذين سيطرحون تطبيقات جديدة تحقق أقصى استفادة من إمكانيات الصوت والرؤية والفيديو التي يمكن الوصول إليها حديثاً.
على سبيل المثال، يمكن أن يكون لروبوتات الدردشة الآلية التي تعمل بالطاقة GPT القدرة على:
- اطلب من العملاء صورة للعنصر الذي يقومون بإرجاعه للتعرف على المنتج والتأكد من عدم تلفه
- توفير ترجمة صوتية في المحادثة في الوقت الفعلي تراعي اللهجات الخاصة بالمنطقة
- معرفة ما إذا كانت شريحة اللحم قد نضجت من صورة لها في المقلاة
- العمل كمرشد سياحي شخصي بدون تكلفة، وتوفير سياق تاريخي يستند إلى صورة لكاتدرائية قديمة، وتقديم ترجمة في الوقت الحقيقي، وإعطاء جولة صوتية مخصصة تسمح بالتواصل والتفاعل مع الأسئلة
- تشغيل تطبيق تعلم اللغة الذي يستمع إلى المدخلات الصوتية، ويمكنه تقديم ملاحظات حول النطق بناءً على فيديو لحركات فمك، أو تعليم لغة الإشارة من خلال الصور والفيديو
- توفير الدعم غير العاجل للصحة النفسية من خلال الجمع بين قدرته على ترجمة الصوت والفيديو، مما يسمح بالعلاج بالكلام منخفض التكلفة
مع وجود نماذج الذكاء الاصطناعي التي يمكنها تفسير الصور والصوت، يتوسع فهمنا لكيفية خدمة LLMs لنا بسرعة.
تعدد الوسائط يعني إمكانية الوصول
لقد رأينا بالفعل الميزات المحسّنة متعددة الوسائط التي تم توظيفها في الصالح الاجتماعي. وخير مثال على ذلك شراكةOpenAIمع Be My Eyes.
Be My Eyes هي شركة دنماركية ناشئة تربط المستخدمين ضعاف البصر بمتطوعين مبصرين. عندما يحتاج المستخدم إلى مساعدة - مثل اختيار السلع المعلبة المناسبة في السوبر ماركت أو تحديد لون قميص - يربطه التطبيق بمتطوع مبصر حول العالم من خلال الفيديو عبر الهاتف الذكي.
OpenAIيمكن لقدرة الرؤية الجديدة التي يوفرها تطبيق Be My Eyes أن توفر تجربة أكثر فائدة لمستخدمي تطبيق Be My Eyes. فبدلاً من الاعتماد على متطوع بشري لفك شفرة صورة أو مقطع فيديو بصرياً في الوقت الفعلي، يمكن للمستخدمين المكفوفين نقل صورة أو مقطع فيديو إلى أجهزتهم التي يمكن للنموذج الاستجابة لها بمعلومات صوتية.
OpenAI و Be My Eyes، وهما الآن شريكان موثوقان، يمهدان الطريق لمزيد من الاستقلالية للأفراد المكفوفين قانونيًا حول العالم. يشرح مايكل باكلي، الرئيس التنفيذي لمنظمة "كن عيني" تأثيرها:
سيتم طرح الخدمة الجديدة قريباً، في صيف 2024، لأول مرة. وقد قام مستخدمو الوصول المبكر باختبار الميزات الجديدة للرؤية والفيديو والصوت في مرحلة تجريبية وحظيت بإعجاب المستخدمين. وعلى الرغم من أن تأثيرات الذكاء الاصطناعي قد تثير قلق المشككين، إلا أن هذه الشراكة علامة واضحة على التأثيرات الإيجابية التي يمكن أن تجلبها. ويُعد فهم الخير الاجتماعي الذي يأتي مع الذكاء الاصطناعي المتقدم خطوة حاسمة للعلاقات العامة.
كيف سنحكم على نماذج LLM المستقبلية؟
مع استمرار المتنافسين في سباق نحو القاع - لابتكار أرخص وأسرع LLM - يطرح السؤال التالي: كيف سنحكم على نماذج الذكاء الاصطناعي المستقبلية؟
في مرحلة ما في المستقبل، سوف تستقر النماذج الرئيسية LLM (على الأرجح OpenAI وجوجل) في مدى سرعة تشغيل نماذجها ومدى رخص تكلفتها. بمجرد أن نصل إلى الاستقرار في التكلفة والسرعة، كيف سنتوج النموذج الرائد في السوق؟
ما الذي سيصبح علامة العصر الجديدة؟ سواءً كانت الشخصيات المتاحة لنموذج الذكاء الاصطناعي الخاص بك، أو قدرات تحسين الفيديو، أو الميزات المتاحة للمستخدمين المجانيين، أو المقاييس الجديدة التي تتجاوز فهمنا الحالي، فإن الجيل التالي من LLMs على أبوابنا.
الذكاء الاصطناعي Chatbots أصبح سهلاً
ماذا لو تمت مزامنة الذكاء الاصطناعي chatbot تلقائياً مع كل تحديث GPT ؟
Botpress قدمت حلول الذكاء الاصطناعي chatbot القابلة للتخصيص منذ عام 2017، حيث توفر للمطورين الأدوات التي يحتاجونها لإنشاء روبوتات الدردشة بسهولة مع قوة أحدث LLMs. Botpress يمكن تدريب روبوتات الدردشة الآلية على مصادر المعرفة المخصصة - مثل موقعك الإلكتروني أو كتالوج المنتجات - والتكامل بسلاسة مع أنظمة الأعمال.
النظام الأساسي الوحيد الذي يتراوح بين عدم إعداد أي كود برمجي وقابلية التخصيص والتوسيع اللانهائية، Botpress يتيح لك الحصول تلقائيًا على قوة أحدث إصدار GPT على chatbot الخاص بك - دون الحاجة إلى بذل أي جهد.
ابدأالبناء اليوم. إنه مجاني.
جدول المحتويات
ابق على اطلاع دائم بأحدث ما توصل إليه وكلاء الذكاء الاصطناعي
شارك هذا على: