روبوت الدردشة باللغة البرتغالية هو برنامج يمكنه فهم وتحليل المحادثة باللغة البرتغالية. اليوم، يمكن لهذه الروبوتات إجراء حوار سلس بين البشر والحواسيب.

أتاحت التطورات الأخيرة في معالجة اللغة الطبيعية (NLP، أو PLN في هذا النص) إنشاء روبوتات دردشة باللغة البرتغالية، مع مراعاة خصوصيات اللغة. تعتمد هذه التطورات على التعلم الآلي (ML) لفهم ليس فقط بنية اللغة، بل أيضًا معاني الكلمات وسياقاتها.

إنشاء روبوت دردشة ذكي باللغة البرتغالية

البرتغالية هي سادس أكثر لغة تحدثًا في العالم، نصف المتحدثين بها في البرازيل، وعلى الرغم من قربها من جميع اللغات اللاتينية، إلا أن لها خاصيتين بارزتين:

  • هناك العديد من الكلمات المتشابهة شكليًا لكنها مختلفة في المعنى. في البرتغالية الأوروبية، تعني كلمة propina دفعًا شهريًا، بينما في البرتغالية البرازيلية تعني رشوة. حتى داخل البرازيل، قد تتغير معاني الكلمات: في شمال شرق البلاد، تُستخدم كلمة "cabra" للإشارة إلى رجل، بينما في بقية البلاد تشير فقط إلى الحيوان.
  • الاستخدام المكثف للسياق يجعل مهمة تفسير روبوت الدردشة باللغة البرتغالية أكثر صعوبة. فكلمة "chega" قد تعني فعلًا ("هي تصل غدًا") أو طلبًا للتوقف ("كفى من هذا الحديث").

بالإضافة إلى ذلك، هناك تعبيرات اصطلاحية مختلفة تمامًا بين المتحدثين في البلدان المختلفة، مما يصعب أحيانًا فهم جمل كاملة.

هل تجعل هذه الخصائص عمل روبوت الدردشة باللغة البرتغالية صعبًا؟ ليس من المستغرب أن تكون الإجابة نعم.

روبوت الدردشة البرتغالي: تحديات معالجة اللغة الطبيعية

ما سبق يفرض تحديات على معالجة اللغة الطبيعية في روبوتات الدردشة البرتغالية. الخطوة الأولى لأي خوارزمية معالجة لغة طبيعية هي فهم اللغة، أي تحليل الجمل إلى وحدات صغيرة ذات معنى، أو "رموز". وتسمى هذه المهمة "التقطيع" (ومن خصائص البرتغالية البرازيلية استخدام الكلمات الأجنبية وتكييفها). كلما كانت اللغة أكثر نظامية وترتيبًا، كان من الأسهل تقطيعها.

قبل أن نفهم ما تعنيه أحدث تطورات معالجة اللغة الطبيعية، علينا أن نعرف كيف تم إنشاء نماذج فهم اللغة.

في الماضي

بمعنى ما، فهم كيفية إنشاء روبوت دردشة باللغة البرتغالية (أو بأي لغة أخرى) يتطلب العودة بالزمن إلى الوراء.

يمكن العثور على أولى الأبحاث للتعامل مع عدم قابلية التنبؤ باللغة في أربعينيات القرن الماضي، في أعمال عالم التشريح العصبي والطبيب النفسي وارن مكولوتش من معهد ماساتشوستس للتكنولوجيا، والرياضي والتر بيتس من جامعة إلينوي. وضعوا الأسس النظرية التي مكنت جون فون نيومان من كتابة “The General and Logical Theory of Automata”، في أواخر الأربعينيات.

أما التقدم الذي أتاح للحواسيب قوة معالجة متزايدة فقد شكل الركيزة الأخرى التي نقلت أبحاث معالجة اللغة الطبيعية من المختبرات العلمية إلى مختبرات الشركات والهيئات الحكومية المكرسة لتطبيقات التكنولوجيا في الحياة اليومية.

تبدأ قصة معالجة اللغة الطبيعية فعليًا في خمسينيات القرن الماضي، عندما نشر آلان تورينج مقالته “Computing Machinery and Intelligence”، التي اقترح فيها ما يعرف الآن باختبار تورينج كمعيار للذكاء.

منذ أواخر الثمانينيات، حدثت ثورة في معالجة اللغة الطبيعية مع إدخال خوارزميات التعلم الآلي لمعالجة اللغة. جاء ذلك نتيجة للزيادة المستمرة في القدرة الحاسوبية وتراجع هيمنة النظريات اللغوية “الشومسكية”، التي كانت تعيق تطوير مجموعات البيانات اللغوية اللازمة لنهج التعلم الآلي. كان يتم تحقيق هذا الأتمتة بتقسيم الجمل إلى وحدات أصغر وتطبيق قواعد إحصائية لتصنيف وتحديد العلاقات بينها. وتسمى هذه العملية “التقطيع”، كما ذكرنا سابقًا.

لكن مهمة تقطيع اللغة كانت تتطلب الكثير من التدخل اليدوي من باحث معالجة اللغة الطبيعية. كان يجب تقطيع كل لغة بشكل مستقل ويدوي تقريبًا.

وكانت هذه المهمة صعبة بشكل خاص للروبوتات التي تتعامل مع لغات تعتمد بشكل كبير على السياق، كما يمكنك أن تتخيل.

بمجرد تقطيع اللغة، يمكن تطبيق خوارزميات الذكاء الاصطناعي لفهم اللغة، أي بناء خريطة لمعاني الكلمات وعلاقاتها.

كان من الممكن أتمتة هذه المرحلة إذا كان التقطيع موثوقًا. لكن المشكلة أن التقطيع كان معقدًا، لذا حتى خوارزميات الفهم كانت بحاجة إلى إعداد يدوي مع التقطيع.

وكانت النتيجة النهائية غير مرضية. على سبيل المثال، كان مستوى فهم البرتغالية مقارنة بالإنجليزية متوسطًا. من الواضح أن هناك تركيزًا أكبر على البحث باللغة الإنجليزية، لكن صعوبة التعامل مع السياق في البرتغالية جعلت من الصعب تحقيق نتائج جيدة.

وكما يفعل الباحثون في الذكاء الاصطناعي عادة، تساءلوا عما إذا كان بالإمكان جعل التقطيع نفسه يتم عبر التعلم الآلي. هذا من شأنه أن يجعل خوارزميات التقطيع والفهم غير مرتبطة باللغة (أي محايدة لغويًا)، وبالتالي يجعل تدريب الذكاء الاصطناعي على لغة جديدة أسرع وأفضل بكثير.

التطورات الحديثة في الذكاء الاصطناعي

وهنا حدثت النقلة النوعية في نهاية عام 2018: أصبح بالإمكان تدريب الذكاء الاصطناعي على البرتغالية دون أي تدخل يدوي، ونتيجة لذلك، أصبح أداء معالجة اللغة الطبيعية أفضل بكثير.

أصبحت منصات الذكاء الاصطناعي لروبوتات الدردشة البرتغالية فجأة أكثر كفاءة، وأصبح الفهم الناتج باللغة البرتغالية مماثلًا للمستوى المحقق في لغات أخرى.

لكن هذا التقدم لا يعني أن جودة روبوتات الدردشة البرتغالية تحسنت فورًا. لكي يشعر العملاء بهذه الفوائد، كان على منصات روبوتات الدردشة التي تستخدم الذكاء الاصطناعي تحديث خوارزمياتها لتستخدم أحدث التقنيات.

وبالنظر إلى الاستثمارات في التكنولوجيا السابقة، لم يكن هذا أمرًا قامت به هذه المنصات بسرعة.

بالإضافة إلى ذلك، هناك بعض الميزات التي يجب أن توفرها المنصات لضمان تقديم روبوتات الدردشة البرتغالية تجربة جيدة للمستخدمين النهائيين. على سبيل المثال، بناء مجموعات من المرادفات واستخدامها في سياقات مختلفة لرسم معاني الكلمات وتجنب أن يفهم الروبوت كلمة بمعنى مختلف عن السياق المستخدم فيه.

منصة متعددة اللغات

العمل مع عدة لغات على منصات السوق المختلفة قد يكون صعبًا. تتطلب بعض المنصات بناء روبوتات منفصلة لكل لغة، وهو أمر غير فعال من حيث التوسع والصيانة.

لذلك، يجب أن تكون المنصة الجيدة متعددة اللغات حقًا، بحيث تتيح ترجمات متعددة لنفس المحتوى في واجهة المستخدم.

بالإضافة إلى ذلك، يجب تحديد اللغة كمتغير في المحادثة، حتى تتمكن الذكاء الاصطناعي من اكتشاف اللغة بدقة، ويتمكن مصممو المحادثات من بناء المنطق حول هذه اللغة.

وبالإضافة إلى الميزات الخاصة باللغة، لإنشاء روبوت دردشة ممتاز بأي لغة، يجب أن تكون الوظائف العامة لمنصة روبوت الدردشة قوية. هناك فئتان من الوظائف المهمة.

  • الأولى هي تقنية فهم اللغة الطبيعية بشكل عام (أو كما ذكرنا أعلاه، خوارزمية معالجة اللغة الطبيعية). المنصة ذات الأداء الجيد لن تكون فقط محايدة لغويًا، بل ستستخدم خوارزمية معالجة اللغة الطبيعية الأحدث وتعمل بكفاءة عالية. من المهم أن تتوفر في المنصة ميزات متعلقة بمعالجة اللغة الطبيعية، مثل ملء "الحقول" (معلومات يتم استخراجها من السياق لتكوين مجموعة بيانات بصيغة "مفتاح/قيمة") ومطابقة النية بناءً على سياق الحوار.
  • الفئة الثانية هي الوظائف العامة للمنصة. يجب أن تتيح للمصممين إنشاء تجارب روبوت دردشة مرضية للغاية للمستخدمين النهائيين بسهولة، بما في ذلك التكامل السهل مع الأنظمة القديمة وأنظمة الجهات الخارجية. إذا لم تكن هذه الوظائف متوفرة أو لم تكن سهلة الاستخدام، فلا يهم إذا كانت المنصة تدعم اللغة البرتغالية أم لا.

أخيرًا، جودة تجربة روبوت الدردشة التي يتم إنشاؤها للمستخدم النهائي مرتبطة مباشرة بقوة الأداة المستخدمة لإنشائها، بدءًا من فهم اللغة وصولًا إلى تصميم الواجهة الرسومية أو النصية.

بناء أفضل روبوت دردشة باللغة البرتغالية

حتى مع وجود منصة جيدة، لا تزال هناك تحديات في إنشاء روبوت دردشة باللغة البرتغالية. هناك عدد محدود من الدراسات باللغة البرتغالية في مجال الذكاء الاصطناعي، لذا قد يكون العثور على الموارد المناسبة للعمل على المشروع أمرًا صعبًا.

مع أنه ليس من الضروري إيجاد موارد لكتابة خوارزميات معالجة اللغة الطبيعية الأساسية، لأنها متوفرة مباشرة، إلا أن العثور على مصممين أكفاء يفهمون الفروق الاصطلاحية بين المجموعات المختلفة التي سيخدمها الروبوت قد يكون تحديًا. هذا صحيح بشكل خاص في حالة اللغة البرتغالية، نظرًا للاستخدام الواسع للتعبيرات الاصطلاحية المعتمدة على السياق.

لذلك، من المهم أن تتيح منصة روبوت الدردشة تحديث المحتوى والترجمات بسهولة من قبل غير التقنيين، لأن المصممين والمطورين قد لا يكونون على دراية بالجوانب الثقافية لمختلف أشكال اللغة البرتغالية.

وبالطبع، فإن تحسن دقة روبوتات الدردشة البرتغالية عالية الجودة يعني أن تبني هذه التقنية سيزداد في السنوات القادمة. هذا التبني المتزايد سيحل مشاكل نقص الموارد، ويسمح للمشترين المحتملين بفهم أفضل للممارسات المثلى لتحقيق أفضل النتائج.

الملخص

تُطبق الابتكارات في تقنيات معالجة اللغة الطبيعية ليس فقط على روبوتات الدردشة البرتغالية، بل أيضًا على تطبيقات الذكاء الاصطناعي الأخرى. نشهد الآن أنظمة متعددة الاستخدامات تستخدم الذكاء الاصطناعي باللغة البرتغالية بطرق متنوعة، من تحليل المشاعر في الأخبار والتعليقات، إلى تلخيص أو إنشاء نصوص كانت حكرًا على البشر. غالبًا ما يُستخدم روبوت الدردشة البرتغالي كواجهة مستخدم ليس فقط لتقنيات الذكاء الاصطناعي المختلفة، بل أيضًا لمساعدة المستخدمين النهائيين في استخدام أنظمة أخرى، مثل المواقع الإلكترونية أو تطبيقات الويب، أو حتى كمستشار للشراء أو اتخاذ القرار.

من الواضح أنه رغم التقدم الكبير في قوة معالجة اللغة الطبيعية باللغة البرتغالية، إلا أن النتائج يمكن أن تكون أفضل دائمًا. لا تزال الأبحاث مستمرة لتحسين محركات معالجة اللغة الطبيعية، ولا شك أن هناك المزيد من التطورات القادمة. حتى تصل معالجة اللغة الطبيعية إلى المستوى البشري، سيظل هناك عمل يجب القيام به.

الخطوة التالية لجميع محركات معالجة اللغة الطبيعية، بغض النظر عن اللغة، هي تحسين الأداء في الحوارات متعددة الجولات. هذا يعني تمكين الإنسان من إجراء محادثة متعددة الخطوات مع الروبوت في مجال موضوع محدد، وليس فقط إصدار أوامر أو طرح أسئلة. والخطوة التالية المتعلقة بمنصات روبوتات الدردشة هي تسهيل إنشاء حوارات متعددة الجولات.

الحوار متعدد الجولات مهم بشكل خاص لواجهات الصوت مثل Alexa أو أجهزة مثل Google Home.

ورغم أننا ناقشنا التقدم في تقطيع اللغة الموجه بالتعلم الآلي وتأثيراته على معالجة اللغة البرتغالية، إلا أن موضوعًا ذا صلة هو تحويل الكلام إلى نص باللغة البرتغالية. لا تزال تقنيات تحويل الكلام إلى نص للبرتغالية في طور التطور مقارنة بلغات أخرى – رغم أن الفجوة في الأداء تتقلص بسرعة. نأمل أن يساهم التقدم في معالجة اللغة الطبيعية الموضح هنا والذي يحدث حول العالم في تقليص هذه الفجوة أكثر في المستقبل القريب.