- اختبار تورينج هو طريقة اقترحها آلان تورينج لمعرفة ما إذا كان بإمكان الآلة تقليد المحادثة البشرية بشكل جيد لدرجة أن الشخص لا يستطيع التمييز بين التحدث مع إنسان أو مع حاسوب.
- بدلاً من إثبات أن الآلة "تفكر" مثل الإنسان، يختبر هذا الاختبار ما إذا كان بإمكانها تقليد السلوك البشري بشكل مقنع من خلال الحوار، وأحياناً باستخدام حيل مثل الأخطاء الإملائية أو الأسلوب العفوي في الكلام.
- اجتياز اختبار تورينج لا يعني بالضرورة أن الآلة لديها وعي؛ بل يدل فقط على قدرتها على تقليد المحادثة البشرية بشكل مقنع، مما يثير النقاشات حول الذكاء وما يعنيه "التفكير".
ما هو اختبار تورينج وكيف يعمل؟
اختبار تورينج هو اختبار للذكاء الاصطناعي يهدف إلى معرفة ما إذا كان بإمكان الكمبيوتر، من خلال محادثة نصية، إقناع الإنسان بأنه إنسان. يُطلب من الإنسان أن يحدد ما إذا كان "الشخص" الذي يتحدث إليه إنسانًا أم كمبيوترًا. إذا اعتقد أنه يتحدث إلى إنسان بينما هو في الواقع يتحدث إلى كمبيوتر، يكون الكمبيوتر قد اجتاز اختبار تورينج.
ببساطة، هو اختبار لتقييم ما إذا كان بإمكان الحاسوب تقليد الإنسان بشكل مقنع لدرجة أنه يستطيع خداع الإنسان ليعتقد أنه يتحدث مع إنسان آخر. بالطبع، هناك العديد من التفاصيل التي يجب مناقشتها حول هذا الاختبار.
ما الهدف من اختبار تورينج؟
قد يبدو هذا السؤال غريباً لأن الهدف يبدو واضحاً: معرفة ما إذا كان بإمكان الآلة تقليد الإنسان بشكل مقنع في محادثة نصية. ومع ذلك، هناك اعتبارات أعمق.
هل نختبر ما إذا كان بإمكان الآلة تقليد الإنسان فعلاً من حيث التفكير أو الذكاء الأساسي، أم فقط خداع الإنسان ليعتقد أنها إنسان؟ هناك فرق بين الأمرين.
تقليد البشر من حيث التفكير أو الذكاء الأساسي هو ما يتبادر إلى أذهان الناس عادة عند الحديث عن اختبار تورينج – أي أن البشر فعلاً لا يستطيعون التمييز بين التحدث مع إنسان أو آلة. في الواقع، لم يكن هذا هو المفهوم الأصلي للاختبار، لأن "خداع" البشر كان مسموحاً. على سبيل المثال، قد يكون ارتكاب الأخطاء الإملائية وسيلة للكمبيوتر لخداع الإنسان ليعتقد أنه يتحدث مع إنسان، لأن الآلة عادة لا تخطئ في الكتابة.
المشكلة الأساسية أن الاختبارات لها قواعد، وبالتالي فهي معرّضة للقصور بطرق معينة. على سبيل المثال، مدة المحادثة مع موضوع الاختبار مهمة. فمن الأسهل تقليد الإنسان خلال 5 دقائق مقارنة بمحادثة تستمر مئة ساعة. قد تنجح الحيل في النسخة القصيرة، لكنها لا تنجح في النسخة الطويلة.
هل يهم من يقوم بإجراء اختبار تورينج؟
العالم المتخصص في تمييز الآلات عن البشر سيكون من الصعب خداعه أكثر من شخص عادي بلا تدريب – ليس فقط بسبب قدرة العالم على تقييم الإجابات، بل أيضاً بسبب معرفته بالأسئلة التي يجب طرحها.
حتى لو امتلك الحاسوب مستوى من "التفكير" والذكاء يوازي الإنسان، قد لا يكون ذلك كافياً لخداع المختبر. ذلك لأن الحاسوب قد يكون مثالياً جداً أو يفتقر للعاطفة في ردوده.
هناك أيضاً اعتبارات فلسفية حول اختبار تورينج، مثل ما إذا كان وصول الحواسيب إلى ذكاء عام بمستوى الإنسان يعني أن الآلات تستطيع "التفكير" أو أنها واعية. كان هذا جزئياً سؤالاً حاول آلان تورينج تجاوزه بهذا الاختبار. فإذا استطاعت الآلة تقليد الإنسان بدقة، فهي عملياً "تفكر".
بالطبع، هذا لا يعني أن لديها وعيًا أو أنها تفكر بنفس طريقة تفكير الإنسان. في الواقع، من المؤكد أنها لا تفكر كما يفكر البشر. تكمن الأهمية الحقيقية لهذا السؤال عند النظر إليه من منظور عملي. الطائرات تطير، على سبيل المثال. هذا هو المهم. أما أنها لا تقلد الطيور في طريقة طيرانها فهذا أقل أهمية بكثير.
اختبار تورينج يهتم بالنتائج، وليس بطريقة تحقيق هذه النتائج.
النقطة الأهم أن اختبار تورينج يُفهم عموماً على أنه يصف حالة وصلت فيها ذكاء الآلة إلى مستوى ذكاء الإنسان على الأقل. هناك مجموعة أصغر تهتم بالسؤال التقني حول ما إذا كانت الآلة قد اجتازت اختبار تورينج فعلياً مع كل العيوب المذكورة أعلاه.
بينما قد يكون اجتياز اختبار تورينج إنجازاً تقنياً مثيراً للإعجاب، خاصة إذا كان الاختبار طويل الأمد ويجريه أشخاص ذوو خبرة، إلا أنه أقل إثارة للإعجاب من آلة تستطيع خداع جميع الناس طوال الوقت. وبالطبع، كلما طالت مدة الاختبار وارتفع مستوى خبرة المقيمين، زادت احتمالية تقارب هذين السيناريوهين.
هل نحن قريبون من أن تجتاز الحواسيب اختبار تورينج؟
الآن بعد أن فهمت ما هو الاختبار، لا بد أن السؤال التالي هو "هل نحن قريبون من أن تجتاز الحواسيب هذا الاختبار؟" (أي تحقيق ذكاء بشري عام). الجواب المختصر هو "لا".
على الرغم من التقدم الكبير في معالجة اللغة الطبيعية، وهي قدرة الحاسوب على تحديد النية من عبارة منطوقة واحدة (وهي التقنية التي تعتمد عليها جميع المساعدات الصوتية)، إلا أننا ما زلنا بعيدين جداً عن ذكاء عام بمستوى الإنسان.
اتضح أن التقنية الحالية ليست جيدة في التعامل مع الغموض (فهم المعنى خلف العبارات الغامضة)، أو الذاكرة (دمج المعلومات السابقة في المحادثة الحالية)، أو السياق (أخذ الحقائق غير المصرح بها ولكنها ذات صلة بالحسبان). باختصار، التقنية الحالية بعيدة جداً عما هو مطلوب.
جزء من المشكلة أن تقنيات الذكاء الاصطناعي الحالية تحتاج إلى التعلم باستخدام كميات هائلة من البيانات. أي مجال تتوفر فيه بيانات متكررة بكثرة يكون مناسباً لإدخال الذكاء الاصطناعي، مثل التعرف على الكلام ومعالجة الصور بما في ذلك السيارات ذاتية القيادة.
يعتمد النجاح في معالجة اللغة الطبيعية على توفر بيانات غير محدودة تقريبًا للعبارات والأسئلة الفردية التي لا سياق لها ولا ذاكرة. إذا قلت "أريد شراء عصير البرتقال"، ففي معظم الحالات تكون عبارة بسيطة لا تحتاج إلى معلومات إضافية عن السياق أو الذاكرة لفهمها. النية هي: "شراء عصير البرتقال".
عندما يكون هناك سياق أو ذاكرة، يصبح الأمر أكثر تعقيداً. إذا قلت أريد "شراء عصير برتقال" لكنني أخبرتك سابقاً أنني متداول مالي أتعامل في عصير البرتقال، فعليك أن تدرك أنني في هذا السياق أريد شراء أداة مالية تحقق أرباحاً إذا ارتفع سعر عصير البرتقال.
فكيف تبدو بياناتنا الآن؟ "شراء عصير برتقال" تعني: شراء زجاجة عصير برتقال من المتجر أو إذا سبق أن ذكر أنه متداول مالي في عصير البرتقال، فهذا يعني أنه يريد شراء أداة مالية مرتبطة بسعر عصير البرتقال.
ماذا لو قال المتداول المالي للتو إنه عطشان؟ عندها يقصد أنه يريد شراء زجاجة عصير برتقال من المتجر. إذن نضيف نقطة بيانات أخرى: أو إذا سبق أن ذكر أنه متداول مالي في عصير البرتقال لكنه ذكر مؤخراً أنه عطشان، فهذا يعني أنه يريد شراء زجاجة عصير برتقال.
أي مؤسسة مالية ستواجه مشاكل بسرعة إذا أطلقت روبوت تداول يعتقد المستخدمون أنه يمتلك "ذكاء" بمستوى الإنسان.
هل اجتياز اختبار تورينج أمر مستحيل؟
بيانات المحادثة متعددة الأبعاد، للأسف. أبعاد لا نهائية. هذا يعني أن خوارزميات التعلم الآلي ستحتاج إلى الوصول إلى مجموعة بيانات ضخمة لكل بعد ممكن، وهذا بالطبع مستحيل.
هذا لا يعني بالطبع أن اجتياز اختبار تورينج مستحيل. نحن نعلم أنه ممكن لأن لدينا بالفعل التقنية اللازمة لذلك في أدمغتنا. تماماً كما كان الناس قبل مئات السنين يعلمون أن الطيران ممكن من خلال مراقبة الطيور.
المشكلة أن منهجنا الحالي في الذكاء الاصطناعي لا يمكن أن يعتمد على البيانات الضخمة، لأن البيانات الضخمة ذات الأبعاد الكافية غير متوفرة. هناك ببساطة الكثير من المتغيرات، والكثير من الأبعاد. حتى الآن، تحصل Google يومياً على 800 مليون عملية بحث لم ترها من قبل. هذا يعطيك فكرة عن مدى صعوبة الاعتماد على البيانات فقط.
راي كورزويل في Google يتبع منهجاً يحاول إلى حد ما محاكاة الدماغ البشري. وقد قدّر أننا سنصل إلى الذكاء العام ونتمكن من اجتياز اختبار تورينج صعب جداً بحلول عام 2029.
تستند توقعاته إلى افتراض أن التقدم في هذا المجال سيكون أُسّياً، وبالتالي حتى التقدم المتواضع نسبياً اليوم أكثر أهمية بكثير مما يبدو إذا افترضنا أننا نسير على مسار تقدّم أُسّي.
سواء كان محقاً أم لا، سيتعين علينا الانتظار لنرى، لكن ما يخبرك به هو أنه من غير المرجح جداً أن يحدث الاختراق خلال السنوات العشر القادمة.
ماذا يعني أن تجتاز آلة اختبار تورينغ بشكل موثوق؟
النقطة الأخيرة هي: ماذا يعني إذا اجتازت آلة اختبار تورينغ بشكل موثوق؟ إذا اجتازت الآلة الاختبار باستخدام بعض أساليب البيانات الضخمة، بطريقة مشابهة للطريقة التي تغلبت بها الآلات على البشر في ألعاب الطاولة، حتى المتقدمة منها، فلن تكون الآثار كبيرة كما لو اجتازته باستخدام نهج استنساخ الدماغ.
نهج استنساخ الدماغ يعني أن الآلة ستكون أقرب إلى "التفكير" بالطريقة التي نعرّف بها التفكير كبشر. سيكون بإمكانها استنتاج المعنى من أمثلة قليلة كما يفعل البشر، بدلاً من الحاجة إلى مئات الأمثلة للحالة نفسها لاستنتاج المعنى.
كما ذُكر أعلاه، من المرجح أن يوفر نهج "استنساخ الدماغ" الاختراق المطلوب، إذ أن نهج البيانات الضخمة غير ممكن. وهذا يعني على الأرجح أن الآلات ستحقق ذكاءً عاماً، ليس فقط في المحادثة، بل في مجالات متعددة.
لا يمكن التقليل من أهمية هذا الأمر، إذ من المحتمل أن يؤدي إلى إعادة تشكيل كاملة للمجتمع. ويزداد ذلك أهمية إذا كانت لدى الآلات القدرة على تحسين نفسها بطرق فعّالة، مما سيؤدي إلى إمكانية زيادة ذكائها بشكل أُسّي في دائرة فاضلة ستغير الحياة كما نعرفها.
تفاعل البشر مع الآلات
بالانتقال إلى أمور أكثر واقعية، من الجدير بالذكر أنه حتى لو كانت الآلة مكافئة للإنسان، فهذا لا يعني أننا سنتفاعل معها كما نفعل مع البشر. هذا ينطبق أيضاً على البشر أنفسهم؛ فالتفاعل مع البشر ليس دائماً فعالاً. محاولة شرح كيفية القيام بشيء ما لزميلك عبر الهاتف قد تكون مملة وغير فعالة في مواقف يكون من الأسهل فيها عرض ذلك عملياً. لو كان لدى البشر فقط واجهة رسومية متاحة عبر الإنترنت!
لذلك تم تصميم منصات البوت دائماً لمحاولة إعادة المستخدم إلى المسار الصحيح وعدم السماح للمحادثة بالتشعب.
وجهة نظري أيضاً أن الحواسيب ليست محدودة مثل البشر من حيث الواجهات التي يمكنها استخدامها لاستقبال أو تقديم المعلومات، وبالتالي فإن المحادثات مع الآلات ستتضمن بالضرورة استخدام الواجهة المثلى للمهمة المطلوبة.
بينما سيكون اجتياز اختبار تورينغ إنجازاً كبيراً في مجال التفاعل بين الإنسان والحاسوب، إلا أن "المحادثات" الفعلية بين الإنسان والحاسوب لن تقتصر فقط على الصوت والنص.
الأسئلة الشائعة
كيف يقارن اختبار تورينغ بمعايير أخرى للذكاء الاصطناعي مثل تحدي وينوغراد أو تحدي ARC؟
يختبر اختبار تورينغ ما إذا كان الذكاء الاصطناعي يمكنه تقليد المحادثة البشرية، لكن المعايير الأحدث مثل تحدي وينوغراد وتحدي ARC تركز أكثر على الاستدلال والمنطق السليم وحل المشكلات. هذه أمور تكشف عن ذكاء أعمق بدلاً من التقليد السطحي.
هل لا يزال اختبار تورينغ يعتبر ذا صلة في أبحاث الذكاء الاصطناعي الحديثة، أم أن هناك بدائل أفضل اليوم؟
لا يزال اختبار تورينغ تجربة فكرية مفيدة ومحطة مهمة، لكن العديد من الباحثين يرونه الآن قديماً. تركز الاختبارات الحديثة أكثر على قياس الفهم الفعلي والمنطق والقدرة على التعميم.
كيف تؤثر التحيزات الثقافية أو اللغوية على نتائج اختبار تورينغ؟
نعم. يمكن أن يسيء الذكاء الاصطناعي فهم التعابير أو الفكاهة أو الإشارات المرتبطة بثقافات أو لغات معينة، مما يسهل اكتشافه كغير بشري في سياقات معينة.
كيف سيعيد اجتياز اختبار تورينغ تعريف معنى أن تكون "إنساناً"؟
إذا اجتازت آلة اختبار تورينغ بشكل صارم، فقد يجبرنا ذلك على إعادة التفكير فيما إذا كانت الإنسانية تتعلق بالبيولوجيا أم بالسلوك، وما الذي يجعل طريقة تفكيرنا فريدة بالفعل.
ما أنواع الأسئلة التي تكون عادةً الأكثر فعالية في كشف الصفات غير البشرية في الذكاء الاصطناعي؟
الأسئلة التي تعتمد على السياق أو الفروق العاطفية أو المنطق السليم في الحياة الواقعية، مثل تفسير السخرية أو الإشارات الغامضة أو المعلومات المتضاربة، غالباً ما تكون أسرع طريقة لاكتشاف الذكاء الاصطناعي.





.webp)
