ما هو اختبار تورينج وكيف يعمل؟
اختبار تورينج هو اختبار الذكاء الاصطناعي لمعرفة ما إذا كان الكمبيوتر ، من خلال محادثة دردشة ، يمكنه إقناع الإنسان بأنه إنسان. يطلب من الإنسان أن يحكم على ما إذا كان "الشخص" الذي يتحدث إليه إنسانا أم كمبيوترا. إذا حكموا أنهم يتحدثون إلى إنسان ولكنهم يتحدثون بالفعل إلى جهاز كمبيوتر ، فقد اجتاز الكمبيوتر اختبار تورينج.
في الأساس ، إنه اختبار لتقييم ما إذا كان الكمبيوتر يمكنه تقليد الإنسان بشكل مقنع لدرجة أنه يمكن أن يخدع الإنسان للاعتقاد بأنه يتحدث إلى إنسان. بالطبع ، هناك العديد من الأشياء التي يجب تفريغها حول هذا الاختبار.
ما الهدف من اختبار تورينج؟
قد يبدو هذا سؤالا غريبا لأن النقطة تبدو واضحة: معرفة ما إذا كانت الآلة يمكنها تقليد الإنسان بشكل مقنع في محادثة دردشة. ومع ذلك ، هناك بعض الاعتبارات الأعمق.
هل نختبر ما إذا كانت الآلة قادرة على تقليد الإنسان حقا من حيث الفكر الأساسي أو الذكاء أو مجرد خداع الإنسان بأنه إنسان؟ هناك فرق.
إن تقليد البشر من حيث الفكر الأساسي أو الذكاء هو ما يفكر فيه الناس عادة عندما يفكرون في اختبار تورينج - أن البشر غير قادرين حقا على معرفة الفرق بين الدردشة مع الإنسان أو الآلة. لم تكن هذه في الواقع الطريقة التي تم بها تصور الاختبار في البداية لأنه كان مسموحا به "خداع" البشر. على سبيل المثال ، قد يكون إجراء الأخطاء المطبعية وسيلة للكمبيوتر لخداع الإنسان للاعتقاد بأنه بشري لأن الآلة لن ترتكب خطأ إملائيا أبدا.
المشكلة الأساسية هي أن الاختبارات لها قواعد وبالتالي فهي معيبة حتما في بعض النواحي. على سبيل المثال ، المدة التي تتحدث فيها عن موضوع الاختبار. من الأسهل تقليد إنسان أكثر من 5 دقائق من أكثر من مائة ساعة من المحادثة. قد تعمل الحيل على إصدار 5 دقائق ولكن ليس على إصدار المائة ساعة.
هل يهم من يقوم بإجراء اختبار تورينج؟
إن العالم الذي يتدرب على كيفية اكتشاف الآلات مقابل البشر سيكون أصعب بكثير في خداعه من شخص خارج الشارع بدون تدريب - ليس فقط بسبب قدرة العالم على تقييم الإجابات ولكن أيضا بسبب معرفة الأسئلة التي يجب طرحها.
حتى لو كان الكمبيوتر يتمتع بمستوى من "التفكير" والذكاء على مستوى الإنسان ، فقد لا يكون ذلك كافيا لخداع المختبر. وذلك لأن الكمبيوتر يمكن أن يكون مثاليا جدا أو غير عاطفي للغاية في استجاباته.
حتى أن هناك اعتبارات فلسفية حول اختبار تورينج مثل ما إذا كانت أجهزة الكمبيوتر تصل إلى ذكاء معمم على مستوى الإنسان ، فهذا يعني أن الآلات يمكنها "التفكير" أو الوعي. كان هذا جزئيا سؤالا كان آلان تورينج يحاول تجاوزه بهذا الاختبار. إذا تمكنت الآلة من تقليد الإنسان بدقة ، فعندئذ لجميع المقاصد والأغراض فهي "تفكر".
بالطبع ، هذا لا يعني أن لديه وعيا أو أنه يفكر بنفس الطريقة التي يفكر بها الإنسان. في الواقع ، من المؤكد أنه لا يفكر بالطريقة التي يفكر بها البشر. يكمن الاهتمام الحقيقي بهذا السؤال عند النظر إليه من وجهة نظر عملية. الطائرات تطير ، على سبيل المثال. هذا هو المهم. إنه أقل إثارة للاهتمام أنهم لا يقلدون الطيور بالطريقة التي يطيرون بها.
يهتم اختبار تورينج بالنتائج ، وليس بالطريقة التي يتم بها تحقيق النتائج.
النقطة الأكثر أهمية هي أن اختبار تورينج يفهم بشكل عام على أنه يصف حالة وصل فيها ذكاء الآلة إلى مستوى الذكاء البشري على الأقل. إنها مجموعة أصغر بكثير مهتمة بمسألة ما إذا كانت الآلة قد اجتازت تقنيا اختبار تورينج مع الأخذ في الاعتبار جميع العيوب الموضحة أعلاه.
في حين أن اجتياز اختبار تورينج يمكن أن يكون إنجازا تقنيا مثيرا للإعجاب ، خاصة إذا كان الاختبار طويل الأمد ويديره أشخاص مطلعون ، إلا أنه أقل إثارة للإعجاب من الآلة التي يمكن أن تخدع جميع الناس طوال الوقت. بالطبع كلما طالت الفترة الزمنية التي يتم خلالها إجراء الاختبار وكلما ارتفع مستوى خبرة المقيمين ، زاد احتمال تقارب هذين السيناريوهين.
هل نحن بالقرب من جهاز كمبيوتر يجتاز اختبار تورينج؟
الآن بعد أن فهمت ما هو الاختبار ، يجب أن يكون السؤال التالي "هل نحن في أي مكان بالقرب من جهاز كمبيوتر يجتاز الاختبار؟" (أي تحقيق الذكاء البشري المعمم). الجواب القصير هو "لا".
في حين كان هناك تقدم هائل في معالجة اللغة الطبيعية وهي قدرة الكمبيوتر على تحديد النية وراء عبارة منطوقة واحدة (وهي التكنولوجيا التي تقود جميع المساعدين الصوتيين) ، فإننا بعيدون جدا عن الذكاء المعمم على مستوى الإنسان.
اتضح أن التكنولوجيا الحالية ليست جيدة جدا في الغموض (فهم المعنى الكامن وراء البيانات الغامضة) ، أو الذاكرة (دمج الحقائق المذكورة سابقا في المحادثة الحالية) أو السياق (مراعاة الحقائق غير المعلنة ولكنها ذات صلة بالوضع الحالي). باختصار ، التكنولوجيا الحالية ليست قريبة تقريبا من حيث ما هو مطلوب.
جزء من المشكلة هو الذكاء الاصطناعي التكنولوجيا الحالية تحتاج إلى التعلم باستخدام كميات هائلة من البيانات. أي مجال يتوفر فيه قدر هائل من البيانات المتكررة جاهز لإدخال الذكاء الاصطناعي ، على سبيل المثال التعرف على الكلام ومعالجة الصور بما في ذلك السيارات ذاتية القيادة.
النجاح في البرمجة اللغوية العصبية مدفوع بحقيقة أن هناك بيانات غير محدودة تقريبا للبيانات والأسئلة لمرة واحدة بدون سياق أو بدون ذاكرة. إذا قلت "أريد شراء اللون البرتقالي" ، فهذا في معظم الحالات عبارة بسيطة لا تحتاج إلى معلومات إضافية حول السياق أو الذاكرة لفهمها. القصد من ذلك: "شراء عصير البرتقال".
عندما يكون هناك سياق أو ذاكرة متضمنة ، فإن هذا يخلق الأبعاد. إذا قلت إنني أريد "شراء عصير البرتقال" ولكني أخبرتك سابقا أنني تاجر مالي يتاجر في عصير البرتقال ، فأنت بحاجة إلى فهم أنني في هذا السياق أريد شراء أداة مالية من شأنها أن تجني المال إذا ارتفع سعر عصير البرتقال .
إذن الآن كيف تبدو بياناتنا؟ "شراء عصير البرتقال" يعني: شراء زجاجة من عصير البرتقال من المتجر أو إذا كان قد ذكر سابقا أنه تاجر مالي في عصير البرتقال ، فهذا يعني أنه يريد شراء أداة مالية مرتبطة بسعر عصير البرتقال .
ماذا لو قال متداولنا المالي للتو إنه عطشان ، فهذا يعني أنه يريد شراء زجاجة من عصير البرتقال من المتجر. لذلك نضيف نقطة بيانات أخرى: أو إذا ذكر سابقا أنه تاجر مالي في عصير البرتقال ولكنهم ذكروا مؤخرا أنهم عطشى ، فهذا يعني أنهم يريدون شراء زجاجة من عصير البرتقال.
ستواجه المؤسسة المالية مشاكل بسرعة إذا أطلقت روبوت تداول يعتقد المستخدمون أنه يتمتع ب "ذكاء" على المستوى البشري.
هل اجتياز اختبار تورينج مستحيل؟
بيانات المحادثة لها أبعاد عديدة ، للأسف. أبعاد لا نهائية. هذا يعني أن خوارزميات التعلم الآلي ستحتاج إلى الوصول إلى مجموعة بيانات تحتوي على كميات كبيرة من البيانات لكل بعد ممكن ، وهذا بالطبع مستحيل.
هذا لا يعني بالطبع أن اجتياز اختبار تورينج أمر مستحيل. نحن نعلم أنه ممكن لأن لدينا بالفعل التكنولوجيا للقيام بذلك ، في أدمغتنا. تماما مثل الناس منذ مئات السنين عرفوا أن الطيران كان ممكنا من خلال مراقبة الطيور التي تطير.
المشكلة هي أن نهجنا في الذكاء الاصطناعي في هذا لا يمكن أن يبنى على البيانات الضخمة لأن البيانات الضخمة ذات الأبعاد الكافية غير موجودة. هناك ببساطة الكثير من المتغيرات ، الكثير من الأبعاد. حتى ونحن نتحدث ، تحصل Google على 800 مليون عملية بحث يوميا لم تشهدها من قبل. يمنحك ذلك فكرة عن مدى صعوبة نهج البيانات.
يتبع راي كورتزويل من Google نهجا يحاول إلى حد ما تكرار الدماغ البشري. لقد قدر أننا سنصل إلى ذكاء معمم وسنكون قادرين على اجتياز اختبار تورينج الصعب للغاية بحلول عام 2029.
تستند توقعاته إلى افتراض أن التقدم في هذا المجال سيكون أسيا ، وبالتالي فإن التقدم المتواضع نسبيا اليوم أكثر أهمية بكثير مما يبدو إذا افترضنا أننا نسير على مسار أسي من التقدم.
سواء كان على حق ، فسيتعين علينا الانتظار ونرى ، ولكن ما يخبرك به هو أنه من غير المرجح أن يحدث الاختراق في السنوات ال 10 القادمة.
ماذا يعني أن تجتاز الآلة اختبار تورينج موثوقا به؟
النقطة الأخيرة هي ماذا يعني إذا اجتازت الآلة اختبار تورينج ذي مصداقية. إذا اجتازت الآلة الاختبار باستخدام نوع من أساليب البيانات الضخمة ، بطريقة مماثلة للطريقة التي تتغلب بها الآلات على البشر في ألعاب الطاولة ، حتى المتطورة منها ، فإن الآثار المترتبة لن تكون كبيرة كما لو اجتازتها الآلة باستخدام نهج تكرار الدماغ.
يعني نهج تكرار الدماغ أن الآلة من المرجح أن تكون أقرب إلى "التفكير" بالطريقة التي نعرف بها التفكير كبشر. يمكن أن يستنبط المعنى من الحد الأدنى من الأمثلة بالطريقة التي يفعلها البشر ، بدلا من الحاجة إلى مئات الأمثلة على الحالة الدقيقة لاستقراء المعنى.
كما ذكر أعلاه ، من المرجح أن يوفر نهج "تكرار الدماغ" اختراقا لأن نهج البيانات الضخمة غير ممكن. هذا يعني على الأرجح أن الآلات كانت ستحقق ذكاء عاما ، ليس فقط في المحادثة ، ولكن في مجالات متعددة.
لا يمكن المبالغة في الآثار المترتبة على ذلك لأن هذا من المحتمل أن يؤدي إلى إعادة ضبط كاملة للمجتمع. هذا صحيح بشكل خاص إذا كانت الآلات لديها القدرة على تحسين نفسها بطرق ذات مغزى مما سيؤدي إلى إمكانية زيادة هائلة في ذكائها في دائرة فاضلة من شأنها أن تغير الحياة كما نعرفها.
تفاعل البشر مع الآلات
بالتمسك بأمور أكثر دنيوية ، يجدر بنا أن نضع في اعتبارنا أنه حتى لو كانت الآلة مكافئة للإنسان ، فإن هذا لا يعني أننا سنتفاعل معها كما نفعل مع البشر. هذا هو بالضبط نفس الشيء كما هو الحال مع الإنسان. التفاعل مع البشر ليس دائما فعالا. قد تكون محاولة شرح كيفية القيام بشيء ما عبر الهاتف لزميلك مملة وغير فعالة في المواقف التي يكون فيها من الأسهل توضيح كيفية القيام بذلك. لو كان لدى البشر واجهة رسومية متاحة عبر الويب!
من الواضح أن الواجهات الصوتية (أو الواجهات القائمة على الدردشة) لها قيود من حيث إدخال المعلومات أو إخراجها. من الواضح أن هناك قيودا ومواقف يكون فيها عرض المعلومات بيانيا أو النقر على واجهة رسومية أكثر كفاءة من استخدام واجهة صوتية. لذلك تم تصميم منصات الروبوت لمحاولة إعادة المستخدم دائما إلى المسار السعيد وعدم السماح للمحادثة بالتعرج.
وجهة نظري أيضا هي أن أجهزة الكمبيوتر ليست محدودة مثل البشر من حيث الواجهات التي يمكنهم استخدامها لتلقي المعلومات أو توفيرها ، وبالتالي فإن المحادثات مع الآلات ستتضمن بالضرورة استخدام الواجهة المثلى للمهمة المطروحة.
في حين أن اجتياز اختبار تورينج سيكون معلما كبيرا من حيث التفاعل بين الإنسان / الكمبيوتر ، فإن "المحادثات" الفعلية بين الإنسان / الكمبيوتر لن تقتصر على الصوت والنص فقط.
جدول المحتويات
ابق على اطلاع دائم بأحدث ما توصل إليه وكلاء الذكاء الاصطناعي
شارك هذا على: