تجارب الشطرنج من Google تكشف عن كيفية تعزيز قوة الذكاء الاصطناعي

قررت مجموعته معرفة ذلك. لقد قاموا ببناء الإصدار الجديد والمتنوع من AlphaZero، والذي يتضمن أنظمة ذكاء اصطناعي متعددة تدربت بشكل مستقل وعلى مجموعة متنوعة من المواقف. وقال زاهافي إن الخوارزمية التي تحكم النظام الشامل تعمل كنوع من الخاطبة الافتراضية: وهي مصممة لتحديد الوكيل الذي لديه أفضل فرصة للنجاح عندما يحين وقت التحرك. كما قام هو وزملاؤه أيضًا بترميز “مكافأة التنوع” – وهي مكافأة للنظام كلما قام بسحب الاستراتيجيات من مجموعة كبيرة من الخيارات.

عندما تم إطلاق النظام الجديد للعب ألعابه الخاصة، لاحظ الفريق الكثير من التنوع. قام لاعب الذكاء الاصطناعي المتنوع بتجربة افتتاحيات جديدة وفعالة وقرارات جديدة – ولكن سليمة – حول استراتيجيات محددة، مثل متى وأين يجب التوقف. في معظم المباريات، هزم ألفا زيرو الأصلي. ووجد الفريق أيضًا أن النسخة المتنوعة يمكن أن تحل ضعف عدد ألغاز التحدي مثل النسخة الأصلية ويمكنها حل أكثر من نصف إجمالي كتالوج ألغاز بنروز.

“الفكرة هي أنه بدلاً من إيجاد حل واحد، أو سياسة واحدة، من شأنها أن تتغلب على أي لاعب هنا [it uses] قال كولي: “فكرة التنوع الإبداعي”.

وقال زاهافي إنه مع إمكانية الوصول إلى المزيد من الألعاب المختلفة، أصبح لدى AlphaZero المتنوع المزيد من الخيارات للمواقف الصعبة عند ظهورها. وقال: “إذا كان بإمكانك التحكم في نوع الألعاب التي تراها، فإنك تتحكم بشكل أساسي في كيفية تعميمها”. يمكن أن تصبح تلك المكافآت الجوهرية الغريبة (والحركات المرتبطة بها) نقاط قوة للسلوكيات المتنوعة. ومن ثم يمكن للنظام أن يتعلم كيفية تقييم وتقدير الأساليب المتباينة ومعرفة متى كانت أكثر نجاحًا. لقد وجدنا أن هذه المجموعة من العملاء يمكنها بالفعل التوصل إلى اتفاق بشأن هذه المواقف”.

والأهم من ذلك أن العواقب تمتد إلى ما هو أبعد من لعبة الشطرنج.

الإبداع في الحياة الواقعية

وقال كولي إن النهج المتنوع يمكن أن يساعد أي نظام للذكاء الاصطناعي، وليس فقط تلك القائمة على التعلم المعزز. لقد استخدم التنوع منذ فترة طويلة لتدريب الأنظمة الفيزيائية، بما في ذلك أ روبوت ذو ستة أرجل الذي سمح له باستكشاف أنواع مختلفة من الحركة، قبل أن “يجرحها” عمداً، مما يسمح له بمواصلة الحركة باستخدام بعض التقنيات التي طورها من قبل. “كنا نحاول فقط إيجاد حلول مختلفة عن جميع الحلول السابقة التي وجدناها حتى الآن.” وفي الآونة الأخيرة، كان يتعاون أيضًا مع الباحثين لاستخدام التنوع لتحديد المرشحين الواعدين للأدوية الجديدة وتطوير استراتيجيات فعالة لتداول الأسهم.

وقال كولي: “الهدف هو توليد مجموعة كبيرة من الآلاف من الحلول المختلفة، حيث يكون كل حل مختلفًا تمامًا عن الآخر”. لذا – تمامًا كما تعلم لاعب الشطرنج المتنوع أن يفعل – لكل نوع من المشكلات، يمكن للنظام بأكمله اختيار أفضل حل ممكن. وقال إن نظام الذكاء الاصطناعي الخاص بزاهافي يُظهر بوضوح كيف أن “البحث عن استراتيجيات متنوعة يساعد على التفكير خارج الصندوق وإيجاد الحلول”.

ويعتقد زاهافي أنه لكي تفكر أنظمة الذكاء الاصطناعي بشكل إبداعي، يتعين على الباحثين ببساطة أن يدفعوها إلى التفكير في المزيد من الخيارات. تشير هذه الفرضية إلى وجود علاقة غريبة بين البشر والآلات: ربما يكون الذكاء مجرد مسألة قوة حسابية. بالنسبة لنظام الذكاء الاصطناعي، ربما يتلخص الإبداع في القدرة على التفكير والاختيار من بين مجموعة كبيرة بما يكفي من الخيارات. ومع حصول النظام على مكافآت لاختيار مجموعة متنوعة من الاستراتيجيات المثلى، يتم تعزيز وتقوية هذا النوع من الحل الإبداعي للمشكلات. في نهاية المطاف، من الناحية النظرية، يمكن أن تحاكي أي نوع من استراتيجية حل المشكلات المعترف بها باعتبارها استراتيجية إبداعية لدى البشر. الإبداع سيصبح مشكلة حسابية.

وأشار ليمهيتشارات إلى أنه من غير المرجح أن يحل نظام الذكاء الاصطناعي المتنوع مشكلة التعميم الأوسع في التعلم الآلي بشكل كامل. لكنها خطوة في الاتجاه الصحيح. وقالت: “إنها تخفف من أحد أوجه القصور”.

وبشكل عملي أكثر، تتوافق نتائج زاهافي مع الجهود الأخيرة التي تظهر كيف يمكن للتعاون أن يؤدي إلى أداء أفضل في المهام الصعبة بين البشر. معظم الأغاني الناجحة في قائمة بيلبورد 100 كتبها فرق من مؤلفي الأغاني، على سبيل المثال، وليس الأفراد. ولا يزال هناك مجال للتحسين. يعد النهج المتنوع حاليًا مكلفًا من الناحية الحسابية، لأنه يجب أن يأخذ في الاعتبار الكثير من الاحتمالات أكثر من النظام النموذجي. كما أن زاهافي ليس مقتنعًا بأنه حتى AlphaZero المتنوع يلتقط نطاقًا كاملاً من الاحتمالات.

“مازلت [think] هناك مجال لإيجاد حلول مختلفة”. “ليس من الواضح بالنسبة لي أنه في ضوء جميع البيانات الموجودة في العالم، هناك [only] إجابة واحدة لكل سؤال.”

القصة الأصلية أعيد طبعها بإذن من مجلة كوانتا, منشور تحريري مستقل لـ مؤسسة سيمونز وتتمثل مهمتها في تعزيز الفهم العام للعلم من خلال تغطية التطورات والاتجاهات البحثية في الرياضيات والعلوم الفيزيائية والحياة.

اقرأ أكثر

تجارب الشطرنج من Google تكشف عن كيفية تعزيز قوة الذكاء الاصطناعي

Reactions

ردود الفعل