تكنولوجيا
يقول Google DeepMind إن الذكاء الاصطناعي القادر على التغلب على البشر في مجموعة متنوعة من الألعاب يعد خطوة مهمة نحو ذكاء أكثر عمومية
بواسطة ماثيو سباركس
يستطيع ذكاء اصطناعي واحد التغلب على اللاعبين البشريين في لعبة الشطرنج والجو والبوكر وغيرها من الألعاب التي تتطلب مجموعة متنوعة من الاستراتيجيات للفوز. تم إنشاء الذكاء الاصطناعي، المسمى Student of Games، بواسطة Google DeepMind، والذي يقول إنه خطوة نحو ذكاء اصطناعي عام قادر على تنفيذ أي مهمة بأداء خارق.
مارتن شميديقول، الذي عمل في DeepMind على الذكاء الاصطناعي ولكنه يعمل الآن في شركة ناشئة تسمى EquiLibre Technologies، إن نموذج Student of Games (SoG) يمكنه تتبع أصله إلى مشروعين. كان واحدا كومة العميق، الذكاء الاصطناعي الذي أنشأه فريق يضم Schmid في جامعة ألبرتا في كندا والذي كان أول من تغلب على اللاعبين المحترفين من البشر في لعبة البوكر. وكان الآخر ديب مايند AlphaZero، الذي تغلب على أفضل اللاعبين البشريين في ألعاب مثل الشطرنج والذهاب.
الفرق بين هذين النموذجين هو أن أحدهما يركز على ألعاب المعرفة غير الكاملة – تلك التي لا يعرف فيها اللاعبون حالة جميع اللاعبين الآخرين، مثل أيديهم في البوكر – والآخر يركز على ألعاب المعرفة الكاملة مثل الشطرنج، حيث كلاهما يمكن للاعبين رؤية موضع جميع القطع في جميع الأوقات. ويتطلب الأمران نهجين مختلفين جذريا. استأجرت DeepMind فريق DeepStack بأكمله بهدف بناء نموذج يمكن تعميمه على كلا النوعين من الألعاب، مما أدى إلى إنشاء SoG.
يقول شميد إن مجموعة SoG تبدأ كـ “مخطط” لكيفية تعلم الألعاب، ومن ثم تحسينها من خلال الممارسة. يمكن بعد ذلك إطلاق هذا النموذج المبدئي على ألعاب مختلفة وتعليم نفسه كيفية اللعب ضد نسخة أخرى من نفسه، وتعلم استراتيجيات جديدة ويصبح أكثر قدرة تدريجيًا. ولكن في حين أن AlphaZero السابقة من DeepMind يمكن أن تتكيف مع ألعاب المعرفة المثالية، فإن SoG يمكن أن تتكيف مع كل من ألعاب المعرفة المثالية وغير الكاملة، مما يجعلها أكثر قابلية للتعميم.
اختبر الباحثون SoG على لعبة الشطرنج، وGo، وتكساس هولدم بوكر ولعبة لوحية تسمى سكوتلاند يارد، بالإضافة إلى لعبة ليدوك هولدم بوكر ونسخة مخصصة من سكوتلاند يارد بلوحة مختلفة، ووجدوا أنها يمكن أن تغلب على لعبة SoG. العديد من نماذج الذكاء الاصطناعي الحالية واللاعبين البشريين. يقول شميد إنه يجب أن يكون قادرًا على تعلم لعب ألعاب أخرى أيضًا. “هناك العديد من الألعاب التي يمكنك لعبها وسيكون الأمر جيدًا حقًا.”
تأتي هذه القدرة واسعة النطاق بتكلفة طفيفة في الأداء مقارنة بخوارزميات DeepMind الأكثر تخصصًا، ولكن مع ذلك، يمكن لـ SoG التغلب بسهولة حتى على أفضل اللاعبين البشريين في معظم الألعاب التي تتعلمها. يقول شميد إن مجموعة SoG تتعلم اللعب ضد نفسها من أجل تحسين الألعاب، ولكن أيضًا لاستكشاف مجموعة من السيناريوهات المحتملة من الحالة الحالية للعبة – حتى لو كانت تلعب لعبة ذات معرفة غير كاملة.
“عندما تكون في لعبة مثل البوكر، يكون من الصعب جدًا اكتشافها؛ كيف بحق الجحيم سأقوم بالبحث [for the best strategic next move in a game] إذا كنت لا أعرف ما هي البطاقات التي يحملها الخصم؟ يقول شميد. “لذلك كانت هناك مجموعة من الأفكار القادمة من AlphaZero، وبعض المجموعات من الأفكار القادمة من DeepStack في هذا المزيج الكبير من الأفكار، وهو Student of Games.”
مايكل روفاتسوس يقول باحثون من جامعة إدنبرة بالمملكة المتحدة، والذي لم يشارك في البحث، إنه على الرغم من أنه أمر مثير للإعجاب، إلا أنه لا يزال هناك طريق طويل جدًا لنقطعه قبل أن يمكن اعتبار الذكاء الاصطناعي ذكيًا بشكل عام، لأن الألعاب هي إعدادات فيها جميع القواعد والسلوكيات محددة بوضوح، على عكس العالم الحقيقي.
ويقول: “الشيء المهم الذي يجب تسليط الضوء عليه هنا هو أنها بيئة مصطنعة خاضعة للرقابة ومكتفية بذاتها، حيث يكون ما يعنيه كل شيء، وما هي نتيجة كل فعل، واضحًا تمامًا”. “المشكلة هي مشكلة في الألعاب، لأنها على الرغم من أنها قد تكون معقدة للغاية، إلا أنها ليست حقيقية.”
المواضيع: