يطير، الماعز، يطير! يمكن لعامل الذكاء الاصطناعي الجديد من Google DeepMind أن يلعب ألعابًا مختلفة، بما في ذلك الألعاب التي لم يسبق له رؤيتها من قبل مثل Goat Simulator 3، وهي لعبة حركة ممتعة ذات فيزياء مبالغ فيها. وتمكن الباحثون من جعله يتبع الأوامر النصية للعب سبع ألعاب مختلفة والتنقل في ثلاث بيئات بحثية ثلاثية الأبعاد مختلفة. إنها خطوة نحو الذكاء الاصطناعي الأكثر عمومية والذي يمكنه نقل المهارات عبر بيئات متعددة.
حقق Google DeepMind نجاحًا كبيرًا في تطوير أنظمة الذكاء الاصطناعي للعب الألعاب. نظامها ألفا جو، التي تغلبت على أفضل لاعب محترف لي سيدول في لعبة Go في عام 2016، كانت علامة فارقة أظهرت قوة التعلم العميق. ولكن على عكس أنظمة الذكاء الاصطناعي السابقة للعب الألعاب، والتي أتقنت لعبة واحدة فقط أو يمكنها اتباع أهداف أو أوامر فردية فقط، فإن هذا العميل الجديد قادر على لعب مجموعة متنوعة من الألعاب المختلفة، بما في ذلك Valheim وNo Man’s Sky. يُطلق عليه اسم SIMA، وهو اختصار لعبارة “وكيل متعدد العوالم قابل للتطوير وقابل للتعليم”.
في تدريب أنظمة الذكاء الاصطناعي، تعد الألعاب بمثابة وكيل جيد لمهام العالم الحقيقي. يقول مايكل بيرنشتاين، الأستاذ المشارك في علوم الكمبيوتر في جامعة ستانفورد، والذي لم يكن جزءًا من البرنامج: «من حيث المبدأ، يمكن لعميل ألعاب عام أن يتعلم الكثير حول كيفية التنقل في عالمنا أكثر مما يمكن لأي شيء آخر في بيئة واحدة أن يتعلمه». من البحث.
يقول تيم هارلي، مهندس الأبحاث في Google DeepMind والذي كان جزءًا من فريق البحث: “يمكن للمرء أن يتخيل يومًا ما أنه بدلاً من وجود عملاء خارقين تلعب ضدهم، يمكن أن يكون لدينا عملاء مثل SIMA يلعبون جنبًا إلى جنب في الألعاب معك ومع أصدقائك”. الفريق الذي طور الوكيل.
يقول فريدريك بيس، مهندس الأبحاث في Google DeepMind، إن الفريق قام بتدريب SIMA على الكثير من الأمثلة لبشر يلعبون ألعاب الفيديو، بشكل فردي وتعاوني، جنبًا إلى جنب مع إدخال لوحة المفاتيح والماوس والشروح لما فعله اللاعبون في اللعبة.
ثم استخدموا تقنية الذكاء الاصطناعي تسمى التعلم بالتقليد لتعليم الوكيل ممارسة الألعاب كما يفعل البشر. يمكن لـ SIMA اتباع 600 تعليمات أساسية، مثل “اتجه يسارًا”، و”تسلق السلم”، و”افتح الخريطة”، ويمكن إكمال كل منها في أقل من 10 ثوانٍ تقريبًا.
وجد الفريق أن وكيل SIMA الذي تم تدريبه على العديد من الألعاب كان أفضل من الوكيل الذي تعلم كيفية لعب لعبة واحدة فقط. ويقول بيس إن هذا لأنه كان قادرًا على الاستفادة من المفاهيم المشتركة بين الألعاب لتعلم مهارات أفضل والتحسن في تنفيذ التعليمات.
ويقول: “هذه مرة أخرى خاصية رئيسية مثيرة حقًا، حيث لدينا وكيل يمكنه ممارسة ألعاب لم يسبق له مثيل من قبل، بشكل أساسي”.
يقول باولو راوبر، المحاضر في الذكاء الاصطناعي بجامعة كوين ماري في لندن، إن رؤية هذا النوع من نقل المعرفة بين الألعاب يعد علامة بارزة في أبحاث الذكاء الاصطناعي.
يقول راوبر إن الفكرة الأساسية المتمثلة في تعلم تنفيذ التعليمات على أساس الأمثلة المقدمة من البشر يمكن أن تؤدي إلى أنظمة أكثر قوة في المستقبل، خاصة مع مجموعات البيانات الأكبر. ويقول إن مجموعة البيانات المحدودة نسبيًا الخاصة بـ SIMA هي ما يعيق أداءها.
على الرغم من أن لا يزال عدد بيئات الألعاب التي تم التدريب عليها صغيرًا، وتسير SIMA على المسار الصحيح للتوسع، كما يقول جيم فان، عالم أبحاث كبير في Nvidia والذي يدير مبادرة AI Agents.
لكن نظام الذكاء الاصطناعي لا يزال غير قريب من المستوى البشري، كما يقول هارلي. على سبيل المثال، في لعبة No Man’s Sky، يمكن لعامل الذكاء الاصطناعي أن يقوم بـ 60% فقط من المهام التي يمكن للبشر القيام بها. وعندما أزال الباحثون قدرة البشر على إعطاء تعليمات SIMA، وجدوا أن أداء العامل أسوأ بكثير من ذي قبل.
بعد ذلك، يقول بيس، يعمل الفريق على تحسين أداء الوكيل. يريد الباحثون جعله يعمل في أكبر عدد ممكن من البيئات ويتعلم مهارات جديدة، ويريدون أن يتمكن الأشخاص من الدردشة مع الوكيل والحصول على رد. يريد الفريق أيضًا أن تتمتع SIMA بمهارات أكثر عمومية، مما يسمح لها بالتقاط الألعاب التي لم ترها من قبل بسرعة، تمامًا مثل الإنسان.
يقول بيسي: “يمكن للبشر أن يعمموا بشكل جيد للغاية على البيئات والمواقف غير المرئية”. “ونريد أن يكون وكلاؤنا متماثلين تمامًا.”
يقول روي فوكس، الأستاذ المساعد في جامعة كاليفورنيا في إيرفين، إن SIMA تقربنا من “لحظة ChatGPT” للوكلاء المستقلين.
لكن الأمر لا يزال بعيدًا عن الذكاء الاصطناعي المستقل الفعلي. ويقول إن ذلك سيكون “لعبة كرة مختلفة تمامًا”.