يمتلك Google DeepMind نموذجًا جديدًا للذكاء الاصطناعي يمكنه توجيه المهام الروبوتية التي لم يتم تدريبها مطلقًا على أدائها.
يتعلم النموذج المسمى RT-2 من بيانات الويب والروبوتات. ثم يحول هذه المعلومات إلى تعليمات بسيطة للآلات.
في الاختبارات ، كان النموذج طلب اتخاذ إجراءات لم يسبق لها مثيل في البيانات الآلية ، مثل وضع البرتقال في وعاء مطابق. لاتباع هذه الأوامر ، كان على النظام ترجمة المعرفة من البيانات المستندة إلى الويب. وفقًا لـ DeepMind ، حقق النموذج نجاحًا بنسبة 62 ٪ في هذه العمليات – ضعف مثيله في سابقتها ، RT-1.
“تمامًا مثل نماذج اللغة التي يتم تدريبها على نصوص من الويب لتعلم الأفكار والمفاهيم العامة ، ينقل RT-2 المعرفة من بيانات الويب لإبلاغ سلوك الروبوت”. فنسنت فانهوك ، رئيس قسم الروبوتات في DeepMind. “بعبارة أخرى ، يمكن لـ RT-2 التحدث بالروبوت “.
أظهرت الاختبارات أن RT-2 يتمتع بقدرات تعميم مذهلة. كما أن لديها فهمًا دلاليًا ومرئيًا محسنًا للبيانات الروبوتية التي لم يتم مواجهتها من قبل.
نعلى ما يبدو ، يمكن للنموذج استخدام المنطق البدائي لاتباع أوامر المستخدم الجديدة. بشكل مثير للإعجاب ، يمكن حتى أداء التفكير الدلالي متعدد المراحل. على سبيل المثال ، عندما طُلب من RT-2 اختيار شيء يمكن استخدامه كمطرقة ، حدد RT-2 الصخرة بشكل صحيح على أنها الخيار الأفضل.
في تقييم آخر ، أُمر النموذج بدفع زجاجة كاتشب نحو مكعب أزرق.
كان هناك العديد من العناصر في المشهد ، ولكن العنصر الوحيد في مجموعة بيانات التدريب هو المكعب. ومع ذلك ، نجح RT-2 في دفع الكاتشب نحو الوجهة المحددة.
بشرت DeepMind بـ RT-2 باعتباره اختراقًا في الذكاء الاصطناعي. يقول مختبر لندن إن النموذج يقربنا من مستقبل مفيد الروبوتات.
قال Vanhoucke: “لا يُظهر RT-2 فقط كيف أن التقدم في الذكاء الاصطناعي يتدرج بسرعة في الروبوتات ، بل إنه يُظهر وعودًا هائلة لمزيد من الروبوتات ذات الأغراض العامة”. “بينما لا يزال هناك قدر هائل من العمل الذي يتعين القيام به لتمكين الروبوتات المفيدة في البيئات التي تركز على الإنسان ، يوضح لنا RT-2 مستقبلًا مثيرًا للروبوتات في متناول اليد.”
يمكنك قراءة ورقة الدراسة RT-2 هنا.
نشرت