[ظهرتنسخةمنهذهالقطعةلأولمرةفيالنشرةالإخباريةللروبوتاتالخاصةبـTechCrunch،Actuator[AversionofthispiecefirstappearedinTechCrunch’sroboticsnewsletterActuator اشترك هنا.]
وفي وقت سابق من هذا الشهر، قام فريق Google DeepMind ظهر لأول مرة Open X-Embodiment، وهي قاعدة بيانات لوظائف الروبوتات تم إنشاؤها بالتعاون مع 33 معهدًا بحثيًا. قام الباحثون المشاركون بمقارنة النظام بـ ImageNet، قاعدة البيانات التاريخية التي تأسست عام 2009 والتي تضم الآن أكثر من 14 مليون صورة.
“تمامًا كما دفعت ImageNet أبحاث الرؤية الحاسوبية، نعتقد أن Open X-Embodiment يمكن أن تفعل الشيء نفسه لتطوير الروبوتات،” أشار الباحثان Quan Vuong و Pannag Sanketi في ذلك الوقت. “إن بناء مجموعة بيانات من العروض التوضيحية المتنوعة للروبوتات هو الخطوة الأساسية لتدريب نموذج عام يمكنه التحكم في العديد من أنواع الروبوتات المختلفة، واتباع التعليمات المتنوعة، وتنفيذ التفكير الأساسي حول المهام المعقدة والتعميم بفعالية.”
في وقت الإعلان عنه، كان Open X-Embodiment يحتوي على أكثر من 500 مهارة و150000 مهمة تم جمعها من 22 تجسيدًا للروبوت. ليست أرقام ImageNet تمامًا، لكنها بداية جيدة. ثم قامت شركة DeepMind بعد ذلك بتدريب نموذج RT-1-X الخاص بها على البيانات واستخدمته لتدريب الروبوتات في مختبرات أخرى، حيث سجلت معدل نجاح بنسبة 50% مقارنة بالطرق الداخلية التي طورتها الفرق.
ربما كررت هذا عشرات المرات في هذه الصفحات، ولكنه حقًا وقت مثير للتعلم الآلي. لقد تحدثت إلى العديد من الفرق التي تتعامل مع المشكلة من زوايا مختلفة وبفعالية متزايدة باستمرار. إن عهد الروبوت المخصص لم ينته بعد، ولكن من المؤكد أننا نشعر كما لو أننا نلقي لمحات من عالم حيث الروبوت للأغراض العامة هو احتمال واضح.
ستكون المحاكاة بلا شك جزءًا كبيرًا من المعادلة، جنبًا إلى جنب مع الذكاء الاصطناعي (بما في ذلك التنوع التوليدي). لا يزال يبدو الأمر وكأن بعض الشركات قد وضعت الحصان أمام العربة هنا عندما يتعلق الأمر ببناء الأجهزة للمهام العامة، ولكن بعد بضع سنوات، من يدري؟
فنسنت فانهوك هو شخص كنت أحاول تحديده لبعض الوقت. إذا كنت متاحًا، فهو لم يكن كذلك. السفن في الليل وكل ذلك. ولحسن الحظ، تمكنا أخيرًا من إنجاز الأمر في نهاية الأسبوع الماضي.
يعتبر Vanhoucke جديدًا في منصب رئيس قسم الروبوتات في Google DeepMind، بعد أن تولى هذا المنصب في شهر مايو. ومع ذلك، فهو يعمل في الشركة منذ أكثر من 16 عامًا، وكان آخرها بمثابة عالم متميز في Google AI Robotics. وفي المحصلة، قد يكون أفضل شخص يمكن التحدث إليه حول طموحات Google الروبوتية وكيف وصلت إلى هنا.
في أي مرحلة من تاريخ DeepMind تم تطوير فريق الروبوتات؟
لم أكن في الأصل على جانب DeepMind من السياج. لقد كنت جزءًا من أبحاث Google. لقد اندمجنا مؤخرًا مع جهود DeepMind. لذا، إلى حد ما، مشاركتي مع DeepMind حديثة للغاية. ولكن هناك تاريخ أطول من أبحاث الروبوتات التي تجري في Google DeepMind. بدأ الأمر من وجهة النظر المتزايدة بأن تكنولوجيا الإدراك أصبحت جيدة حقًا.
لقد كانت الكثير من رؤية الكمبيوتر ومعالجة الصوت وكل هذه الأشياء قد تجاوزت المنعطف وأصبحت تقريبًا على المستوى البشري. وبدأنا نسأل أنفسنا: “حسنًا، على افتراض أن هذا سيستمر خلال السنوات القليلة المقبلة، ما هي عواقب ذلك؟” وكانت إحدى النتائج الواضحة هي أن وجود الروبوتات فجأة في بيئة العالم الحقيقي سيكون احتمالًا حقيقيًا. إن القدرة على التطور فعليًا وأداء المهام في بيئة يومية كانت تعتمد بالكامل على وجود إدراك قوي حقًا. كنت أعمل في البداية على الذكاء الاصطناعي العام ورؤية الكمبيوتر. لقد عملت أيضًا على التعرف على الكلام في الماضي. رأيت الكتابة على الحائط وقررت التركيز على استخدام الروبوتات كمرحلة تالية في بحثنا.
ما أفهمه هو أن الكثير من أعضاء فريق Everyday Robots انتهى بهم الأمر في هذا الفريق. يعود تاريخ Google مع الروبوتات إلى أبعد من ذلك بكثير. لقد مرت 10 سنوات منذ أن قامت شركة Alphabet بكل هذه الاستحواذات [Boston Dynamics, etc.]. يبدو أن الكثير من الأشخاص من تلك الشركات قد قاموا بملء فريق الروبوتات الحالي في Google.
هناك جزء كبير من الفريق الذي جاء من خلال عمليات الاستحواذ هذه. كان ذلك قبل وقتي — لقد كنت منخرطًا حقًا في رؤية الكمبيوتر والتعرف على الكلام، ولكن لا يزال لدينا الكثير من هؤلاء الأشخاص. لقد توصلنا أكثر فأكثر إلى استنتاج مفاده أن مشكلة الروبوتات برمتها تندرج ضمن مشكلة الذكاء الاصطناعي العامة. لقد كان حل الجزء المتعلق بالذكاء حقًا هو العامل التمكيني الرئيسي لأي عملية ذات معنى في الروبوتات في العالم الحقيقي. لقد حولنا الكثير من جهودنا نحو حل هذا التصور، والفهم والتحكم في سياق الذكاء الاصطناعي العام سيكون المشكلة الكبيرة التي يجب حلها.
يبدو أن الكثير من العمل الذي كانت تقوم به Everyday Robots يتطرق إلى الذكاء الاصطناعي العام أو الذكاء الاصطناعي التوليدي. هل تم نقل العمل الذي كان يقوم به الفريق إلى فريق الروبوتات في DeepMind؟
لقد كنا نتعاون مع Everyday Robots منذ سبع سنوات. على الرغم من أننا كنا فريقين منفصلين، إلا أن لدينا روابط عميقة جدًا. في الواقع، أحد الأشياء التي دفعتنا للبدء حقًا في النظر في الروبوتات في ذلك الوقت كان التعاون الذي كان بمثابة مشروع skunkworks مع فريق Everyday Robots، حيث صادف أن لديهم عددًا من أذرع الروبوتات الموجودة حولها تم إيقافها. لقد كانوا جيلًا واحدًا من الأسلحة التي أدت إلى جيل جديد، وكانوا مستلقين دون أن يفعلوا شيئًا.
قررنا أنه سيكون من الممتع أن نلتقط تلك الأذرع، ونضعها جميعًا في غرفة ونطلب منها التدرب وتعلم كيفية الإمساك بالأشياء. إن فكرة تعلم مشكلة استيعابية لم تكن في روح العصر في ذلك الوقت. إن فكرة استخدام التعلم الآلي والإدراك كوسيلة للتحكم في الإمساك الآلي لم تكن شيئًا تم استكشافه. عندما نجحوا، أعطيناهم مكافأة، وعندما فشلوا، قمنا بإبهامهم.
لأول مرة، استخدمنا التعلم الآلي وحللنا بشكل أساسي مشكلة الاستيعاب العام هذه، باستخدام التعلم الآلي والذكاء الاصطناعي. وكانت تلك لحظة مضيئة في ذلك الوقت. كان هناك حقا شيء جديد هناك. أدى ذلك إلى إجراء التحقيقات مع Everyday Robots حول التركيز على التعلم الآلي كوسيلة للتحكم في تلك الروبوتات. وأيضًا، على الجانب البحثي، دفع المزيد من الروبوتات كمشكلة مثيرة للاهتمام لتطبيق جميع تقنيات التعلم العميق للذكاء الاصطناعي التي تمكنا من العمل بشكل جيد في مجالات أخرى.
هل استوعب فريقك الروبوتات اليومية؟
تم استيعاب جزء صغير من الفريق من قبل فريقي. لقد ورثنا الروبوتات الخاصة بهم وما زلنا نستخدمها. حتى الآن، نحن مستمرون في تطوير التكنولوجيا التي كانوا رائدين فيها بالفعل وكانوا يعملون عليها. يستمر الدافع بأكمله بتركيز مختلف قليلاً عما تصوره الفريق في الأصل. نحن نركز حقًا على قطعة الذكاء أكثر بكثير من بناء الروبوت.
لقد ذكرت أن الفريق انتقل إلى مكاتب Alphabet X. هل هناك شيء أعمق فيما يتعلق بالتعاون بين الفرق ومشاركة الموارد؟
إنه قرار عملي للغاية. لديهم شبكة Wi-Fi جيدة وقوة جيدة ومساحة كبيرة.
أتمنى أن تتمتع جميع مباني Google بشبكة Wi-Fi جيدة.
كنت تأمل ذلك، أليس كذلك؟ ولكن كان قرارنا بالانتقال إلى هنا أمرًا بسيطًا للغاية. يجب أن أقول، كان القرار الأكبر هو أن لديهم مقهى جيد هنا. لم يكن لدى مكتبنا السابق طعام جيد، وبدأ الناس في الشكوى. لا توجد أجندة خفية هناك. نحن نحب العمل بشكل وثيق مع بقية أعضاء X. وأعتقد أن هناك الكثير من أوجه التآزر هناك. لديهم روبوتات موهوبون حقًا يعملون في عدد من المشاريع. لدينا تعاونات مع Intrinsic التي نود رعايتها. من المنطقي جدًا أن نكون هنا، وهو مبنى جميل.
هناك القليل من التداخل مع Intrinsic، فيما يتعلق بما يفعلونه مع منصتهم – أشياء مثل الروبوتات بدون تعليمات برمجية وتعلم الروبوتات. إنها تتداخل مع الذكاء الاصطناعي العام والتوليدي.
من المثير للاهتمام كيف تطورت الروبوتات من كل زاوية لتصبح مخصصة للغاية وتكتسب مجموعة مختلفة تمامًا من الخبرات والمهارات. إلى حد كبير، الرحلة التي نقوم بها هي محاولة تحقيق الروبوتات ذات الأغراض العامة، سواء تم تطبيقها على بيئة صناعية أو أكثر على بيئة منزلية. المبادئ التي تقف وراءها، والتي يقودها نواة ذكاء اصطناعي قوية جدًا، متشابهة جدًا. نحن حقًا ندفع الظرف في محاولة استكشاف كيف يمكننا دعم مساحة التطبيق على نطاق واسع قدر الإمكان. هذا جديد ومثير. إنها منطقة خضراء للغاية. هناك الكثير لاستكشافه في الفضاء.
أود أن أسأل الناس إلى أي مدى يعتقدون أننا بعيدون عن شيء يمكننا أن نطلق عليه بشكل معقول الروبوتات ذات الأغراض العامة.
هناك فارق بسيط في تعريف الروبوتات ذات الأغراض العامة. نحن نركز حقًا على الأساليب ذات الأغراض العامة. يمكن تطبيق بعض الأساليب على كل من الروبوتات الصناعية أو المنزلية أو روبوتات الرصيف، مع كل هذه التجسيدات وعوامل الشكل المختلفة. نحن لا نعتمد على وجود تجسيد للأغراض العامة يفعل كل شيء من أجلك، أكثر مما لو كان لديك تجسيد مخصص جدًا لمشكلتك. لا بأس. يمكننا ضبطها بسرعة لحل المشكلة التي تواجهك، على وجه التحديد. إذن هذا سؤال كبير: هل سيتم ظهور الروبوتات ذات الأغراض العامة؟ هذا شيء يطرحه الكثير من الناس حول فرضيات حول ما إذا كان سيحدث ومتى.
حتى الآن، تم تحقيق المزيد من النجاح مع الروبوتات المخصصة. أعتقد، إلى حد ما، أن التكنولوجيا لم تكن موجودة لتمكين ظهور المزيد من الروبوتات ذات الأغراض العامة. ما إذا كان هذا هو المكان الذي سيأخذنا إليه وضع الأعمال، فهو سؤال جيد جدًا. لا أعتقد أنه يمكن الإجابة على هذا السؤال حتى تكون لدينا ثقة أكبر في التكنولوجيا التي تقف وراءه. هذا ما نقوده الآن. نحن نرى المزيد من علامات الحياة، حيث أن الأساليب العامة جدًا التي لا تعتمد على تجسيد محدد هي طرق معقولة. آخر شيء قمنا به هو مشروع RTX هذا. لقد ذهبنا إلى عدد من المختبرات الأكاديمية – أعتقد أن لدينا 30 شريكًا مختلفًا الآن – وطلبنا منهم إلقاء نظرة على مهمتهم والبيانات التي جمعوها. دعونا نسحب ذلك إلى مستودع مشترك للبيانات، ودعنا ندرب نموذجًا كبيرًا فوقه ونرى ما سيحدث.
ما هو الدور الذي سيلعبه الذكاء الاصطناعي التوليدي في مجال الروبوتات؟
أعتقد أنها ستكون مركزية للغاية. لقد كانت هناك ثورة كبيرة في نموذج اللغة. بدأ الجميع يتساءلون عما إذا كان بإمكاننا استخدام الكثير من النماذج اللغوية للروبوتات، وأعتقد أن الأمر قد يكون سطحيًا للغاية. كما تعلمون، “دعونا نلتقط بدعة اليوم ونكتشف ما يمكننا فعله بها”، ولكن تبين أنها عميقة للغاية. والسبب في ذلك هو أنه إذا فكرت في الأمر، فإن نماذج اللغة لا تتعلق حقًا باللغة. إنها تدور حول المنطق السليم وفهم العالم اليومي. لذا، إذا عرف نموذج اللغة الكبير أنك تبحث عن فنجان قهوة، فمن المحتمل أن تجده في خزانة المطبخ أو على الطاولة.
إن وضع فنجان القهوة على الطاولة أمر منطقي. إن وضع طاولة فوق فنجان القهوة أمر غير منطقي. إنها حقائق بسيطة كهذه لا تفكر فيها حقًا، لأنها واضحة تمامًا بالنسبة لك. لقد كان من الصعب دائمًا إيصال ذلك إلى نظام متجسد. من الصعب حقًا تشفير المعرفة، في حين أن نماذج اللغات الكبيرة هذه تمتلك تلك المعرفة وتقوم بتشفيرها بطريقة يسهل الوصول إليها ويمكننا استخدامها. لذا فقد تمكنا من أخذ هذا المنطق السليم وتطبيقه على تخطيط الروبوتات. لقد تمكنا من تطبيقه على تفاعلات الروبوتات، والتلاعبات، والتفاعلات بين الإنسان والروبوت، ووجود وكيل لديه هذا الحس السليم ويمكنه التفكير في الأشياء في بيئة محاكاة، جنبًا إلى جنب مع الإدراك هو أمر أساسي حقًا لمشكلة الروبوتات.
من المحتمل أن تكون المحاكاة جزءًا كبيرًا من جمع البيانات للتحليل.
نعم. إنه أحد مكونات هذا. التحدي الذي يواجه المحاكاة هو أنك تحتاج بعد ذلك إلى سد الفجوة بين المحاكاة والواقع. المحاكاة هي تقريب للواقع. قد يكون من الصعب للغاية جعل الأمر دقيقًا للغاية ويعكس الواقع بشكل كبير. يجب أن تكون فيزياء جهاز المحاكاة جيدة. يجب أن يكون العرض المرئي للواقع في تلك المحاكاة جيدًا جدًا. وهذا في الواقع مجال آخر بدأ فيه الذكاء الاصطناعي التوليدي في ترك بصمته. يمكنك أن تتخيل بدلاً من الاضطرار فعليًا إلى تشغيل جهاز محاكاة للفيزياء، يمكنك ذلك قم بالتوليد باستخدام توليد الصور أو نموذج توليدي من نوع ما.
تاي برادي قال لي مؤخرا تستخدم أمازون المحاكاة لإنشاء الحزم.
هذا يجعل الامر منطقيا. وللمضي قدمًا، أعتقد أنه أبعد من مجرد توليد الأصول، يمكنك تخيل توليد العقود المستقبلية. تخيل ماذا سيحدث لو قام الروبوت بعمل ما؟ والتحقق من أنه يفعل بالفعل الشيء الذي تريده واستخدام ذلك كوسيلة للتخطيط للمستقبل. إنه يشبه حلم الروبوت، باستخدام نماذج توليدية، بدلاً من الاضطرار إلى القيام بذلك في العالم الحقيقي.