من المقرر أن تقدم Google نظامًا جديدًا يسمى Astra في وقت لاحق من هذا العام، وتعد بأنه سيكون أقوى نوع متقدم من مساعد الذكاء الاصطناعي الذي تم إطلاقه على الإطلاق.
يستطيع الجيل الحالي من مساعدي الذكاء الاصطناعي، مثل ChatGPT، استرجاع المعلومات وتقديم الإجابات، ولكن هذا كل ما في الأمر. لكن هذا العام، تعيد جوجل تسمية مساعديها ليصبحوا “عملاء” أكثر تقدمًا، والذين تقول إنهم قادرون على إظهار مهارات التفكير والتخطيط والذاكرة وقادرون على اتخاذ خطوات متعددة لتنفيذ المهام.
وقال أوريول فينيالس، نائب رئيس الأبحاث في Google DeepMind، إن الناس سيكونون قادرين على استخدام Astra من خلال هواتفهم الذكية وربما أجهزة الكمبيوتر المكتبية، لكن الشركة تستكشف خيارات أخرى أيضًا، مثل دمجها في النظارات الذكية أو الأجهزة الأخرى. مراجعة تكنولوجيا معهد ماساتشوستس للتكنولوجيا.
“نحن في الأيام الأولى جدًا [of AI agent development]”، قال الرئيس التنفيذي لشركة Google ساندر بيتشاي في مكالمة هاتفية قبل مؤتمر Google I / O اليوم.
قال ديميس هاسابيس، الرئيس التنفيذي والمؤسس المشارك لشركة Google DeepMind: “لقد أردنا دائمًا بناء وكيل عالمي يكون مفيدًا في الحياة اليومية”. “تخيل وكلاء يمكنهم رؤية وسماع ما نقوم به، وفهم السياق الذي نعيش فيه بشكل أفضل، والاستجابة بسرعة في المحادثة، مما يجعل وتيرة وجودة التفاعل تبدو أكثر طبيعية بكثير.” ويقول إن هذا هو ما ستكون عليه أسترا.
ويأتي إعلان جوجل بعد يوم من كشف المنافس OpenAI عن مساعد الذكاء الاصطناعي فائق الشحن الخاص به، جي بي تي-4o. يستجيب Astra من Google DeepMind لمدخلات الصوت والفيديو، بنفس الطريقة التي يستجيب بها GPT-4o (على الرغم من أنه أقل مغازلة).
وفي عرض صحفي، وجه أحد المستخدمين كاميرا الهاتف الذكي والنظارات الذكية نحو الأشياء وطلب من Astra شرح ماهيتها. عندما أخرج الشخص الجهاز من النافذة وسأل “في أي حي تعتقد أنني موجود؟” تمكن نظام الذكاء الاصطناعي من التعرف على كينغز كروس، لندن، موقع المقر الرئيسي لشركة Google DeepMind. كما تمكنت من القول إن نظارات الشخص كانت على مكتب، بعد أن سجلتها في وقت سابق من التفاعل.
يعرض العرض التوضيحي رؤية Google DeepMind للذكاء الاصطناعي متعدد الوسائط (الذي يمكنه التعامل مع أنواع متعددة من المدخلات – الصوت والفيديو والنص وما إلى ذلك) الذي يعمل في الوقت الفعلي، كما يقول فينيالز.
ويقول: “نحن متحمسون للغاية، في المستقبل، لنكون قادرين على الاقتراب من المستخدم، ومساعدته في أي شيء يريده”. قامت Google مؤخرًا بتحديث نموذج الذكاء الاصطناعي الخاص بها Gemini إلى معالجة كميات أكبر من البيانات، وهي ترقية تساعده في التعامل مع المستندات ومقاطع الفيديو الأكبر حجمًا، وإجراء محادثات أطول.
تشهد شركات التكنولوجيا منافسة شرسة على تفوق الذكاء الاصطناعي، ويعد وكلاء الذكاء الاصطناعي أحدث جهد تبذله شركات التكنولوجيا الكبرى لإظهار أنها تدفع حدود التنمية. ويلعب الوكلاء أيضًا دورًا في السرد الذي تروج له العديد من شركات التكنولوجيا، بما في ذلك OpenAI وGoogle DeepMind، التي تهدف إلى بناء ذكاء اصطناعي عام، فكرة افتراضية للغاية من أنظمة الذكاء الاصطناعي فائقة الذكاء.
يقول شيراج شاه، الأستاذ بجامعة واشنطن والمتخصص في البحث عبر الإنترنت: “في النهاية، سيكون لديك هذا الوكيل الوحيد الذي يعرفك جيدًا، ويمكنه القيام بالكثير من الأشياء نيابةً عنك، ويمكنه العمل عبر مهام ومجالات متعددة”. .
ولا تزال هذه الرؤية طموحة. ولكن يجب أن يُنظر إلى إعلان اليوم على أنه محاولة من Google لمواكبة المنافسين. ومن خلال التعجيل بهذه المنتجات، تستطيع جوجل جمع المزيد من البيانات من أكثر من مليار مستخدم حول كيفية استخدامهم لنماذجهم وما الذي ينجح، كما يقول شاه.
تكشف Google اليوم عن العديد من إمكانيات الذكاء الاصطناعي الجديدة التي تتجاوز الوكلاء اليوم. ستقوم بدمج الذكاء الاصطناعي بشكل أعمق في البحث من خلال ميزة جديدة تسمى نظرة عامة على الذكاء الاصطناعي، والتي تجمع المعلومات من الإنترنت وتجميعها في ملخصات قصيرة استجابة لاستعلامات البحث. الميزة، التي سيتم إطلاقها اليوم، ستكون متاحة في البداية فقط في الولايات المتحدة، مع إمكانية الوصول إليها في المزيد من البلدان لاحقًا.
سيساعد ذلك في تسريع عملية البحث والحصول على إجابات أكثر تحديدًا للمستخدمين عن أسئلة أكثر تعقيدًا ومتخصصة، كما يقول فيليكس سيمون، زميل باحث في الذكاء الاصطناعي والأخبار الرقمية في معهد رويترز للصحافة. ويقول: “أعتقد أن هذا هو المكان الذي عانى فيه البحث دائمًا”.
ميزة جديدة أخرى في عرض بحث الذكاء الاصطناعي من Google هي التخطيط الأفضل. سيتمكن الأشخاص قريبًا من مطالبة محرك البحث بتقديم اقتراحات للوجبات والسفر، على سبيل المثال، تمامًا مثل مطالبة وكيل السفر باقتراح المطاعم والفنادق. سيكون الجوزاء قادرًا على مساعدتهم في تخطيط ما يتعين عليهم القيام به أو شرائه لطهي الوصفات، وسيكونون أيضًا قادرين على إجراء محادثات مع نظام الذكاء الاصطناعي، ويطلبون منه القيام بأي شيء بدءًا من المهام الدنيوية نسبيًا، مثل إعلامهم بالطقس التوقعات، إلى تلك المعقدة للغاية مثل مساعدتهم على الاستعداد لمقابلة عمل أو خطاب مهم.
سيتمكن الأشخاص أيضًا من مقاطعة جمل الجوزاء في المنتصف وطرح أسئلة توضيحية، كما هو الحال في محادثة حقيقية.
وفي خطوة أخرى نحو منافس OpenAI، كشفت Google أيضًا عن Veo، وهو نظام ذكاء اصطناعي جديد لإنشاء الفيديو. Veo قادر على إنشاء مقاطع فيديو قصيرة ويتيح للمستخدمين مزيدًا من التحكم في الأنماط السينمائية من خلال فهم المطالبات مثل “الفاصل الزمني” أو “اللقطات الجوية للمناظر الطبيعية”.
تتمتع Google بميزة كبيرة عندما يتعلق الأمر بتدريب نماذج الفيديو التوليدية، لأنها تمتلك موقع YouTube. لقد أعلنت بالفعل عن تعاونها مع فنانين مثل دونالد جلوفر وويكليف جين، الذين يستخدمون تقنيتها لإنتاج أعمالهم.
في وقت سابق من هذا العام، تخبطت ميرا موراتي، مديرة التكنولوجيا في OpenA، عندما سئلت عما إذا كان نموذج الشركة قد تم تدريبه على بيانات يوتيوب. كان دوجلاس إيك، كبير مديري الأبحاث في Google DeepMind، غامضًا أيضًا بشأن بيانات التدريب المستخدمة لإنشاء Veo عندما سئل عنها مراجعة تكنولوجيا معهد ماساتشوستس للتكنولوجيالكنه قال إنه “قد يتم تدريبه على بعض محتوى يوتيوب وفقًا لاتفاقياتنا مع منشئي المحتوى على يوتيوب”.
من ناحية، تقدم جوجل الذكاء الاصطناعي التوليدي الخاص بها كأداة يمكن للفنانين استخدامها لصنع الأشياء، ولكن من المرجح أن تكتسب الأدوات قدرتها على إنشاء تلك الأشياء باستخدام مواد من الفنانين الحاليين، كما يقول شاه. واجهت شركات الذكاء الاصطناعي مثل Google وOpenAI عددًا كبيرًا من الدعاوى القضائية من قبل كتاب وفنانين يزعمون أن ملكيتهم الفكرية قد تم استخدامها دون موافقة أو تعويض.
يقول شاه: “بالنسبة للفنانين، يعد هذا سيفًا ذا حدين”.