أطلقت جوجل وابل من الأجهزة الجديدة هذا الأسبوع، من من هواتف Pixel 9 الذكية إلى سماعات الأذن اللاسلكية الجديدةإن أساس كل هذه الأدوات اللامعة هو المساعد الذكي الاصطناعي Gemini من Google. تم إطلاق chatbot في وقت سابق من هذا العام وهو الآن المساعد الافتراضي على سلسلة بيكسل 9 وهو متاح بالفعل على ملايين الهواتف التي تعمل بنظام أندرويد في جميع أنحاء العالم. ولكن هناك طريقة جديدة للتحدث إلى روبوت المحادثة هذا والتي يتم طرحها الآن: Gemini Live.
هذا هو رد جوجل على GPT-4o من OpenAI، وهي طريقة للتحدث إلى المساعد بشكل طبيعي، تمامًا مثل المحادثة الصوتية العادية بين شخصين (أو على الأقل هذا هو الهدف). يتم طرحها باللغة الإنجليزية مشتركي Gemini Advanced (20 دولار شهريا)، ويمكنك الوصول إليه من خلال النقر على زر Live الصغير في أسفل يمين تطبيق Gemini. وسيتوفر في تطبيق iOS ولغات أخرى في الأسابيع المقبلة.
تقول سيسي هسياو، نائبة رئيس شركة جوجل لتجارب جيميني، لمجلة WIRED إن روبوت المحادثة هذا ليس مجرد مساعد جوجل مُعاد تسخينه. بل إنه واجهة أعيد بناؤها بالكامل باستخدام الذكاء الاصطناعي التوليدي. تقول هسياو: “على مدار سنوات بناء المساعد، كان هناك شيئين طلبهما المستخدمون منا مرارًا وتكرارًا. الأول هو أنهم طلبوا مساعدًا أكثر سلاسة وطبيعية – يريدون أن يتمكنوا من التحدث إليه بشكل طبيعي دون الحاجة إلى تغيير طريقة تحدثهم. والثاني أكثر قدرة؛ لمساعدتهم على حل مشاكل حياتهم، وليس مجرد مهام بسيطة”.
مباشر من جوجل
قم بتشغيل Gemini وسترى شاشة فارغة مع ضوء أثيري يضيء من الأسفل. يمكنك البدء في التحدث إلى المساعد وإجراء محادثة حتى إذا كان هاتفك مقفلاً والشاشة مغلقة، كما يمكن الوصول إليها من خلال واجهة المستخدم الجديدة من Google. سماعات بيكسل بادز برو 2 سماعات أذن لاسلكية حتى تتمكن من التحدث بدون استخدام اليدين أثناء وجود هاتفك في حقيبتك. هناك 10 أصوات يمكنك الاختيار من بينها من نغمات ولهجات وأنماط مختلفة. عند إنهاء الجلسة، سترى نصًا للمحادثة بأكملها، وهو شيء يمكنك الوصول إليه في أي وقت في تطبيق Gemini.
على عكس المساعدين الصوتيين القدامى، يتيح لك تطبيق Gemini Live مقاطعة المحادثة دون تعطيل التجربة بأكملها. (وهذا مفيد بشكل خاص لأن تطبيق Gemini يميل إلى التحدث كثيرًا). والفكرة هي ربطه بتطبيقات أخرى عبر ملحقات، على الرغم من أن العديد منها غير متوفر حتى الآن. على سبيل المثال، ستتمكن من الطلب في تطبيق Gemini Live إحضار دعوة لحفلة في بريدك الإلكتروني على Gmail والاستفسار عن الوقت والمكان بدلاً من البحث عنها بنفسك. أو البحث عن وصفة وطلب إضافة المكونات إلى قائمة التسوق في تطبيق Google Keep. وتقول Google إن هذه الملحقات لتطبيقاتها مثل Keep وTasks وUtilities وCalendar وYouTube Music سيتم إطلاقها في الأسابيع المقبلة.
في وقت لاحق من العام، ستقوم Google بتزويد Gemini Live بـ مشروع أسترا، تقنية الرؤية الحاسوبية التي تم الترويج لها في مؤتمر المطورين في مايوسيسمح لك هذا باستخدام تطبيق الكاميرا في هاتفك، وفي الوقت الفعلي، سؤال جيميني عن الأشياء التي تنظر إليها في العالم الحقيقي. تخيل أنك تمر بجوار ملصق حفل موسيقي وتطلب منه تخزين التواريخ في التقويم الخاص بك وإعداد تذكير لشراء التذاكر.
تحدث معي
كانت تجاربنا في استخدام المساعدين الصوتيين حتى هذه النقطة في الغالب معاملاتية، لذلك عندما تحدثت مع Gemini Live، وجدت أن بدء محادثة مع الروبوت كان محرجًا بعض الشيء. إنها خطوة كبيرة تتجاوز طلب تقرير الطقس من Google Assistant أو Alexa، أو فتح الستائر، أو ما إذا كان كلبك يستطيع أكل الكرفس. قد يكون لديك متابعة هنا وهناك، لكنها لم تكن مبنية حول تدفق المحادثة بالطريقة التي كانت عليها Gemini Live.
أخبرتني هسياو أنها تستمتع باستخدام تطبيق Gemini Live في السيارة أثناء عودتها إلى المنزل من العمل. بدأت محادثة حول أولمبياد باريس وحول غناء سيلين ديون في حفل الافتتاح. سألتني هسياو: “هل يمكنك أن تخبريني قليلاً عن الأغنية التي غنتها؟”. رد الذكاء الاصطناعي بأصل الأغنية ومؤلفها ومعناها، وبعد بعض المناقشة، اكتشفت هسياو أن سيلين ديون تستطيع الغناء باللغة الصينية.
“لقد فوجئت للغاية”، كما تقول. “لكن هذا يعطيك مثالاً على كيفية اكتشاف الأشياء؛ إنه تفاعل مع التكنولوجيا لم يكن الناس ليتمكنوا من القيام به قبل هذا النوع من الفضول والاستكشاف من خلال المحادثة. هذه مجرد بداية لما نتجه إليه مع مساعد جيميني”.
في العرض التوضيحي الذي قدمته، سألت تطبيق جيميني عما ينبغي لي أن أتناوله على العشاء. فسألني عما إذا كنت أريد شيئًا خفيفًا ومنعشًا أم وجبة دسمة. وواصلنا الحديث ذهابًا وإيابًا، وعندما اقترح تطبيق جيميني طبق الجمبري، كذبت وقلت إنني أعاني من حساسية تجاه الجمبري، فأوصاني بعد ذلك بتناول السلمون. فقلت له إنني لا أتناول السلمون. فقال لي: “يمكنك دائمًا شواء صدور الدجاج ووضعها في سلطة مع سلطة مشوية وصلصة خل خفيفة”. فطلبت منه وصفة، فبدأ في شرح التعليمات خطوة بخطوة. فقاطعته، ولكن يمكنني العودة إلى تطبيق جيميني للعثور على الوصفة لاحقًا.
أستطيع أن أتخيل اتباع هذا النهج الآن عندما أريد أن أتعلم عن أي شيء، ومواصلة المحادثة حتى بعد أن يجيب برنامج Gemini على استفساري الأولي. لا يزال لدي العديد من المخاوف: لماذا لا يوجد نسب أو مصدر مباشر للمعلومات التي يعرضها؟ هل يمكنني أن أثق في أن كل ما يقوله دقيق؟ يقول هسايو عندما تخرج من برنامج Gemini Live، يمكنك النقر على أيقونة “G” الصغيرة أسفل النص المنقول للتحقق من عمله وإجراء عمليات البحث الخاصة بك على Google.
ولكنني أجد نفسي أفكر أكثر فأكثر في أن هذا هو مستقبل البحث. فما عليك سوى أن تسأل وتحصل على الإجابات وتستمر في الحديث لمعرفة المزيد. والمشكلة هي أن جيميني يميل إلى التحدث كثيرًا. وتكون ردوده مطولة، لذا فأنت غالبًا ما تنتظر بعض الوقت قبل أن تتمكن من المتابعة. نعم، يمكنك مقاطعته للمضي قدمًا، ولكن من المحرج مقاطعة مساعد صوتي. لا أريد أن أكون وقحًا!
أين يوجد مساعد جوجل في العالم؟
مع كل هذا التركيز على Gemini وGemini Live، ربما تتساءل: أين مساعد Google؟ إذا نقرت على أيقونة ملفك الشخصي في تطبيق Gemini، فسترى خيارًا التبديل إلى مساعد Google إذا كنت ترغب في العودة إلى التجربة القديمة، فمن الصعب تحديد المدة التي سيظل هذا الخيار متاحًا فيها. حاليًا، هناك بعض الأشياء التي يمكن لمساعد Google القيام بها ولا يستطيع Gemini القيام بها، لذا فهناك عملية تسليم من أحدهما إلى الآخر. يقول هسياو: “على نحو متزايد، سيتمكن Gemini من القيام بهذه الإجراءات بمفرده”.
ولكن في وقت سابق من هذا الشهر، أعلنت جوجل منتجات Nest الجديدةكما أشارت التقارير إلى أن مساعد جوجل سيحصل قريبًا على صوت أكثر طبيعية، وسيتم ترقية بعض ميزاته باستخدام نماذج اللغة الكبيرة من Gemini. على سبيل المثال، سيكون بإمكانك سؤاله عما إذا كان موظف توصيل FedEx قد وصل إلى باب منزلك، وسيكون قادرًا على تحليل ذلك من موجز جرس الباب المرئي الخاص بك. يمكن أن تكون تنبيهات الحركة أكثر وصفًا بدلاً من مجرد قول “تم اكتشاف شخص”.
وهذا يعني أن لدينا الآن مساعدين، ويبدو أن جوجل راضية تمامًا عن هذا في الوقت الحالي. يقول هسياو إن جيميني سيكون مساعدك الشخصي، الذي يمكنك سؤاله عن مواعيد التقويم ودعوات البريد الإلكتروني، وكل ذلك استنادًا إلى بياناتك الشخصية. في المنزل، يعد مساعد جوجل مساعدًا “مجتمعيًا”، لأنه جهاز عائلي أكثر. “لا يريد الناس أن تكون رسائل البريد الإلكتروني الشخصية الخاصة بهم متاحة من خلال الصوت على مكبر صوت منزلي في غرفة المعيشة حيث يمكن للضيف أن يسأل، “مرحبًا جوجل، ما هو موجود في بريد جوليان الإلكتروني”.
يبدو الأمر وكأنه وصفة لكارثة في مجال العلامات التجارية. فمن الصعب للغاية بالفعل تتبع جميع الاختلافات الموجودة بالفعل في الجوزاء (ولا تنس أن الجوزاء كان “الشاعر“عندما تم إطلاقه في المعاينة العام الماضي). قد يعني هذا أيضًا أن بعض الوظائف ستكون محدودة بناءً على الجهاز الذي تستخدمه، لمنع الضيف من التجسس على رسائل البريد الإلكتروني الخاصة بك. إذا اعتدت على مطالبة جهاز Gemini على هاتفك بمعالجة مهمة، ولكنك تركت هاتفك في الغرفة الأخرى ورفض المساعد على مكبر الصوت Nest Speaker متابعة المهمة، ألا يكون هذا محبطًا؟
يقول هسياو: “ما زلنا نستكشف العلامة التجارية لهذا المنتج، وما زلنا في مراحل التطوير المبكرة. وبصرف النظر عن العلامة التجارية، نحتاج إلى التأكد من أن الناس يحصلون على ما يريدون من مساعدهم الأكثر فائدة، سواء كان على هواتفهم الشخصية أو في المنزل، وأنه يحل حالات الاستخدام الخاصة بهم”.
إذا قمت بشراء شيء ما باستخدام الروابط الموجودة في قصصنا، فقد نربح عمولة. وهذا يساعد في دعم صحافتنا. يتعلم أكثر.