هذه المقالة متاحة أيضا بالإسبانية. يرجى استخدام زر التبديل الموجود أعلى العنوان لتبديل اللغات. يزور digiday.com/es لقراءة المزيد من المحتوى باللغة الإسبانية.
أصبحت رؤية Google لعالم مدعوم بالذكاء الاصطناعي أكثر وضوحًا بالأمس، حيث أعلنت شركة التكنولوجيا العملاقة عن مجموعة واسعة من التحديثات لقدرات الذكاء الاصطناعي التوليدية عبر منصات البرامج والأجهزة المختلفة.
في مؤتمرها السنوي للمطورين Google I/O، طرحت الشركة لأول مرة طرقًا لاستخدام الذكاء الاصطناعي التوليدي في كل شيء بدءًا من البحث في العوالم عبر الإنترنت وغير المتصلة بالإنترنت وحتى إنشاء المحتوى وتنفيذ المهام. كما أعلنت أيضًا عن نماذج جديدة للذكاء الاصطناعي لعائلة Gemini مع عروض توضيحية لجعل الذكاء الاصطناعي أسرع وأكثر كفاءة باستخدام Gemini 1.5 Flash وربما أكثر خصوصية مع Gemini Nano. وتضمنت الترقيات الأخرى السماح بكميات أكبر من المعلومات التي يتم استيعابها بواسطة الذكاء الاصطناعي وطرق جديدة للمنصات لمعالجة الفيديو والصوت والصور والنص.
وبشكل منفصل، طرحت Google لأول مرة طرقًا جديدة لإنشاء وتحرير الفيديو من خلال نموذج فيديو جديد يعمل بالذكاء الاصطناعي يسمى Veo. كما روجت أيضًا لطرق إنشاء موسيقى الذكاء الاصطناعي من خلال نموذج Lyria وMusic AI Sandbox، الذي أنشأته Google بالتعاون مع YouTube وفنانين كبار مثل Björn (من ABBA) وWyclef Jean. وبينما ستتنافس Veo مع منصات منافسة مثل Runway وOpenAI’s Sora، فإن ميزة الموسيقى تضعها في مواجهة تطبيقات مثل Suno AI التي أصبحت ذات شعبية متزايدة.
عندما يتعلق الأمر بالتصوير، طرحت Google تحسينات لنموذج الصور AI الخاص بها، Imagen 3، والذي يتوفر للمطورين في وضع المعاينة الخاصة. أحد التحسينات على الصور هو إظهار نص واضح بالفعل بدلاً من تشويهه ككلمات لا يمكن التعرف عليها. ومع ذلك، كانت تشويهات النص واحدة من أسهل الطرق لتحديد الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي في الماضي حتى لو لم يتم وضع علامة مائية عليها.
لا تمثل تحديثات جوجل بالضرورة تغييرًا كبيرًا في كيفية استخدام الشركات للذكاء الاصطناعي، وفقًا لروان كوران، وهو محلل في شركة Forrester يركز على الذكاء الاصطناعي والتعلم الآلي. وبدلاً من ذلك، فهو يُظهر التركيز المتزايد على تحسين حالات الاستخدام الحالية من خلال إمكانات متعددة الوسائط.
“لقد رأينا بالفعل على مدار هذا العام أن الوسائط المتعددة قد برزت بالفعل كواحدة من ساحات القتال الرائدة لمن كان لديه [advantage] وقال كوران: “في السباق حول النماذج في هذا الوقت”. “من المتوقع جدًا أن نرى نوعًا من التطور المستمر في هذا الاتجاه.”
عملاء مشروع أسترا والذكاء الاصطناعي
إحدى الطرق التي تخطط بها Google لتوسيع نطاق قدراتها هي من خلال Project Astra، وهو مساعد الذكاء الاصطناعي الجديد الذي يمكنه الإجابة على الاستفسارات من خلال النصوص والصوت والصور والفيديو. قال السير ديميس هاسابيس، المؤسس المشارك لشركة Deepmind، التي استحوذت عليها Google في عام 2014، إن دمج البصر والصوت والنص سيسمح لمشروع Astra “بالفهم والاستجابة لعالمنا المعقد والديناميكي تمامًا كما نفعل نحن”.
“سوف تحتاج إلى استيعاب وتذكر ما تراه على هذا النحو [it] وقال هاسابيس على خشبة المسرح في Google I/O: “يمكنني فهم السياق واتخاذ الإجراءات”. “ويجب أن تكون استباقية وقابلة للتعليم وشخصية حتى تتمكن من التحدث إليها بشكل طبيعي دون تأخير أو تأخير.”
في العديد من النواحي، تتشابه بعض إمكانيات Project Astra مع تحديثات ChatGPT الجديدة من نموذج الذكاء الاصطناعي الجديد GPT-4o من OpenAI، والذي ظهر لأول مرة في اليوم السابق في محاولة واضحة لتجاوز Google I/O. إنه مشابه أيضًا لما ظهرته Meta لأول مرة منذ بضعة أسابيع تحديث لـ Meta AI، التي تعمل على تشغيل العديد من تطبيقات Meta ونظاراتها الذكية Meta Ray-Ban. لاحظ الكثيرون أوجه التشابه بين آخر التحديثات في سباق التسلح في مجال الذكاء الاصطناعي وقدرات الذكاء الاصطناعي التي تم تصورها قبل عقد من الزمن في فيلم الخيال العلمي للمخرج سبايك جونز عام 2013 بعنوان “Her” بطولة جواكين فينيكس وسكارليت جوهانسون.
سوف يرغب المسوقون في معرفة كيفية تأثير عملاء الذكاء الاصطناعي على الأشخاص، وفقًا لجيفري كولون، المؤسس المشارك لوكالة Feelr Media، وهي وكالة إبداعية جديدة تركز على التصميم والإنتاج والاستراتيجية. على الرغم من أنه من السابق لأوانه معرفة مدى جودة Veo، إلا أنه يمكن أن يفيد YouTube من خلال منح المبدعين أدوات لصياغة فيديو سينمائي دون المعرفة التقنية – مما قد يجلب المزيد من المحتوى عالي الإنتاج للأجهزة الأصغر وأجهزة التلفزيون المتصلة الأكبر حجمًا.
ومن خلال إنجاز المهام نيابة عن المستخدمين، قال كولون إن مشروع Astra يمكنه أخيرًا تحقيق ما وعد به مساعدون سابقون مثل Cortana من Microsoft. بعد أن قاد سابقًا فرق التسويق والمحتوى في Microsoft وDell، يعتقد أن Project Astra ووكلاء الذكاء الاصطناعي الآخرين في Google يجب ألا يُنظر إليهم على أنهم ذكاء اصطناعي، بل باعتبارهم ذكاء اصطناعي: “مساعدون أذكياء”.
قال كولون: “لن تتعلق قصة الذكاء الاصطناعي بالنماذج نفسها بقدر ما ستركز على ما يمكنهم فعله من أجلك”. “وهذه القصة تدور حول الوكلاء: الروبوتات التي لا تتحدث معك فحسب، بل تنجز الأشياء نيابةً عنك. سيكون بعض هؤلاء الوكلاء بمثابة أدوات بسيطة جدًا لإنجاز الأمور، بينما سيكون البعض الآخر أشبه بالمتعاونين والرفاق.
كيف تتعامل Google مع التزييف العميق والمعلومات الخاطئة والخصوصية التي يعتمدها الذكاء الاصطناعي
عالجت Google المخاوف بشأن إساءة استخدام المحتوى الناتج عن الذكاء الاصطناعي في شكل معلومات مزيفة ومعلومات مضللة. على سبيل المثال، أعلن المسؤولون التنفيذيون على المسرح أنه سيتم توسيع أداة SynthID من Google لوضع العلامات المائية لاستخدامها عبر محتوى النص والفيديو الذي تم إنشاؤه بواسطة الذكاء الاصطناعي – بما في ذلك وضع علامة مائية على محتوى الفيديو من Veo.
ناقش المسؤولون التنفيذيون في Google أيضًا كيف تخطط الشركة لتحسين حماية الخصوصية عبر منصاتها المختلفة وعلى الأجهزة. هناك طريقة أخرى تتمثل في نموذج جديد للذكاء الاصطناعي يسمى Gemini Nano، والذي سيظهر على أجهزة Google Pixel في وقت لاحق من هذا العام ويتيح للأشخاص الحصول على قدرات الذكاء الاصطناعي التوليدي متعدد الوسائط على هواتفهم بدلاً من إرسال البيانات من الجهاز. تضيف Google أيضًا طرقًا للأجهزة لاكتشاف محاولات الاحتيال مثل عمليات الاحتيال بالذكاء الاصطناعي من مقاطع الفيديو والصوت العميقة أو عمليات الاحتيال النصية.
الذكاء الاصطناعي التوليدي ومستقبل البحث
تخطط Google لتوسيع كيفية استخدامها للذكاء الاصطناعي التوليدي للبحث بطرق جديدة للمستخدمين للتفاعل مع بحث Google وميزات بحث جديدة لـ Gmail وصور Google وتطبيقات أخرى. إحدى الطرق هي من خلال AI Overviews، الذي يلخص نتائج البحث التقليدية. تعتمد هذه الميزة، التي سيتم طرحها في الولايات المتحدة هذا الأسبوع ثم عالميًا لمليار مستخدم بحلول نهاية عام 2024، على عام من اختبارات Google مع تجربة البحث المولدة (SGE) من خلال Search Labs، والتي ظهرت لأول مرة في Google I/O 2023 .
ستساعد تحديثات الذكاء الاصطناعي الأخرى للبحث الأشخاص في العثور على صورهم وإنشاء خطط وجبات وتخطيط الرحلات وتقسيم الاستعلامات إلى أجزاء مختلفة من السؤال. ومع ذلك، فإن Google تتخطى النص لتشمل طرقًا للمستخدمين للبحث في الوقت الفعلي باستخدام مدخلات الصوت والفيديو لطرح أسئلة حول العالم من حولهم. تقوم Google بتأسيس الإجابات عن طريق فهرسة المعلومات حول الموقع وساعات العمل والتقييمات للتأكد من أن الاستعلامات المستندة إلى المكان توفر معلومات محدثة.
يساعد الجمع بين بيانات الموقع والسياق الآخر من اللغة على تحسين الدقة، اعتمادًا على ما يبحث عنه الشخص. عندما فحصت Yext مواقع أكثر من 700000 شركة، وجدت أن الشركات التي لديها معلومات كاملة ودقيقة عبر الإنترنت شهدت زيادة بنسبة 278% في الظهور في نتائج البحث. ومع ذلك، فإن هذا أيضًا يزيد من أهمية الشركات للتأكد من أن معلوماتها عبر الإنترنت دقيقة وحديثة.
نظرًا لأن البحث القائم على الدردشة أصبح أكثر شيوعًا وأكثر فائدة، فقد يؤدي ذلك إلى تحويل بعض المنصات من نماذج تعتمد على الإعلانات إلى نماذج تعتمد على العروض، وفقًا لكريستيان وارد، كبير مسؤولي البيانات في Yext. ويعتقد أن جوجل في وضع قوي يسمح لها بالتحول من الإعلانات إلى العروض، لكنه أضاف أن التحول لن يكون سهلاً.
وقال وارد: “إن Google في وضع استثنائي للانتقال من نموذج الإعلان إلى محرك العروض”. “ويمكنهم أيضًا القيام بذلك كمزاد بالطريقة التي تم تصميمها بها بالفعل مع الإعلانات. يراهن الناس ضد Google، لكن هذه ليست فكرة رائعة… يرجى أن تفهم أن هذه هي أرض معضلة المبتكر حيث سيتم جرهم إلى هذا الركل والصراخ.
على الرغم من كل الابتكارات التي تم طرحها في Google I/O، إلا أن هناك بطاقة جامحة أخرى يمكن أن تتسبب أيضًا في قيام Google بالركل والصراخ: القرار المنتظر من القاضي الفيدرالي الذي يشرف على قضية مكافحة الاحتكار المستمرة. وعلى الرغم من أنه لا يزال من غير الواضح ما الذي قد يحكم عليه في الأسابيع أو الأشهر المقبلة، إلا أن الخبراء قالوا إن الحكم قد يؤثر على جوجل طموحات البحث اعتمادا على النتيجة.
https://digiday.com/?p=544943