أطلقت Google المرحلة الأولى من نموذج الجيل التالي من الذكاء الاصطناعي، Gemini، اليوم. تعكس شركة Gemini سنوات من الجهود المبذولة من داخل شركة Google، والتي يشرف عليها ويقودها مديرها التنفيذي، ساندر بيتشاي.
(يمكنك قراءة كل شيء عن برج الجوزاء في تقريرنا من ميليسا هيكيلا وويل دوجلاس هيفين هنا.)
من المعروف أن بيتشاي، الذي أشرف سابقًا على Chrome وAndroid، مهووس بالمنتجات. في أوله خطاب المؤسس كرئيس تنفيذي في عام 2016، توقع أن “[w]سوف ننتقل من عالم الهاتف المحمول أولاً إلى عالم الذكاء الاصطناعي أولاً. وفي السنوات التي تلت ذلك، قام Pichai بدمج الذكاء الاصطناعي بعمق في جميع منتجات Google، بدءًا من أجهزة Android وصولاً إلى السحابة.
على الرغم من ذلك، تم تحديد العام الماضي إلى حد كبير من خلال إصدارات الذكاء الاصطناعي من شركة أخرى، OpenAI. لقد هيمن طرح DALL-E وGPT-3.5 العام الماضي، ثم GPT-4 هذا العام، على القطاع وبدأ سباق التسلح بين الشركات الناشئة وعمالقة التكنولوجيا على حدٍ سواء.
الجوزاء هو الآن أحدث جهد في هذا السباق. تمت قيادة هذا النظام المتطور بواسطة Google DeepMind، وهي المنظمة المدمجة حديثًا بقيادة ديميس هاسابيس والتي تجمع فرق الذكاء الاصطناعي في الشركة تحت مظلة واحدة. يمكنك تجربة الجوزاء في بارد اليوم، وسيصبح متكاملاً عبر مجموعة منتجات الشركة طوال عام 2024.
جلسنا مع ساندر بيتشاي في مكاتب جوجل في ماونتن فيو، كاليفورنيا، عشية إطلاق جيميني لمناقشة ما سيعنيه ذلك بالنسبة لجوجل ومنتجاتها والذكاء الاصطناعي والمجتمع بشكل عام.
النص التالي يمثل بيتشاي بكلماته الخاصة. تم تحرير المحادثة من أجل الوضوح وسهولة القراءة.
مراجعة تكنولوجيا معهد ماساتشوستس للتكنولوجيا: لماذا الجوزاء مثير؟ هل يمكنك أن تخبرني ما هي الصورة الكبيرة التي تراها فيما يتعلق بالذكاء الاصطناعي، وقوته، وفائدته، واتجاهه في جميع منتجاتك؟
ساندر بيتشاي: جزء محدد مما يجعلها مثيرة هو أنها نموذج متعدد الوسائط من الألف إلى الياء. تمامًا مثل البشر، لا يقتصر الأمر على التعلم من خلال النص وحده. إنه نص وصوت ورمز. لذا فإن النموذج أكثر قدرة بالفطرة بسبب ذلك، وأعتقد أنه سيساعدنا على اكتشاف قدرات أحدث والمساهمة في تقدم هذا المجال. هذا مشوق.
إنه أمر مثير أيضًا لأن Gemini Ultra هو أحدث ما توصلت إليه التكنولوجيا في 30 من أصل 32 معيارًا رائدًا، وخاصة في معايير الوسائط المتعددة. الذي – التي معيار MMMU– يظهر التقدم هناك. أنا شخصيا أجد ذلك مثيرا في MMLU [massive multi-task language understanding]، والتي كانت واحدة من المعايير الرائدة، فقد تجاوزت عتبة 90٪، وهو إنجاز كبير. كانت الحالة الفنية قبل عامين 30 أو 40٪. لذلك فكر فقط في مدى تقدم هذا المجال. ما يقرب من 89٪ هم خبراء بشريون في هذه المواضيع الـ 57. إنه النموذج الأول الذي يعبر هذه العتبة.
أنا متحمس أيضًا لأنه أصبح أخيرًا في منتجاتنا. سيكون متاحًا للمطورين. إنها منصة. يمثل الذكاء الاصطناعي تحولًا عميقًا في النظام الأساسي، وهو أكبر من الويب أو الهاتف المحمول. ولذا فهي تمثل خطوة كبيرة بالنسبة لنا منذ تلك اللحظة أيضًا.
لنبدأ بتلك المعايير. يبدو أنه متقدم على GPT-4 في جميعها تقريبًا، أو في معظمها، ولكن ليس كثيرًا. في حين بدا GPT-4 بمثابة قفزة كبيرة جدًا للأمام. هل بدأنا في الوصول إلى مرحلة الاستقرار فيما سنرى بعضًا من تقنيات نماذج اللغات الكبيرة قادرة على القيام به، أم هل تعتقد أننا سنستمر في الحصول على منحنيات النمو الكبيرة هذه؟
بادئ ذي بدء، بالنظر إلى الأمام، نرى الكثير من الإرتفاع. بعض المعايير مرتفعة بالفعل. عليك أن تدرك أنه عندما تحاول الوصول إلى نسبة 85%، فأنت الآن على حافة المنحنى. لذلك قد لا يبدو الأمر كثيرًا، لكنه يحرز تقدمًا. سنحتاج إلى معايير أحدث أيضًا. إنه جزء من سبب نظرنا أيضًا إلى معيار MMLU متعدد الوسائط. [For] ومع بعض هذه المعايير الجديدة، فإن الحالة الفنية لا تزال أقل بكثير. هناك الكثير من التقدم في المستقبل. قوانين التوسع لا تزال تعمل. وبينما نجعل النماذج أكبر، سيكون هناك المزيد من التقدم. عندما أتعامل مع الأمر برمته، أشعر حقًا أننا في البداية.
أنا مهتم بما تعتبره الإنجازات الرئيسية التي حققها برج الجوزاء، وكيف سيتم تطبيقها.
من الصعب جدًا على الناس أن يتخيلوا القفزات التي ستحدث. نحن نقدم واجهات برمجة التطبيقات، وسوف يتخيلها الناس بطرق عميقة جدًا.
أعتقد أن تعدد الوسائط سيكون كبيرًا. وبينما نعلم هذه النماذج كيفية التفكير بشكل أكبر، ستكون هناك إنجازات أكبر وأكبر. هناك اختراقات أعمق لم تأت بعد.
إحدى الطرق للتفكير في هذا السؤال هي Gemini Pro. إنه يعمل بشكل جيد جدًا على المعايير. ولكن عندما وضعناه في بارد، شعرت به كمستخدم. لقد قمنا باختباره، وارتفعت معدلات التفضيل في جميع الفئات بشكل ملحوظ. ولهذا السبب نطلق عليها واحدة من أكبر ترقياتنا حتى الآن. وعندما نقوم بإجراء تقييمات عمياء جنبًا إلى جنب، فإن ذلك يُظهر الأداء المتفوق حقًا. لذلك يمكنك جعل هذه النماذج الأفضل تتحسن في المعايير. إنه يحرز تقدما. وسنواصل التدريب ونلتقطه من هناك.
ولكن لا أستطيع الانتظار لوضعه في منتجاتنا. هذه النماذج قادرة جدا. في الواقع، تصميم تجارب المنتج للاستفادة من كل ما تمتلكه العارضات، سيكون أمرًا مثيرًا خلال الأشهر القليلة المقبلة.
أتخيل أنه كان هناك قدر هائل من الضغط لإخراج الجوزاء من الباب. أشعر بالفضول لمعرفة ما تعلمته من خلال رؤية ما حدث مع إصدار GPT-4. ماذا تعلمت؟ ما هي الأساليب التي تغيرت في هذا الإطار الزمني؟
هناك شيء واحد، على الأقل بالنسبة لي: يبدو الأمر بعيدًا جدًا عن لعبة محصلتها صفر، أليس كذلك؟ فكر في مدى عمق التحول إلى الذكاء الاصطناعي، ومدى تقدمنا في هذا التحول. هناك عالم من الفرص في المستقبل.
لكن بالنسبة لسؤالك المحدد، فهو مجال غني نتقدم فيه جميعًا. هناك مكون علمي لها، هناك مكون أكاديمي لها؛ يتم نشرها كثيرًا، ورؤية كيفية عمل نماذج مثل GPT-4 في العالم الحقيقي. لقد تعلمنا من ذلك. السلامة مجال مهم. لذلك، جزئيًا مع جيميني، هناك تقنيات أمان تعلمناها وقمنا بتحسينها بناءً على كيفية عمل النماذج في العالم الحقيقي. إنه يوضح أهمية أشياء مختلفة مثل الضبط الدقيق. واحدة من الأشياء التي أظهرناها ميد بالم 2 كان علينا أن نأخذ نموذجًا مثل PaLM، لضبطه بشكل دقيق ليناسب مجالًا محددًا، وإظهار قدرته على التفوق في الأداء على أحدث النماذج. وكانت تلك هي الطريقة التي تعلمنا بها قوة الضبط الدقيق.
يتم تطبيق الكثير من ذلك ونحن نسير في طريقنا عبر برج الجوزاء. جزء من السبب وراء قضاء المزيد من الوقت مع Ultra [the more advanced version of Gemini that will be available next year] هو التأكد من أننا نختبره بدقة من أجل السلامة. لكننا نقوم أيضًا بضبطه لاستخلاص الإمكانات حقًا.
عندما ترى بعض هذه الإصدارات تخرج ويبدأ الناس في التلاعب بها في العالم الحقيقي، سيكون لديهم الهلوسة، أو يمكنهم الكشف عن بعض البيانات الخاصة التي يتم تدريب نماذجهم عليها. وأتساءل كم من ذلك متأصل في التكنولوجيا، بالنظر إلى البيانات التي تم تدريبها عليها، إذا كان ذلك لا مفر منه. إذا كان الأمر لا مفر منه، ما هي أنواع الأشياء التي تحاول القيام بها للحد من ذلك؟
أنت على حق. هذه كلها مجالات بحثية نشطة. في الواقع، نحن فقط نشرت ورقة مما يوضح كيف يمكن لهذه النماذج أن تكشف عن بيانات التدريب من خلال سلسلة من المطالبات. الهلوسة ليست مشكلة محلولة. وأعتقد أننا جميعا نحرز تقدما في هذا الصدد، وهناك المزيد من العمل الذي يتعين القيام به. هناك بعض القيود الأساسية التي نحتاج إلى العمل من خلالها. أحد الأمثلة على ذلك هو أنك إذا كنت تستخدم Gemini Ultra، فإننا نعمل بنشاط على تجميع هذه النماذج مع أطراف ثالثة خارجية تستخدمها، وهي متخصصة في هذه الأشياء.
وفي مجالات مثل تعدد الوسائط، نريد أن نكون جريئين ونريد أن نكون مسؤولين. سنكون أكثر حرصًا عند استخدام الوسائط المتعددة، لأن فرص حالات الاستخدام الخاطئ تكون أعلى.
لكنك على حق فيما يتعلق بأنها لا تزال تقنية قيد التقدم، ولهذا السبب لن تكون منطقية لكل شيء. ولهذا السبب، أثناء البحث، نكون أكثر حرصًا بشأن كيفية استخدامه، ومتى وماذا، وأين نستخدمه، ثم متى نقوم بتشغيله. لديهم هذه القدرات المذهلة، ولديهم عيوب واضحة. وهذا هو العمل الشاق الذي ينتظرنا جميعا.
هل تعتقد أن هذه ستكون مشكلة محلولة في نهاية المطاف، هلوسة أم الكشف عن بيانات تدريب أخرى؟
مع التكنولوجيا الحالية للماجستير في القانون ذاتي الانحدار، فإن الهلوسة ليست مشكلة محلولة. لكن أنظمة الذكاء الاصطناعي المستقبلية قد لا تبدو مثل ما لدينا اليوم. هذه نسخة واحدة من التكنولوجيا. يبدو الأمر كما لو كان الناس يعتقدون أنه لا توجد طريقة لوضع جهاز كمبيوتر في جيبك. كان هناك أشخاص عنيدون حقًا، قبل 20 عامًا. وبالمثل، عند النظر إلى هذه الأنظمة والقول إنه لا يمكنك تصميم أنظمة أفضل. أنا لا أشترك في هذا الرأي. هناك بالفعل العديد من الاستكشافات البحثية الجارية للتفكير في كيفية مواجهة هذه المشكلات.
لقد تحدثت عن مدى عمق هذا التحول. وفي بعض هذه التحولات الأخيرة، مثل التحول إلى الهاتف المحمول، لم يؤدي ذلك بالضرورة إلى زيادة الإنتاجية، التي ظلت ثابتة لفترة طويلة. أعتقد أن هناك حجة مفادها أنه ربما أدى إلى تفاقم عدم المساواة في الدخل. ما نوع العمل الذي تقوم به جوجل لمحاولة التأكد من أن هذا التحول يعود بالنفع على المجتمع على نطاق أوسع؟
إنه سؤال مهم للغاية. أفكر في الأمر على عدة مستويات. أحد الأمور التي ركزنا عليها دائمًا في Google هو: كيف يمكننا الوصول إلى التكنولوجيا على أوسع نطاق ممكن؟ لذلك أود أن أزعم أنه حتى في حالة الهاتف المحمول، والعمل الذي نقوم به باستخدام Android، فإن مئات الملايين من الأشخاص لم يكن لديهم إمكانية الوصول إلى الكمبيوتر لولا ذلك. نحن نعمل بجد للدفع نحو هاتف ذكي بأسعار معقولة، ربما أقل من 50 دولارًا.
لذا فإن جعل الذكاء الاصطناعي مفيدًا للجميع هو الإطار الذي أفكر فيه. تحاول تعزيز الوصول إلى أكبر عدد ممكن من الأشخاص. أعتقد أن هذا جزء واحد منه.
نحن نفكر بعمق في تطبيقه على حالات الاستخدام التي يمكن أن تفيد الأشخاص. على سبيل المثال، السبب وراء قيامنا بالتنبؤ بالفيضانات في وقت مبكر هو أننا أدركنا أن الذكاء الاصطناعي يمكنه اكتشاف الأنماط والقيام بذلك بشكل جيد. نحن نستخدمه لترجمة 1000 لغة. نحن نحاول حرفيًا الآن تقديم المحتوى بلغات لم تكن لتتمكن من الوصول إليها لولا ذلك.
هذا لا يحل جميع المشاكل التي تتحدث عنها. لكن كونك متعمدًا بشأن الزمان والمكان، ونوع المشكلات التي ستركز عليها – فقد ركزنا دائمًا على ذلك. خذ مناطق مثل AlphaFold. لقد قمنا بتوفير قاعدة بيانات مفتوحة للفيروسات في كل مكان في العالم. لكن… من يستخدمه أولاً؟ أين يتم بيعه؟ لن يعمل الذكاء الاصطناعي على تحسين الأمور بطريقة سحرية في بعض القضايا الأكثر صعوبة مثل عدم المساواة؛ يمكن أن يؤدي إلى تفاقمها.
ولكن المهم هو التأكد من أن التكنولوجيا متاحة للجميع. أنت تقوم بتطويره مبكرًا وتمنح الأشخاص إمكانية الوصول والمشاركة في المحادثة حتى يتمكن المجتمع من التفكير فيه والتكيف معه.
لقد شاركنا بالتأكيد في هذه التكنولوجيا مبكرًا عن التقنيات الأخرى. كما تعلمون، منتدى سلامة الذكاء الاصطناعي الأخير في المملكة المتحدة أو العمل في الولايات المتحدة مع الكونجرس والإدارة. ونحن نحاول إقامة المزيد من الشراكات بين القطاعين العام والخاص، وجذب المؤسسات غير الربحية والأكاديمية في وقت مبكر.
التأثيرات على مجالات مثل الوظائف تحتاج إلى دراسة عميقة، لكنني أعتقد أن هناك مفاجآت. ستكون هناك عوامل خارجية إيجابية مفاجئة، وستكون هناك عوامل خارجية سلبية أيضًا. إن حل العوامل الخارجية السلبية أكبر من أي شركة واحدة. إنه دور جميع أصحاب المصلحة في المجتمع. لذلك ليس لدي إجابات سهلة هناك.
يمكنني أن أقدم لك الكثير من الأمثلة على الفوائد التي يجلبها الهاتف المحمول. وأعتقد أن هذا سيكون صحيحا بالنسبة لهذا أيضا. لقد أظهرنا ذلك بالفعل مع مجالات مثل اعتلال الشبكية السكري. لا يوجد عدد كافٍ من الأطباء في أجزاء كثيرة من العالم لاكتشافه.
مثلما شعرت أن منح الأشخاص إمكانية الوصول إلى بحث Google في كل مكان في العالم قد أحدث فرقًا إيجابيًا، أعتقد أن هذه هي الطريقة للتفكير في توسيع الوصول إلى الذكاء الاصطناعي.
من الواضح أن هناك أشياء ستجعل الناس أكثر إنتاجية. البرمجة هي مثال عظيم على هذا. ومع ذلك، فإن إضفاء الطابع الديمقراطي على هذه التكنولوجيا هو الشيء ذاته الذي يهدد الوظائف. وحتى لو لم تكن لديك كل الإجابات للمجتمع، فهي كذلك لا يتعين على شركة واحدة أن تحل مشاكل المجتمع – شركة واحدة يستطيع طرح منتج يمكنه تغيير العالم بشكل كبير ويكون له هذا التأثير العميق.
لم نقدم أبدًا واجهات برمجة التطبيقات للتعرف على الوجه. لكن الناس قاموا ببناء واجهات برمجة التطبيقات (APIs) والتكنولوجيا تتقدم للأمام. لذلك فهي أيضًا ليست في أيدي أي شركة واحدة. التكنولوجيا سوف تتحرك إلى الأمام.
أعتقد أن الإجابة أكثر تعقيدًا من ذلك. ويمكن للمجتمعات أيضا أن تتخلف عن الركب. إذا لم تعتمد هذه التقنيات، فقد يؤثر ذلك على قدرتك التنافسية الاقتصادية. يمكن أن تفقد المزيد من الوظائف.
أعتقد أن الإجابة الصحيحة هي نشر التكنولوجيا بشكل مسؤول وإحراز التقدم والتفكير في المجالات التي يمكن أن تسبب فيها ضررًا غير متناسب والعمل على تخفيفه. سيكون هناك أنواع أحدث من الوظائف. إذا نظرت إلى الخمسين أو الستين عامًا الماضية، فستجد دراسات أجراها اقتصاديون من معهد ماساتشوستس للتكنولوجيا تظهر أن معظم الوظائف الجديدة التي تم إنشاؤها موجودة في مجالات جديدة ظهرت منذ ذلك الحين.
سيكون هناك وظائف جديدة يتم إنشاؤها. ستكون هناك وظائف تم تحسينها، حيث يتم تحرير بعض الأعمال المتكررة بطريقة يمكنك من خلالها التعبير عن نفسك بشكل أكثر إبداعًا. يمكن أن تكون طبيبًا، أو أخصائي أشعة، أو مبرمجًا. مقدار الوقت الذي تقضيه في المهام الروتينية مقابل التفكير العالي المستوى، كل ذلك يمكن أن يتغير، مما يجعل الوظيفة ذات معنى أكبر. ثم هناك وظائف يمكن أن يتم تشريدها. إذن، كمجتمع، كيف يمكنك إعادة تدريب الأشخاص وصقل مهاراتهم وخلق الفرص؟
لقد أظهر العام الماضي بالفعل هذا الانقسام الفلسفي في الطريقة التي يعتقد الناس أننا يجب أن نتعامل بها مع الذكاء الاصطناعي. يمكنك التحدث عن ذلك على أنه السلامة أولاً أو حالات الاستخدام التجاري أولاً، أو عوامل التسريع مقابل المدمرين. أنت في وضع يتعين عليك فيه جسر كل تلك الفلسفة وجمعها معًا. وأتساءل ما رأيك شخصيًا في محاولة ربط هذه الاهتمامات في Google، التي ستكون رائدة في هذا المجال، بهذا العالم الجديد.
أنا متفائل بالتكنولوجيا. لقد شعرت دائمًا، على أساس حياتي الشخصية، الإيمان بالناس والإنسانية. وبشكل عام، أعتقد أن البشرية سوف تسخر التكنولوجيا لصالحها. لذلك كنت دائما متفائلا. أنت على حق: هناك تقنية قوية مثل الذكاء الاصطناعي، لها ازدواجية.
مما يعني أنه ستكون هناك أوقات سنتحرك فيها للأمام بجرأة لأنني أعتقد أنه يمكننا دفع أحدث ما توصلت إليه التكنولوجيا. على سبيل المثال، إذا كان الذكاء الاصطناعي قادرًا على مساعدتنا في حل مشكلات مثل السرطان أو تغير المناخ، فأنت تريد أن تفعل كل ما في وسعك للمضي قدمًا بسرعة. لكنك بالتأكيد بحاجة إلى أن يقوم المجتمع بتطوير أطر للتكيف، سواء كان ذلك مع التزييف العميق أو إزاحة الوظائف، وما إلى ذلك. وستكون هذه حدودًا جديدة، ولا تختلف عن تغير المناخ. سيكون هذا واحدًا من أكبر الأشياء التي نتعامل معها جميعًا في العقد القادم.
هناك أمر كبير آخر غير مستقر وهو المشهد القانوني حول الذكاء الاصطناعي. هناك أسئلة حول الاستخدام العادل، وأسئلة حول القدرة على حماية المخرجات. ويبدو أن هذا سيكون أمرًا كبيرًا بالنسبة للملكية الفكرية. ماذا تقول للأشخاص الذين يستخدمون منتجاتك، لمنحهم الشعور بالأمان، وأن ما يفعلونه لن يؤدي إلى مقاضاتهم؟
هذه ليست كل المواضيع التي سيكون لها إجابات سهلة. عندما نبني منتجات، مثل البحث وYouTube وأشياء من عالم ما قبل الذكاء الاصطناعي، كنا نحاول دائمًا الحصول على تبادل القيمة بشكل صحيح. الأمر لا يختلف بالنسبة للذكاء الاصطناعي. نحن نركز بالتأكيد على التأكد من قدرتنا على التدريب على البيانات المسموح بالتدريب عليها، بما يتوافق مع القانون، مما يتيح للأشخاص فرصة اختيار عدم المشاركة في التدريب. ثم هناك طبقة حول ذلك — حول ما هو الاستخدام العادل. من المهم خلق قيمة لمنشئي المحتوى الأصلي. هذه مجالات مهمة. وكان الإنترنت مثالا على ذلك. أو عندما بدأت التجارة الإلكترونية: كيف ترسم الخط الفاصل بين التجارة الإلكترونية والتجارة العادية؟
سيكون هناك أطر قانونية جديدة يتم تطويرها مع مرور الوقت، وأعتقد أن هذا هو ما سأفكر به مع تطور هذا المجال. ولكن في الوقت نفسه، سنعمل جاهدين لنكون على الجانب الصحيح من القانون ونتأكد من أن لدينا أيضًا علاقات عميقة مع العديد من مقدمي المحتوى اليوم. هناك بعض المجالات التي يكون فيها الأمر مثيرًا للجدل، ولكننا نعمل على حل هذه الأمور، وأنا ملتزم بالعمل على اكتشاف ذلك. يتعين علينا إنشاء نظام بيئي مربح للجانبين حتى يعمل كل هذا مع مرور الوقت.
الشيء الذي يشعر الناس بالقلق الشديد بشأنه فيما يتعلق بالويب الآن هو مستقبل البحث. عندما يكون لديك نوع من التكنولوجيا يجيب فقط على أسئلتك، بناءً على معلومات من جميع أنحاء الويب، فهناك خوف من أن الأشخاص قد لا يعودون بحاجة إلى زيارة تلك المواقع. ويبدو أن هذا أيضًا قد يكون له آثار على Google. وأتساءل أيضًا عما إذا كنت تفكر في الأمر فيما يتعلق بعملك الخاص.
أحد عروض القيمة الفريدة التي قدمناها في البحث هو أننا نساعد المستخدمين في العثور على أشياء جديدة وتعلمها، والعثور على الإجابات، ولكن دائمًا بهدف مشاركة الثراء والتنوع الموجود على الويب معهم. سيكون هذا صحيحًا، حتى ونحن نمضي في رحلتنا مع تجربة البحث المولدة. إنه مبدأ مهم نقوم من خلاله بتطوير منتجنا. لا أعتقد أن الأشخاص يأتون دائمًا إلى “بحث Google” قائلين: “فقط أجب عن السؤال نيابةً عني”. قد يكون هناك سؤال أو سؤالين قد ترغب في ذلك، ولكن حتى بعد ذلك تعود، وتتعلم المزيد، أو حتى في تلك الرحلة، تتعمق أكثر. نريد دائمًا التأكد من أننا نقوم بالأمر بشكل صحيح. ولا أعتقد أن هذا سيتغير. من المهم أن نحصل على التوازن هناك.
وبالمثل، إذا قدمت قيمة بعمق، فستكون هناك قيمة تجارية فيما تقدمه. كانت لدينا أسئلة مثل هذه من سطح المكتب إلى الهاتف المحمول. انها ليست جديدة بالنسبة لنا. أشعر بالارتياح بناءً على كل ما نراه وكيفية استجابة المستخدمين للإعلانات عالية الجودة. يعد YouTube مثالًا جيدًا حيث قمنا بتطوير نماذج الاشتراك. لقد نجح هذا أيضًا بشكل جيد.
كيف تعتقد أن تجربة الأشخاص ستتغير في العام المقبل، حيث تبدأ هذه المنتجات في الوصول إلى السوق بالفعل ويبدأون في التفاعل؟ كيف ستتغير تجربتهم؟
أعتقد أنه بعد مرور عام من الآن، فإن أي شخص يبدأ في شيء ما في محرر مستندات Google سيتوقع شيئًا مختلفًا. وإذا أعطيتهم إياه، ثم أعدتهم لاحقًا إلى إصدار مستندات Google الذي كان لدينا، على سبيل المثال، في عام 2022، فسيجدونه قديمًا جدًا. يبدو الأمر كما لو أنه، بالنسبة لأطفالي، إذا لم يكن لديهم تدقيق إملائي، فسيعتقدون بشكل أساسي أنه معطل. وربما نتذكر أنا وأنت ما يعنيه استخدام هذه المنتجات قبل التدقيق الإملائي. ولكن أكثر من أي شركة أخرى، قمنا بدمج قدر كبير من الذكاء الاصطناعي في البحث، حيث يعتبره الناس أمرًا مفروغًا منه. هذا شيء واحد تعلمته مع مرور الوقت. إنهم يعتبرونها أمرا مفروغا منه.
فيما يتعلق بالأشياء الجديدة التي يمكن للأشخاص القيام بها، فبينما نطور قدرات الوسائط المتعددة، سيتمكن الأشخاص من القيام بمهام أكثر تعقيدًا بطريقة لم يكونوا قادرين على القيام بها من قبل. وستكون هناك حالات استخدام حقيقية تكون أكثر قوة.
تصحيح: تم تحديث هذه القصة لإصلاح أخطاء النسخ. والجدير بالذكر أنه تم نسخ MMMU بشكل غير صحيح على أنها MMLU، وظهرت تجربة البحث المولدة في الأصل كتجربة متعلقة بالبحث.