تجريب مع إجابة بحث Google على ChatGPT

نهاية الأسبوع الماضي ، أنا لجأت إلى بحث Google للمساعدة في معرفة عدد الطوابع التي أحتاجها لوضعها على قطعة بريد حجمها 8 أونصات. (بطبيعة الحال ، كنت أرسل نسخة من أحدث إصدار من WIRED!). إنه بالضبط نوع السؤال الذي كنت آمله ميزة AI التوليدية الجديدة لبحث Google، التي كنت أختبرها خلال الشهر الماضي ، من شأنها أن تحلها بشكل أسرع بكثير مما أستطيع من خلال التصفح الخاص بي.

تُعرف Google باسم Search Generative Experience ، SGE باختصار ، بدمج مربع البحث الخاص بها بوظيفة محادثة شبيهة بـ ChatGPT. يمكنك التسجيل في مختبرات البحث في Google. تقول الشركة إنها تريد من المستخدمين التحدث مع برنامج chatbot الخاص بالبحث ، والذي تم إطلاقه للمختبرين في مايو ، للتعمق في الموضوعات وطرح أسئلة أكثر تحديًا وبديهية مما قد يكتبونه في مربع استعلام قديم ممل. وتهدف الإجابات التي تم إنشاؤها بواسطة الذكاء الاصطناعي إلى تنظيم المعلومات بشكل أكثر وضوحًا من صفحة نتائج البحث التقليدية – على سبيل المثال ، عن طريق تجميع المعلومات من مواقع ويب متعددة. تتم معظم عمليات البحث على الويب في العالم من خلال Google ، وقد طورت تقنيات الذكاء الاصطناعي لفترة أطول من معظم الشركات ، لذلك من العدل أن نتوقع تجربة من الدرجة الأولى.

هكذا تقول النظرية. اتضح أنه من الناحية العملية ، تعد الميزة الجديدة أكثر إزعاجًا من المساعد. إنه بطيء ، غير فعال ، مطوّل ، ومشوش – تدخل اصطناعي أكثر من الذكاء.

بمجرد الوصول إلى اختبار Google ، يبدو مربع البحث دون تغيير. ولكن رداً على استفسار مثل “كم عدد الطوابع المرسلة بحرف 8 أونصة” ، يحتل قسم جديد جزءًا كبيرًا من الشاشة ، مما يؤدي إلى خفض قائمة الروابط التقليدية. في هذا المجال ، تُنشئ نماذج اللغات الكبيرة في Google بضع فقرات مشابهة لما قد تجده من ChatGPT أو دردشة بنج من Microsoft. تؤدي الأزرار الموجودة في الجزء السفلي إلى واجهة chatbot حيث يمكنك طرح أسئلة متابعة.

أول ما لاحظته في رؤية Google لمستقبل البحث هو تباطؤها. في الاختبارات التي قمت فيها بالتحكم في تطبيق ساعة توقيت بيد واحدة وقدمت استعلامًا باليد الأخرى ، استغرق الأمر في بعض الأحيان ما يقرب من ست ثوانٍ حتى يتمكن مُنشئ النصوص من Google من إخراج إجابته. كانت القاعدة أكثر من ثلاث ثوانٍ ، مقارنة بما لا يزيد عن ثانية واحدة لظهور نتائج Google التقليدية. كان من الممكن أن تكون الأمور أسوأ: لقد أجريت اختباراتي بعد أن طرحت Google تحديثًا تدعي أنها ضاعفت من سرعة روبوت البحث الشهر الماضي. ومع ذلك ، ما زلت أجد نفسي في كثير من الأحيان متعمقًا في قراءة النتائج العادية بحلول الوقت الذي ينتهي فيه الذكاء الاصطناعي التوليدي ، مما يعني في نهاية المطاف أنني أتجاهل أطروحاته المقدمة متأخرًا. أخبرتني كاثي إدواردز ، نائبة رئيس بحث Google ، أن تحسينات السرعة لبرنامج الذكاء الاصطناعي الذي تقوم عليه الأداة جارية.

يمكن للمرء أن يبرر بطء هذا الشكل الجديد من البحث إذا كانت النتائج جديرة بالاهتمام. لكن الدقة متقطعة. تضمنت استجابة الذكاء الاصطناعي التوليدية المكونة من خمس جمل من Google على سؤال الطوابع أخطاء واضحة في كل من الضرب والطرح ، وأسعار الطوابع التي عفا عليها الزمن لمدة عامين ، واقترح أسئلة متابعة تتجاهل المتغيرات الحاسمة لتكاليف الشحن ، مثل الشكل والحجم والوجهة. بيان إخلاء المسؤولية الذي يعرضه Google في الجزء العلوي من كل إجابة تم إنشاؤها بواسطة الذكاء الاصطناعي كان صحيحًا بشكل مدوٍ: “الذكاء الاصطناعي التوليدي هو تجريبي. قد تختلف جودة المعلومات. “

في نفس الرد ، اقترحت ميزة البحث الجديدة في Google أنني سأحتاج إلى طوابع بقيمة 2.47 دولار أو 4 دولارات. قدم الانتقال إلى الآلة الحاسبة عبر الإنترنت لخدمة البريد الأمريكية الإجابة الرسمية: كنت بحاجة إلى 3.03 دولار ، أو خمسة طوابع بسعر 66 سنتًا لكل منها دفعة زائدة قدرها 27 سنتًا. يقول إدواردز من Google إن استفساري المتواضع دفع حدود التكنولوجيا الحالية. وهي تقول: “إنها بالتأكيد على الحدود”.

لسوء الحظ ، فإن التهدئة لم تنته بشكل جيد أيضًا. عندما سُئلت عن سعر الطابع فقط ، ردت Google برقم قديم. فقط تحديد أنني أردت السعر اعتبارًا من هذا الشهر جعل النظام يعكس ارتفاع التكلفة هذا الشهر بنسبة 3 سنتات بشكل صحيح. لكي نكون منصفين ، فإن ChatGPT قد تخفق في هذا الاستعلام أيضًا لأن بيانات التدريب الخاصة بها تتوقف في عام 2021 – لكنها ليست في موضعها كبديل لمحرك بحث.

تبدو تجربة البحث الجديدة في Google غير موثوقة بدرجة كافية لدرجة أنني أفضل حالًا بمجرد النقر فوق النتائج القياسية لإجراء بحثي الخاص. أدى الاستعلام عن ألعاب فيديو Star Wars التي طورتها شركة Electronic Arts إلى إنشاء قائمة دقيقة باستثناء إدراج عنوان واحد من منافس EA Ubisoft. ومن المفارقات أن الوصف التوليدي للذكاء الاصطناعي للعبة في النتيجة ذكر أنه تم إجراؤه بواسطة Ubisoft ، مما يوضح كيف يمكن أن تتعارض نماذج اللغة الكبيرة مع نفسها.

عندما سئل عن اللاعبين الذين قد يحاول فريق San Diego Padres – الذي سيهزم Steven’s Phillies بالتأكيد – الحصول عليه من خلال مبادلة مع فريق بيسبول آخر ، بدأت استجابة Google للذكاء الاصطناعي مع لاعبين حاليًا في Padres ، مما يربك رقائق التجارة مثل أهداف التجارة.

وضعت جوجل في بعض الإجراءات الوقائية. لا يتم عرض تجربة البحث الجديدة لبعض الاستفسارات الصحية أو المالية ، والتي وضعت Google شريطًا أعلى لدقتها. وتتميز التجربة دائمًا بشكل بارز تقريبًا بروابط إلى الموارد ذات الصلة على الويب لمساعدة المستخدمين في تأكيد مخرجات الذكاء الاصطناعي. النتائج على طلبات بحث مثل “كتابة قصيدة” تتضمن إخلاء المسؤولية “قد ترى محتوى إبداعيًا غير دقيق”. ولن يحاول نظام الذكاء الاصطناعي عمومًا أن يبدو لطيفًا جدًا أو يتبنى شخصية. يقول إدواردز: “لا نعتقد أن الناس يريدون التحدث إلى Google حقًا” ، مقارناً بذلك بينغ شات، والتي من المعروف أنها تدخل في حديث الشخص الأول أو ترش الرموز التعبيرية.

في بعض الأحيان ، قد تبدو رؤية Google الجديدة للبحث وكأنها خطوة إلى الوراء أكثر من كونها قفزة في المستقبل. يمكن أن تكرر الإجابات التي تم إنشاؤها ميزات أخرى في صفحة النتائج ، مثل المقتطفات المميزة التي ترسم إجابة واضحة وسهلة الفهم من موقع ويب أو مربعات المعرفة التي توفر نظرة عامة بطول الفقرة لموضوع من ويكيبيديا. عندما تتناغم في وقت متأخر مع نتائج مثل تلك ، فإن إصدار الذكاء الاصطناعي التوليدي يميل إلى أن يكون أكثر الكلمات والأكثر تعقيدًا لفهمها.

ذكر إدواردز ثماني مرات على الأقل في مناقشتنا التي استمرت 30 دقيقة حول تجربتي مع الميزة الجديدة التي لا تزال في وقت مبكر في تطويرها مع الكثير من مكامن الخلل التي يجب حلها. تقول: “لا أعتقد أنك ستسمعني أقول إننا قمنا بهذا”. “نحن في بداية قوس من التحول لمدة 10 سنوات.” وتقول أيضًا إن التعليقات حتى الآن كانت “إيجابية للغاية” ، ولكن ربما الأهم من ذلك أنها تقول إن ما تطلقه Google في النهاية لجميع المستخدمين “قد يبدو مختلفًا تمامًا عما نحن عليه اليوم”.

تجربة أسرع ، وأقل ازدحامًا بالمحتوى ، وقادرة على المساعدة في إرسال مشكلات WIRED للقراء دون المخاطرة بإعادتهم مقابل رسوم بريد منخفضة الأجر سيكون أمرًا رائعًا.

السفر عبر الزمن

بدأ سعي Google للرد على أسئلة المستخدمين بإجابات مباشرة منذ سنوات. في عام 2016 ، كتب الكاتب آنذاك كادي ميتز عن ذلك كيف جمعت Google حوالي 100 دكتوراه في علم اللغة يجيد حوالي عشرين لغة لتكثيف الكتابة والتعليق التوضيحي للجمل للمساعدة في تدريب أنظمة الذكاء الاصطناعي على فهم كيفية عمل اللغة البشرية. توقعت Google نمو الفريق والتكنولوجيا لسنوات قادمة.

تم نشر هذه “خوارزميات ضغط الجملة” على سطح المكتب لمحرك البحث. إنهم يتعاملون مع مهمة بسيطة جدًا بالنسبة للبشر ولكنها كانت تقليديًا صعبة للغاية بالنسبة للآلات. يُظهرون كيف يعمل التعلم العميق على تطوير فن فهم اللغة الطبيعية ، والقدرة على فهم الكلام البشري الطبيعي والاستجابة له. يقول David Orr ، مدير منتج الأبحاث في Google ، عن أعمال ضغط الجملة في الشركة: “تحتاج إلى استخدام الشبكات العصبية – أو على الأقل هذه هي الطريقة الوحيدة التي وجدناها للقيام بذلك”.

تدرب Google هذه الشبكات العصبية باستخدام البيانات التي تم إنشاؤها يدويًا بواسطة فريق هائل من علماء اللغة الحاصلين على درجة الدكتوراه يطلقون عليه اسم Pygmalion. في الواقع ، تتعلم آلات Google كيفية استخراج الإجابات ذات الصلة من السلاسل النصية الطويلة من خلال مشاهدة البشر يقومون بذلك – مرارًا وتكرارًا. تظهر هذه الجهود المضنية كلاً من قوة وقيود التعلم العميق. لتدريب أنظمة الذكاء الاصطناعي مثل هذه ، تحتاج إلى الكثير والكثير من البيانات التي تم غربلتها بواسطة الذكاء البشري. هذا النوع من البيانات ليس سهلاً – أو رخيصًا. ولن تختفي الحاجة إليه قريبًا.

ولكن بعد عام واحد فقط ، ابتكر باحثو Google نهجًا جديدًا لتدريب الذكاء الاصطناعي الذي جعل الكثير من هذا الإعداد غير ضروري وأدى إلى نماذج اللغات الكبيرة التي تكمن وراء خدمات مثل ChatGPT وبحث Google الجديد. إذا نظرنا إلى الوراء ، لا أمانع في الحصول على مقتطفات إجابة بحث Google الواضحة للسنوات الماضية.

اسألني شيئًا واحدًا

تسأل جينيفر فينيكس ، عبر Facebook ، عن سبب استمرار استخدام أدوات إنشاء الصور بالذكاء الاصطناعي في إساءة استخدام الأيدي والأصابع. تقول: “قرأت ذلك بسبب التعقيد ، لكنني أعتقد أن العلاج هو المزيد من التدريب على تلك الميزات.”

أنا معك يا جينيفر. بعد قراءة سؤالك ، حاولت إنشاء صور “يد بها وشم خاتم لغروب الشمس” نسخة تجريبية من أداة AI Stable Diffusion. كانت الدفعة المكونة من أربع نتائج حصلت عليها تظهر أصابع وأيادي مفككة ومتذبذبة مع أرقام مفقودة أو معصمين نحيفين بشكل غير طبيعي أو مفاصل أصابع عملاقة. في المقابل ، فإن طلب البحث “وجه مع وشم على خده بسبب غروب الشمس” قد أدى إلى بعض الصور البرية ، ولكن على الأقل بدت الوجوه واقعية.

صورة تم إنشاؤها بواسطة منظمة العفو الدولية.

انتشار مستقر عبر باريش ديف

فعل براناف ديكسيت الغوص العميق في BuzzFeed News (RIP) في وقت سابق من هذا العام في تاريخ الأيدي في الفن ، وكتبت أن حقيقة أن أيدي الناس غالبًا ما تكون مشغولة – بحمل الأكواب ، على سبيل المثال – يمكن أن تفسر لماذا تكافح أنظمة الذكاء الاصطناعي لإعادة إنشائها بشكل واقعي. نيويوركركما نظر كايل تشيكا من فريق العمل في هذه القضية ، مشيرًا إلى أن إصدار أوامر أكثر دقة لمولدات صور الذكاء الاصطناعي حول ما يجب أن تفعله الأيدي يمكن أن يساعد.

كما تقول ، جينيفر ، فإن إلقاء بيانات أفضل أو أكثر تنوعًا في أنظمة الذكاء الاصطناعي غالبًا ما يؤدي إلى نتائج أكثر دقة. اكتشف بعض المستخدمين تحسينات متواضعة في إخراج الأيدي في “v5” لمولد الذكاء الاصطناعي في Midjourney في وقت سابق من هذا العام. لكن ديفيد هولز ، الرئيس التنفيذي لشركة Midjourney ، أخبرني عبر البريد الإلكتروني أن الشركة “لم تفعل شيئًا محددًا للأيدي. تعمل أشياءنا بشكل أفضل في الإصدار 5 “.

من ناحية أخرى ، عمل Stability AI المطور لـ Stable Diffusion على مشكلة اليدين بشكل خاص أثناء تطويره أحدث إصدار، الذي صدر هذا الأسبوع. يقول جو بينا ، رئيس قسم التعلم الآلي التطبيقي في Stability ، إن الأيدي التي يتم إنشاؤها بشكل سيء كانت الشكوى الأولى من المستخدمين. عندما حاول النموذج الجديد مع استفساري عن وشم يدي ، ظهرت صورتان بشكل جيد بينما افتقرت الصورتان الأخريان إلى بعض المفاصل.

صورة تم إنشاؤها بواسطة منظمة العفو الدولية.

انتشار مستقر عبر باريش ديف

يقول بينا إن النموذج الجديد لديه حوالي ثمانية أضعاف قدرة الطراز السابق على تعلم الأنماط المرئية للتكاثر ، مما يعني أنه يمكنه تذكر المزيد حول الشكل الذي يجب أن تبدو عليه الأيدي. كما أعطتها الشركة أيضًا تدريبًا إضافيًا على صور الأشخاص والأعمال الفنية ، لتعكس أكثر ما يثير اهتمام المستخدمين. الآن ، كما تقول بينا ، “إنها تتذكر أشياء مثل الأيدي كثيرًا.”

يقول بينا إن إدخال ملايين الصور الإضافية للأيدي في بيانات التدريب أدى في الواقع إلى تفاقم الصور المولدة للأيدي ، مما يجعلها كبيرة الحجم ، لكنه يقول إن الشركة تختبر أساليب مختلفة لدفع المزيد من التحسين.

قبل التحدث إلى Penna ، افترضت أن مطوري الذكاء الاصطناعي قد يرغبون في تجنب تحقيق الكمال لأن الأيدي غير الكاملة هي طريقة شائعة لاكتشاف التزييف العميق. يقول Penna إن الأمر لم يكن كذلك ، لكن هذا Stability اتخذ خطوات أخرى للتأكد من أنه واضح عندما يتم إنشاء الصور باستخدام تقنيتها. يقول: “لن نعود لبناء أيدي أسوأ ، لذلك دعونا نبدأ في توخي الحذر الشديد مع الصور التي نراها على الإنترنت”.

مع فشل بنية العظام في الاستقرار ، ربما بعد ذلك يمكن للشركات أن تأخذ حقيقة أن جميع الصور الـ 12 التي قمت بإنشائها من الاختبار الخاص بي تحث على تصوير أيدي بشرة ناعمة؟ سأترك شرح ذلك لستيفن في نص عادي مستقبلي.

يمكنك إرسال الأسئلة إلى mail@wired.com. يكتب اسأل ليفي في سطر الموضوع.

تاريخ نهاية تايمز

اعتقدت أنه لا يمكن أن يكون أكثر فظاعة من الجبل صودا ندى فلامين الساخنة؟ يحاول سكيتلز بنكهة الخردل الحلوى ، وسيلة للتحايل ليوم الخردل الوطني في الولايات المتحدة الأسبوع المقبل.

أخيراً وليس آخراً

فوتثرما عاد! لكن الحلقة الأولى جعلتني أضحك مرة واحدة فقط (عندما اتصل روبوت كوميدي بغرفة مليئة بالأصدقاء أيضًا بجهاز الكمبيوتر). يدور العرض حول نقد عالمنا الحديث المتمحور حول التكنولوجيا. لسوء الحظ ، يبدو أنه يتم اختيار أهداف سهلة.

يعد الاتحاد الأوروبي قاعدة بيانات ضخمة لجميع قرارات الإشراف على المحتوى من قبل شركات التواصل الاجتماعي والأسباب الكامنة وراءها.

سخونة تغذية البيانات الجديدة في التكنولوجيا؟ بيانات القتال من أوكرانيا لتدريب برامج الذكاء الاصطناعي العسكرية.

العدالة الأهلية: شخص ضعيف البصر تعرض للاحتيال من جهاز كمبيوتر محمول تعاون مع صديق لمواجهة المحتال. الدليل الآن مع الشرطة.

اقرأ أكثر

تجريب مع إجابة بحث Google على ChatGPT

Reactions

ردود الفعل