تعلن Google عن Gemini، إجابتها "متعددة الوسائط" لـ ChatGPT

في مقطع فيديو تجريبي تم تعديله، يبدو الجوزاء قادرًا على وصف الرسومات التخطيطية وتحديد تحيات الأفلام وإلقاء النكات.

بواسطة أندرو بول | تم النشر في 6 ديسمبر 2023 الساعة 3:20 مساءً بالتوقيت الشرقي

يبدو أن الرسم قريب بدرجة كافية من بطة الجوزاء. جوجل ديب مايند / يوتيوب

يشارك

يوم الاربعاء، أعلنت جوجل وصول تَوأَم، الوسائط المتعددة الجديدة نموذج لغة كبير تم بناؤه من الألف إلى الياء بواسطة قسم الذكاء الاصطناعي بالشركة، العقل العميق. ومن بين وظائفه العديدة، سيدعم Gemini شركة Google بارد، والتي كافحت سابقًا للخروج من ظل روبوت الدردشة الآلي الخاص بها، OpenAI’s ChatGPT.

الائتمان: جوجل ديب مايند / موقع YouTube

وفقا ل تدوينة 6 ديسمبر من الرئيس التنفيذي لشركة Google ساندر بيتشاي و العقل العميق المؤسس المشارك والرئيس التنفيذي ديميس هاسابيس، هناك من الناحية الفنية ثلاثة إصدارات من LLM – Gemini Ultra وPro وNano – مخصصة لتطبيقات مختلفة. يدعم الآن جهاز Gemini Pro “المضبوط بدقة” Bard، في حين سيتم رؤية متغير Nano في منتجات مثل بكسل برو الهواتف الذكية. ستصل متغيرات Gemini أيضًا إلى بحث Google وAds وChrome في الأشهر المقبلة، على الرغم من أن الوصول العام إلى Ultra لن يصبح متاحًا حتى عام 2024.

على عكس العديد من منافسيها في مجال الذكاء الاصطناعي، تم تدريب Gemini ليكون “متعدد الوسائط” منذ الإطلاق، مما يعني أنه يمكنه بالفعل التعامل مع المطالبات النصية والصوتية والصورية. في مرافقة مظاهرة الفيديو، يتم تكليف Gemini شفهيًا بتحديد ما يتم وضعه أمامه (قطعة من الورق) ثم تحديد رسم المستخدم للبطة بشكل صحيح في الوقت الفعلي. ويبدو أن القدرات الأخرى تشمل استنتاج الإجراءات التي تحدث بعد ذلك في مقاطع الفيديو بمجرد إيقافها مؤقتًا، وإنشاء الموسيقى بناءً على المطالبات المرئية، وتقييم الواجبات المنزلية للأطفال – غالبًا بشخصية صفيقة ومعرضة للتلاعب بالألفاظ. ومع ذلك، تجدر الإشارة إلى أن وصف الفيديو يتضمن إخلاء المسؤولية، “لأغراض هذا العرض التوضيحي، تم تقليل زمن الوصول وتم اختصار مخرجات Gemini للإيجاز.”

مرافقة الجوزاء تقرير تقني يشير إلى أن التكرار الأقوى لـ LLM، Ultra، “يتجاوز أحدث النتائج الحالية في 30 من أصل 32 معيارًا أكاديميًا مستخدمًا على نطاق واسع والمستخدمة في [LLM] البحث والتطوير.” ومع ذلك، فإن التحسينات تبدو متواضعة إلى حد ما، حيث أجاب برنامج Gemini Ultra بشكل صحيح على الأسئلة متعددة التخصصات بنسبة 90% من الوقت، مقابل 86.4% من ChatGPT. وبغض النظر عن التقسيم الإحصائي، تشير النتائج إلى أن ChatGPT قد يكون لديه بعض المنافسة الحقيقية مع Gemini.

مما لا يثير الدهشة، أن جوجل حذرت في إعلان يوم الأربعاء من أن نجمها الجديد للذكاء الاصطناعي بعيد عن الكمال، ولا يزال عرضة للتطور على مستوى الصناعة.الهلوسة“التي ابتليت بها التكنولوجيا الناشئة – أي أن LLM سوف يقوم أحيانًا بشكل عشوائي بتكوين إجابات غير صحيحة أو لا معنى لها. قامت Google أيضًا بإخضاع Gemini لـ “تقييمات السلامة الأكثر شمولاً لأي نموذج من نماذج Google AI”، وفقًا لما ذكره إيلي كولينز، نائب رئيس منتج Google DeepMind، الذي تحدث في المؤتمر حدث الإطلاق في 6 ديسمبر. وشمل ذلك تكليف الجوزاء بـ “السمية الحقيقية تطالب“، وهو اختبار طوره معهد ألين للذكاء الاصطناعي يتضمن أكثر من 100000 مدخلات إشكالية تهدف إلى تقييم التحيزات السياسية والديموغرافية المحتملة لنموذج لغوي كبير.

ستواصل Gemini الاندماج في مجموعة منتجات Google في الأشهر المقبلة إلى جانب سلسلة من مراحل الاختبار المغلقة. إذا سارت الأمور كما هو مخطط لها، فسوف يصبح جهاز Bard Advanced ذو القوة الفائقة من Gemini متاحًا للجمهور في وقت ما من العام المقبل – ولكن، كما هو معروف جيدًا حتى الآن، غالبًا ما يكون من الصعب التنبؤ بسباق التسلح القائم على الذكاء الاصطناعي.

عندما سئل عما إذا كان مدعومًا من قبل الجوزاء، أبلغ بارد PopSci “لسوء الحظ” لا تمتلك إمكانية الوصول إلى المعلومات “حول مشاريع Google الداخلية”.

“إذا كنت مهتمًا بمعرفة المزيد عن…”الجوزاء”، فإنني أوصي بالبحث عن المعلومات من خلال قنوات Google الرسمية أو الاتصال بشخص داخل الشركة لديه حق الوصول إلى هذه المعلومات،” كتب بارد إلى PopSci. “أعتذر عن الإزعاج وآمل أن تكون هذه المعلومات مفيدة.”

اقرأ أكثر

تعلن Google عن Gemini، إجابتها “متعددة الوسائط” لـ ChatGPT

Reactions

ردود الفعل