يعد تحليل الكود وفهم كميات كبيرة من النص وترجمة اللغة من خلال التعلم من قراءة واحدة للكتاب من بين إنجازات Gemini 1.5
كشف ديميس هاسابيس، الرئيس التنفيذي لشركة Google DeepMind، عن الإصدار التالي من نموذج لغة الجوزاء الكبير من Google (ماجستير). الإصدار الجديد من LLM، المعروف سابقًا باسم Bard، هو أحدث محاولة من Google لتسليط الضوء على الذكاء الاصطناعي المتقدم (AI). بعيدًا عن ChatGPT المنافس لشركة OpenAI للتكنولوجيا الجديدة التي طورتها.
في مدونة تناقش في الإصدار Gemini 1.5، تحدث هاسابيس عن “الأداء المعزز بشكل كبير”، وقال إنه يمثل تغييرًا كبيرًا في النهج الذي تتبعه Google في تطوير الذكاء الاصطناعي. الإصدار الاحترافي، المتوفر الآن كمعاينة للمطورين، تم تحسينه من أجل “فهم السياق الطويل”، وفقًا لما ذكره هاسابيس. تضمن منشور مدونته مقطع فيديو يوضح كيفية تعامل Gemini 1.5 مع تلخيص نص مكون من 402 صفحة لمهمة الهبوط على سطح القمر Apollo 11.
يُظهر مقطع فيديو آخر تحليلًا لفيلم Buster Keaton مدته 44 دقيقة، حيث يُطلب من Gemini 1.5 تحديد مشهد تلتقط فيه الشخصية الرئيسية قطعة من الورق.
في تغريدة منشورة على X، ناقش أحد مهندسي Google كيفية إرسال ثلاثة برامج JavaScript، يبلغ مجموعها أكثر من 100000 سطر من التعليمات البرمجية، كمدخلات إلى Gemini 1.5. وقالوا: “عندما طلبنا من Gemini العثور على أفضل ثلاثة أمثلة ضمن قاعدة التعليمات البرمجية لمساعدتنا في تعلم مهارة معينة، بحثت في مئات الأمثلة المحتملة وعادت بخيارات ذات صلة فائقة”.
باستخدام لقطة شاشة فقط من أحد العروض التوضيحية في قاعدة التعليمات البرمجية، أظهر الاختبار أن Gemini كان قادرًا على العثور على العرض التوضيحي الصحيح – ثم شرح كيفية تعديل التعليمات البرمجية لتحقيق تغيير معين في الصورة.
في مثال آخر، تم استخدام Gemini لتحديد موقع جزء معين من الرسوم المتحركة ثم شرح الكود المستخدم للتحكم فيه. قال المهندس إن Gemini 1.5 كان قادرًا على إظهار كيفية تخصيص هذا الرمز بالضبط لإجراء تعديل محدد على الرسوم المتحركة.
عندما طُلب منهم تغيير النص والنمط في مثال التعليمات البرمجية، زعموا أن Gemini 1.5 كان قادرًا على تحديد سطور التعليمات البرمجية الدقيقة المطلوب تغييرها وأظهر للمطورين كيفية تغييرها. كما قدم شرحا حول ما تم القيام به ولماذا.
وفي تغريدة أخرى، ناقش جيف دين، كبير العلماء في Google DeepMind، كيف تمكن Gemini 1.5 من أخذ لغة لم يسبق له مثيل من قبل، وهي لغة Kalamang، التي يتحدث بها سكان غرب غينيا الجديدة، وتعلم كيفية ترجمتها إلى اللغة الإنجليزية. تم تدريب النموذج باستخدام كتاب مكون من 573 صفحة، قواعد اللغة كالامانج بقلم إلين فيسر، وقائمة كلمات ثنائية اللغة. واستنادا إلى البحث الكمي، قال إن برج الجوزاء 1.5 سجل 4.36 من 6، مقارنة بالإنسان الذي تعلم لغة كالامانج، الذي سجل 5.52.
قال حسبيس يستخدم Gemini 1.5 بنية جديدة لمزيج الخبراء (MoE). اعتمادًا على نوع المدخلات المقدمة، قال إن نماذج وزارة التربية تتعلم كيفية تنشيط مسارات الخبراء الأكثر صلة فقط في شبكتها العصبية بشكل انتقائي. وقال هاسابيس: “إن هذا التخصص يعزز بشكل كبير كفاءة النموذج”.