الجوزاء 1.5 في الطريق، وهو مثير للإعجاب.
الائتمان: جوجل
إذا شعرنا أن Google تمطرنا بإعلانات الجوزاء، هذا لأنهم كذلك. في الأسبوع الماضي، قامت الشركة بتغيير العلامة التجارية لروبوت الذكاء الاصطناعي الخاص بها، Bard، إلى Gemini، وقدمت Gemini Advanced، وهو أول مستوى اشتراك مدفوع للذكاء الاصطناعي. جديدة في أعقاب هذا الإعلان يأتي الجوزاء 1.5، التكرار التالي لنموذج الذكاء الاصطناعي من Google.
ما هو الجوزاء 1.5؟
تقول Google إن Gemini 1.5 مبني على بنية المحولات ومزيج الخبراء (MoE). بالمقارنة مع بنية المحولات التقليدية، والتي هي في الأساس شبكة عصبية كبيرة واحدة، تقول جوجل إن نماذج MoE يمكن تقسيمها إلى شبكات عصبية متعددة “خبيرة”. وبهذه الطريقة، يتم تنشيط المسارات الضرورية للمهمة المحددة فقط في النموذج، والتي تقول جوجل إنها أكثر كفاءة من الوظيفة القياسية.
الإصدار الأول من Gemini 1.5 الذي تم توفيره للمختبرين هو Gemini 1.5 Pro. “Pro” هو اسم Google لنماذج LLM (نماذج اللغات الكبيرة) التي تعمل بشكل أفضل عبر أوسع المهام والأجهزة الممكنة. فكر في الأمر مثل GPT-3.5، النموذج المصمم ليتم استخدامه في معظم التطبيقات الممكنة، بدلاً من أقوى التطبيقات.
بينما يحتوي الإصدار 1.5 Pro على نافذة سياق رمزية قياسية تبلغ 128000 (نفس GPT-4)، تقول Google إنها تختبر حاليًا نافذة سياقية تصل إلى مليون رمز مميز، بالإضافة إلى 10 مليون دولار، مقابل 1.0 Pro 32000. كلما زاد عدد الرموز المميزة التي يمكن للنموذج تشغيلها، زادت حجم المطالبة، وبالتالي، زاد حجم الطلب الذي يمكن للنموذج التعامل معه مرة واحدة. يمكن لـ 1.5 Pro التعامل مع ما يصل إلى ساعة واحدة من الفيديو، و11 ساعة من الصوت، وقواعد التعليمات البرمجية التي تحتوي على أكثر من 30000 سطر من التعليمات البرمجية (أو أكثر من 700000 كلمة) في وقت واحد، وفقًا لـ Google. (يمكنه أيضًا التعامل مع المطالبات الفردية التي تحتوي على أكثر من 100000 سطر من التعليمات البرمجية.)
يقال إن 1.5 Pro أفضل في فهم كميات كبيرة من المعلومات والقدرة على الإجابة على الأسئلة المعقدة والمحددة حولها. في فيديو تجريبييعرض Google مثالاً على تغذية 1.5 Pro بالنصوص المكونة من 402 صفحة من مهمة أبولو 11. ثم شاركت بعد ذلك رسمًا تخطيطيًا لحذاء يمشي، مع سهم يشير إلى الأرض، وسألت العارضة عن موضوع هذه الصورة. واستطاعت العارضة التعرف على أن هذا الرسم يصور لحظة صعود نيل أرمسترونج على القمر، وقال مقولته الشهيرة، كلها من الرسم. ويمكنه أيضًا تحليل المحتوى مثل الفيلم الصامت، ووصف ما حدث، وتسليط الضوء على اللحظات الصغيرة التي قد يفوتها معظم المشاهدين.
تقول Google إن الإصدار 1.5 Pro يتفوق على الإصدار 1.0 Pro بنسبة 87% من معايير الاختبار التي تستخدمها. كما أنه يعمل أيضًا “بمستوى مشابه إلى حد كبير” لـ 1.0 Ultra، وهو الطراز الذي يعمل بنظام Gemini Advanced. كما أن الشركة سعيدة أيضًا بـ “التعلم في السياق”، حيث يمكن للنموذج أن يأخذ معلومات من مجموعة البيانات الحالية الخاصة به ويطبقها بطرق جديدة، دون الحاجة إلى مطالبات إضافية.
كيفية تجربة الجوزاء 1.5
تجري Google تجارب لـ Gemini 1.5 Pro حتى الآن استوديو الذكاء الاصطناعي و فيرتكس الذكاء الاصطناعي، ولديه قائمة انتظار للمطورين المهتمين. إذا كنت بالفعل مطورًا مهتمًا، يمكنك الاشتراك في قائمة الانتظار هنا.
بمجرد توفر Gemini 1.5 على نطاق واسع من خلال خدمات Gemini من Google، ستتمكن من استخدام نافذة الرمز المميز التي تبلغ 125000 مجانًا. إذا كنت تريد الوصول إلى نافذة المليون رمز، فهذا سيكلفك. (السعر غير معروف في الوقت الحالي).
لقد كان Lifehacker مصدرًا موثوقًا للمساعدة التقنية والنصائح الحياتية منذ عام 2005. وتتمثل مهمتنا في تقديم مساعدة تقنية موثوقة ونصائح حياتية موثوقة وعملية وقائمة على العلم لمساعدتك على العيش بشكل أفضل.
© 2001-2024 Ziff Davis, LLC.، إحدى شركات ZIFF DAVIS. كل الحقوق محفوظة.
Lifehacker هي علامة تجارية مسجلة فيدراليًا لشركة Ziff Davis ولا يجوز استخدامها من قبل أطراف ثالثة دون الحصول على إذن صريح. إن عرض العلامات التجارية والأسماء التجارية لأطراف ثالثة على هذا الموقع لا يشير بالضرورة إلى أي انتماء أو تأييد لشركة Lifehacker. إذا قمت بالنقر فوق رابط تابع وقمت بشراء منتج أو خدمة، فقد يدفع لنا هذا التاجر رسومًا.
تدعم Lifehacker Group Black ومهمتها المتمثلة في زيادة التنوع في أصوات الوسائط وملكية الوسائط.