جوجل تكشف النقاب عن نموذج التفكير الجديد Gemini 2.0 Flash Thinking لمنافسة OpenAI o1

19 ديسمبر 2024 الساعة 10:04 صباحًا

الائتمان: VentureBeat تم إنشاؤه باستخدام ChatGPT

“content”>

انضم إلى نشراتنا الإخبارية اليومية والأسبوعية للحصول على آخر التحديثات والمحتوى الحصري حول تغطية الذكاء الاصطناعي الرائدة في الصناعة.”https://venturebeat.com/newsletters/?utm_source=VBsite&utm_medium=desktopNav” نوع البيانات=”link” معرف البيانات=”https://venturebeat.com/newsletters/?utm_source=VBsite&utm_medium=desktopNav”> اعرف المزيد

في أحدث مساعيها لإعادة تعريف مشهد الذكاء الاصطناعي،”https://x.com/sundarpichai/status/1869792088356991253″> أعلنت جوجل الجوزاء 2.0 التفكير السريعوهو نموذج تفكير متعدد الوسائط قادر على معالجة المشكلات المعقدة بالسرعة والشفافية.

في أ”https://x.com/sundarpichai/status/1869792088356991253″> النشر على الشبكة الاجتماعية X، كتب الرئيس التنفيذي لشركة Google ساندر بيتشاي أنه كان: “نموذجنا الأكثر تفكيرًا حتى الآن :)”

وعلى”https://ai.google.dev/gemini-api/docs/thinking-mode”> وثائق المطوريوضح جوجل أن “وضع التفكير قادر على توفير قدرات تفكير أقوى في استجاباته من القاعدة”https://venturebeat.com/ai/gemini-2-0-flash-ushers-in-a-new-era-of-real-time-multimodal-ai/”> نموذج فلاش الجوزاء 2.0″، والذي كان في السابق أحدث وأعظم إصدار من Google، وتم إصداره قبل ثمانية أيام فقط.

يدعم النموذج الجديد 32000 رمزًا فقط للإدخال (حوالي”https://x.com/labenz/status/1630284940322512896?lang=en”> 50-60 صفحة من النص) ويمكن أن تنتج 8000 رمزًا لكل استجابة مخرجات. في لوحة جانبية على Google AI Studio، تدعي الشركة أنه الأفضل لـ “الفهم متعدد الوسائط والتفكير” و”الترميز”.

لم يتم بعد نشر التفاصيل الكاملة لعملية التدريب على النموذج وبنيته وترخيصه وتكاليفه. في الوقت الحالي، تظهر التكلفة صفر لكل رمز مميز في Google AI Studio.

تفكير يسهل الوصول إليه وأكثر شفافية

على عكس نماذج التفكير المنافسة”https://venturebeat.com/ai/openai-launches-full-o1-model-with-34-reduced-error-rate-debuts-chatgpt-pro/”>o1 وo1 mini من OpenAIيتيح Gemini 2.0 للمستخدمين الوصول إلى الاستدلال خطوة بخطوة من خلال قائمة منسدلة، مما يوفر رؤية أكثر وضوحًا وشفافية حول كيفية وصول النموذج إلى استنتاجاته.

من خلال السماح للمستخدمين بمعرفة كيفية اتخاذ القرارات، يعالج برنامج Gemini 2.0 المخاوف القائمة منذ فترة طويلة بشأن عمل الذكاء الاصطناعي باعتباره “صندوقًا أسود”، ويجعل هذا النموذج – شروط الترخيص غير واضحة – للتكافؤ مع”https://venturebeat.com/ai/heres-how-openai-o1-might-lose-ground-to-open-source-models/”>نماذج أخرى مفتوحة المصدر يقدمها المنافسون.

أظهرت اختباراتي البسيطة المبكرة للنموذج أنه أجاب بشكل صحيح وسريع (في غضون ثانية إلى ثلاث ثوانٍ) على بعض الأسئلة التي كانت صعبة للغاية بالنسبة لنماذج الذكاء الاصطناعي الأخرى، مثل حساب عدد الحروف في كلمة “فراولة”. (انظر الصورة أعلاه).

وفي اختبار آخر، عند مقارنة رقمين عشريين (9.9 و9.11)، قام النموذج بتقسيم المشكلة بشكل منهجي إلى خطوات أصغر، من تحليل الأعداد الصحيحة إلى مقارنة المنازل العشرية.

يتم دعم هذه النتائج من خلال تحليل مستقل من طرف ثالث”https://x.com/lmarena_ai/status/1869793847548817563″> إل إم الساحة، والذي أطلق على Gemini 2.0 Flash Thinking النموذج الأول أداءً في جميع فئات LLM.

الدعم الأصلي لتحميل الصور وتحليلها

في تحسين إضافي على عائلة OpenAI o1 المنافسة، تم تصميم Gemini 2.0 Flash Thinking لمعالجة الصور من القفزة.

تم إطلاق o1 كنموذج نصي فقط، ولكنه توسع منذ ذلك الحين ليشمل تحليل تحميل الصور والملفات. يمكن لكلا النموذجين أيضًا إرجاع النص فقط في الوقت الحالي.

لا يدعم Gemini 2.0 Flash Thinking حاليًا التأريض مع بحث Google، أو التكامل مع تطبيقات Google الأخرى وأدوات الطرف الثالث الخارجية، وفقًا لـ”https://ai.google.dev/gemini-api/docs/thinking-mode”> وثائق المطور.

تعمل قدرة الوسائط المتعددة لـ Gemini 2.0 Flash Thinking على توسيع حالات الاستخدام المحتملة، مما يمكنها من معالجة السيناريوهات التي تجمع بين أنواع مختلفة من البيانات.

على سبيل المثال، في أحد الاختبارات، قام النموذج بحل لغز يتطلب تحليل العناصر النصية والمرئية، مما يدل على تنوعه في التكامل والتفكير عبر التنسيقات.

ويمكن للمطورين الاستفادة من هذه الميزات عبر Google AI Studio وVertex AI، حيث يتوفر النموذج للتجريب.

مع تزايد المنافسة في مجال الذكاء الاصطناعي، يمكن أن يمثل برنامج Gemini 2.0 Flash Thinking بداية حقبة جديدة لنماذج حل المشكلات. إن قدرتها على التعامل مع أنواع البيانات المتنوعة، وتقديم تفكير واضح، والأداء على نطاق واسع، تضعها كمنافس جدي في سوق الذكاء الاصطناعي المنطقي، وتنافس عائلة OpenAI o1 وما بعدها.

رؤى يومية حول حالات استخدام الأعمال باستخدام VB Daily

إذا كنت ترغب في إثارة إعجاب رئيسك في العمل، فإن VB Daily يلبي احتياجاتك. نقدم لك السبق الصحفي الداخلي حول ما تفعله الشركات باستخدام الذكاء الاصطناعي التوليدي، بدءًا من التحولات التنظيمية وحتى عمليات النشر العملية، حتى تتمكن من مشاركة الرؤى لتحقيق أقصى عائد على الاستثمار.

اقرأ لدينا”http://venturebeat.com/terms-of-service/”>سياسة الخصوصية

شكرا للاشتراك. تحقق من المزيد”http://venturebeat.com/newsletters/”> النشرات الإخبارية VB هنا.

حدث خطأ.

اقرأ المزيد

جوجل تكشف النقاب عن نموذج التفكير الجديد Gemini 2.0 Flash Thinking لمنافسة OpenAI o1

تفكير يسهل الوصول إليه وأكثر شفافية

الدعم الأصلي لتحميل الصور وتحليلها

Reactions

ردود الفعل