تريد رؤى أكثر ذكاء في صندوق الوارد الخاص بك؟ اشترك في النشرات الإخبارية الأسبوعية لدينا للحصول على ما يهم فقط للمؤسسات AI والبيانات وقادة الأمن. اشترك الآن
لكن، هذا للأسف لا النموذج المتطابق للميدالية الذهبية. إنه في الواقع ، إصدار “برونز” أقل قوة وفقًا لنشر مدونة Google و Logan Kilpatrick ، الذي يقوم عليه منتج Google AI Studio.
مثل”https://x.com/OfficialLoganK/status/1951262261512659430″ الهدف=”_blank” rel=”noreferrer noopener”> kilpatrick نشر على الشبكة الاجتماعية x: “هذا تباين في نموذج الذهب IMO الخاص بنا والذي يكون أسرع وأكثر تحسينًا للاستخدام اليومي. نقدم أيضًا النموذج الكامل للذهبي IMO لمجموعة من علماء الرياضيات لاختبار قيمة القدرات الكاملة.”
متوفر الآن من خلال تطبيق Gemini Mobile، هذا النموذج البرونزي متاح للمشتركين”https://one.google.com/about/google-ai-plans/” الهدف=”_blank” rel=”noreferrer noopener”> خطة منظمة العفو الدولية أغلى منظمة العفو الدولية في Google ، AI Ultra، والتي تكلف 249.99 دولار شهريًا مع ترويج بدء لمدة 3 أشهر بمعدل مخفض قدره 124.99 دولارًا في الشهر للمشتركين الجدد.
تعود سلسلة AI Impact إلى سان فرانسيسكو – 5 أغسطس
المرحلة التالية من الذكاء الاصطناعي هنا – هل أنت مستعد؟ انضم إلى القادة من Block و GSK و SAP لإلقاء نظرة حصرية على كيفية إعادة تشغيل الوكلاء المستقلين من مهام سير عمل المؤسسة-من اتخاذ القرارات في الوقت الفعلي إلى الأتمتة الشاملة.
تأمين مكانك الآن – المساحة محدودة:”https://bit.ly/3GuuPLF”> https://bit.ly/3guuplf
وقالت Google أيضًا في منشور مدونة الإصدار أنها ستجلب التفكير العميق مع وبدون تكامل استخدام الأدوات إلى “المختبرين الموثوق بهم” من خلال واجهة برمجة تطبيقات الجوزاء (API) “في الأسابيع المقبلة”.
لماذا “التفكير العميق” قوي للغاية
يعتمد Gemini 2.5 Deep Think على عائلة الجوزاء من نماذج اللغة الكبيرة (LLMS) ، مما يضيف قدرات جديدة تهدف إلى التفكير من خلال مشاكل متطورة.
هو – هي توظف تقنيات “التفكير الموازي” لاستكشاف أفكار متعددة في وقت واحد وتتضمن تعلم التعزيز لتعزيز قدرتها على حل المشكلات خطوة بخطوة مع مرور الوقت.
النموذج هو مصمم لحالات الاستخدام التي تستفيد من المداولات الموسعة ، مثل اختبار التخمين الرياضي ، والبحث العلمي ، وتصميم الخوارزمية ، ومهام التكرار الإبداعية مثل التعليمات البرمجية وصقل التصميم.
استخدم المختبرين الأوائل ، بما في ذلك علماء الرياضيات مثل ميشيل فان جاريل ، للتحقيق في المشكلات التي لم يتم حلها وتوليد أدلة محتملة.
مستخدم وخبير السلطة من الذكاء الاصطناعى إيثان موليك ، أستاذ كلية وارتون للأعمال بجامعة بنسلفانيا ،”https://x.com/emollick/status/1951242282994377035″ الهدف=”_blank” rel=”noreferrer noopener”> تم نشره أيضًا على x أنه كان قادرًا على أخذ مطالبة غالبًا ما يستخدمها لاختبار إمكانيات النماذج الجديدة – “إنشاء شيء يمكنني لصقه في P5JS الذي سوف يذهلني بذكائه في إنشاء شيء يستدعي لوحة التحكم في النجوم في المستقبل البعيد” – و حولته إلى رسم ثلاثي الأبعاد ، وهو المرة الأولى التي يقوم فيها أي نموذج بذلك.
“en” dir=”ltr”>
كان الوصول المبكر إلى الجوزاء مع التفكير العميق. نموذج جيد جدًا ، مكاسب كبيرة على Gemini 2.5 Pro في الكثير من المشكلات.
فيما يلي المحاولة الأولى لمطالبة لوحة التحكم في المركبة المركزية التي أحاولها مع كل طراز. لأول مرة رأيت نموذجًا يصنع واجهة ثلاثية الأبعاد استجابةً.”https://t.co/8iW2Pn6Xpu”> https://t.co/8iw2pn6xpu pic.twitter.com/blff2icop3
– إيثان موليك (emollick)”https://twitter.com/emollick/status/1951242282994377035?ref_src=twsrc%5Etfw”> 1 أغسطس 2025
معايير الأداء وحالات الاستخدام
يسلط Google الضوء على العديد من مجالات التطبيق الرئيسية للتفكير العميق:
- الرياضيات والعلوم: يمكن للنموذج محاكاة التفكير في البراهين المعقدة ، واستكشاف التخمينات ، وتفسير الأدب العلمي الكثيف
- تصميم الترميز والخوارزمية: إنه يعمل بشكل جيد على المهام التي تنطوي على مقايضات الأداء ، وتعقيد الوقت ، ومنطق متعدد الخطوات
- التنمية الإبداعية: في سيناريوهات التصميم مثل فوكسل الفن أو بناء واجهة المستخدم ، يوضح التفكير العميق تحسنًا تكراريًا أقوى وتعزيز التفاصيل
النموذج أيضا يؤدي الأداء في التقييمات القياسية مثل LiveCodebench V6 (لقدرة الترميز) والامتحان الأخير للبشرية (تغطية الرياضيات والعلوم والتفكير).
هو – هي تفوقت Gemini 2.5 Pro والموديلات المتنافسة مثل Openai’s GPT-4 و Xai’s Grok 4 من خلال هوامش الأرقام المزدوجة في بعض الفئات (التفكير والمعرفة ، توليد الكود ، و IMO 2025 الرياضيات).
Gemini 2.5 Deep Think مقابل Gemini 2.5 Pro
في حين أن كل من Deep Think و Gemini 2.5 Pro هم جزء من عائلة نموذج Gemini 2.5 ، فإن Google تضع Google Think متغير أكثر قدرة ومهارة تحليلية، لا سيما عندما يتعلق الأمر بالتفكير المعقد وحل المشكلات متعددة الخطوات.
هذا التحسن ينبع من استخدام التفكير الموازي و تقنيات التعلم التعزيز، والتي تمكن النموذج من محاكاة المداولات المعرفية الأعمق.
في اتصالها الرسمي ، تصف Google التفكير العميق بأنه أفضل في التعامل مع المطالبات الدقيقة ، واستكشاف فرضيات متعددة ، وإنتاج مخرجات أكثر دقة. ويدعم هذا من خلال مقارنات جنبًا إلى جنب في جيل فوكسل للفن ، حيث يضيف التفكير العميق المزيد من الملمس والإخلاص الهيكلي والتنوع التركيبي من 2.5 Pro.
التحسينات ليست فقط بصرية أو قصصية. ذكرت Google أن Deep Think يتفوق على Gemini 2.5 Pro على معايير تقنية متعددة تتعلق بالتفكير ، وتوليد الكود ، وخبرة النطاق عبر المجال. ومع ذلك ، فإن هذه المكاسب تأتي مع مقايضات في الاستجابة والقبول الفوري.
هذا انهيار:
| القدرة / السمة | Gemini 2.5 Pro | Gemini 2.5 فكر عميق |
|---|---|---|
| سرعة الاستنتاج | أسرع ، زمن انتقال منخفض | أبطأ ، “وقت التفكير” الممتد |
| تعقيد التفكير | معتدل | عالية – يستخدم التفكير الموازي |
| العمق الفوري والإبداع | جيد | أكثر تفصيلا ودقة |
| الأداء القياسي | قوي | مثال رائع من الفن |
| سلامة المحتوى وموضوعية النغمة | تحسنت على النماذج القديمة | تحسن مزيد من التحسين |
| معدل الرفض (مطالبات حميدة) | أدنى | أعلى |
| طول الإخراج | معيار | يدعم ردود أطول |
| فوكسل الفن / التصميم الإخلاص | هيكل المشهد الأساسي | التفاصيل المعززة والثراء |
جوجل تلاحظ ذلك ارتفاع معدل الرفض في التفكير العميق هو مجال التحقيق النشط. قد يحد هذا من مرونته في التعامل مع الاستعلامات الغامضة أو غير الرسمية مقارنة بـ 2.5 Pro. في المقابل ، لا يزال 2.5 Pro أكثر ملاءمة للمستخدمين الذين يعطون الأولوية السرعة والاستجابة، خاصة بالنسبة للمهام الأخف وزنا للأغراض العامة.
يتيح هذا التمايز للمستخدمين الاختيار بناءً على أولوياتهم: 2.5 Pro للسرعة والسيولة، أو فكر عميق في الصرامة والتفكير.
ليس نموذج الفوز بالميدالية الذهبية ، مجرد برونز
في يوليو ، تصدرت Google Deepmind عناوين الصحف عندما تكون نسخة أكثر تقدماً من”https://venturebeat.com/ai/google-deepmind-makes-ai-history-with-gold-medal-win-at-worlds-toughest-math-competition/”> Gemini Deep Think Model حقق وضعًا رسميًا للذهبية في طائرة IMO 2025 – مسابقة الرياضيات الأكثر شهرة في العالم لطلاب المدارس الثانوية.
النظام حل خمسة من ستة مشكلات صعبة وأصبح أول منظمة العفو الدولية تتلقى تسجيلًا على مستوى الذهب من IMO.
أعلن Demis Hassabis ، الرئيس التنفيذي لشركة Google DeepMind ، عن الإنجاز على X ، قائلاً إن النموذج قد حل المشكلات من طرف إلى طرف-دون الحاجة إلى الترجمة إلى بناء جملة برمجة رسمية.
أكد لوحة IMO أن النموذج سجل 35 نقطة من 42 نقطة محتملة ، أعلى بكثير من عتبة الذهب. كانت حلول Gemini 2.5 Deep Think وصفه رئيس المنافسة جريجور دولينار واضحة ودقيقة وفي كثير من الحالات ، أسهل في متابعة من المنافسين البشريين.
ومع ذلك ، فإن Gemini 2.5 Deep Think الذي تم إصداره للمستخدمين ليس هو نفس نموذج المنافسة ، بدلاً من ذلك ، إصدار أقل أداءً ولكنه أسرع على ما يبدو.
كيفية الوصول إلى Deep Think الآن
Gemini 2.5 التفكير العميق متوفر حصريًا على تطبيق Google Gemini Mobile لنظام التشغيل iOS و Android في هذا الوقت للمستخدمين على خطة Google AI Ultra، جزء من تشكيلة الاشتراك في Google One ، مع الأسعار على النحو التالي.
- العرض الترويجي: 124.99 دولارًا شهريًا لمدة 3 أشهر ، ثم يبدأ إلى …
- المعدل القياسي: 249.99 دولار/شهر
- الميزات المتضمنة: 30 تيرابايت من التخزين ، والوصول إلى تطبيق Gemini مع Deep Think و Veo 3 ، بالإضافة إلى أدوات مثل Flow و Westisk و 12500 ائتمانات شهرية من الذكاء الاصطناعي
يمكن للمشتركين تنشيط التفكير العميق في تطبيق Gemini من خلال تحديد نموذج 2.5 Pro وتبديل خيار “التفكير العميق”.
وهو يدعم عددًا ثابتًا من المطالبات يوميًا ويتم دمجه مع إمكانيات مثل تنفيذ التعليمات البرمجية والبحث في Google. يولد النموذج أيضًا مخرجات أطول وأكثر تفصيلاً مقارنة بالإصدارات القياسية.
لا تشمل خطة Google AI Pro ذات المستوى الأدنى ، بسعر 19.99 دولارًا شهريًا (مع تجربة مجانية) ، الوصول إلى Deep Think ، ولا خدمة Gemini AI المجانية.
لماذا يهم صانعي القرار الفني للمؤسسات
يمثل Gemini 2.5 Deep Think التطبيق العملي لمعلم بحث رئيسي.
هو – هي يسمح للمؤسسات والمؤسسات بالاستفادة من نموذج ميديا أوليمبياد الحائز على ميدالية وجعلها تنضم إلى موظفيها ، وإن كان فقط من خلال حساب المستخدم الفردي الآن.
بالنسبة للباحثين الذين يتلقون نموذجًا كاملًا من الدرجة IMO ، فإنه يقدم لمحة عن مستقبل الذكاء الاصطناعي التعاوني في الرياضيات. بالنسبة للمشتركين فائقين ، يوفر Deep Think خطوة قوية نحو مساعدة أكثر قدرة على الذكاء الاصطناعى ، التي تديرها الآن في راحة يدهم.
الرؤى اليومية حول حالات استخدام الأعمال مع VB يوميا
إذا كنت ترغب في إقناع رئيسك في العمل ، فقد غطيت VB Daily. نمنحك السبق الصحفي الداخلي على ما تفعله الشركات مع الذكاء الاصطناعي التوليدي ، من التحولات التنظيمية إلى عمليات النشر العملية ، حتى تتمكن من مشاركة رؤى لأقصى عائد على الاستثمار.
اقرأ لدينا”http://venturebeat.com/terms-of-service/”> سياسة الخصوصية
شكرا على الاشتراك. تحقق أكثر”http://venturebeat.com/newsletters/”> النشرات الإخبارية VB هنا.
حدث خطأ.