يتضمن آخر تحديث من Google DeepMind لأعلى نموذج Gemini AI قرصًا للتحكم في مقدار “يفكر” النظام من خلال الاستجابة. تم تصميم الميزة الجديدة ظاهريًا لتوفير المال للمطورين ، ولكنها تعترف أيضًا بمشكلة: نماذج التفكير ، هاجس عالم التكنولوجيا الجديد ، عرضة للتفكير ، وحرق الأموال والطاقة في هذه العملية.
منذ عام 2019 ، كانت هناك عدة طرق مجربة وحقيقية لجعل نموذج الذكاء الاصطناعى أكثر قوة. كان أحدهما هو جعلها أكبر من خلال استخدام المزيد من بيانات التدريب ، والآخر هو إعطاء ملاحظات أفضل حول ما الذي يشكل إجابة جيدة. ولكن قرب نهاية العام الماضي ، تحولت Google Deepmind وغيرها من شركات الذكاء الاصطناعي إلى طريقة ثالثة: التفكير.
يقول جاك راي ، عالم الأبحاث الرئيسي في DeepMind: “لقد دفعنا حقًا إلى” التفكير “. مثل هذه النماذج ، التي تم تصميمها للعمل من خلال المشكلات منطقية وقضاء المزيد من الوقت في الوصول إلى إجابة ، ارتفعت إلى الصدارة في وقت سابق من هذا العام مع إطلاق نموذج Deepseek R1. إنها جذابة لشركات الذكاء الاصطناعى لأنها يمكن أن تجعل نموذجًا حاليًا أفضل عن طريق تدريبه على التعامل مع مشكلة بشكل عملي. وبهذه الطريقة ، يمكن للشركات تجنب الاضطرار إلى بناء نموذج جديد من نقطة الصفر.
عندما يكرس نموذج الذكاء الاصطناعى المزيد من الوقت (و”https://www.technologyreview.com/2025/01/31/1110776/deepseek-might-not-be-such-good-news-for-energy-after-all/”> الطاقة) إلى استعلام ، يكلف تشغيل المزيد.”https://arcprize.org/leaderboard”> المتصدرين تظهر نماذج التفكير أن المهمة يمكن أن تكلف ما يزيد عن 200 دولار لإكمالها. الوعد هو أن هذا الوقت الإضافي والمال يساعد نماذج التفكير في التعامل بشكل أفضل في التعامل مع المهام الصعبة ، مثل تحليل التعليمات البرمجية أو جمع المعلومات من الكثير من المستندات.
يقول كوراي كافوكووجلو ، كبير المسؤولين الفنيين في Google Deepend ، “كلما تمكنت من التكرار حول فرضيات وأفكار معينة” ، زاد الأمر “ستجد الشيء الصحيح”.
هذا ليس صحيحًا في جميع الحالات. يقول تولسي دوشي ، الذي يقود فريق المنتج في Gemini ، في إشارة إلى Gemini Flash 2.5 ، النموذج الذي تم إصداره اليوم يتضمن شريطًا منزلقًا للمطورين: “النموذج المبالغ فيه” ، في إشارة إلى Gemini Flash 2.5 ، النموذج الذي تم إصداره اليوم والذي يتضمن شريطًا منزلقًا للمطورين لاتصال مدى تفكيره. “لمطالبات بسيطة ، يفكر النموذج أكثر مما يحتاج إليه.”
عندما يقضي النموذج وقتًا أطول من الضرورة في مشكلة ما ، فإنه يجعل النموذج مكلف”https://www.technologyreview.com/2024/12/13/1108719/ais-emissions-are-about-to-skyrocket-even-further/”> البصمة البيئية.
يقول ناثان حبيب ، وهو مهندس في معانقة الوجه الذي درس انتشار نماذج المنطق هذه ، إن التفكير المباشر وفيرة. في الاندفاع لإظهار الذكاء الاصطناعي أكثر ذكاءً ، تصل الشركات إلى نماذج التفكير مثل المطارق حتى عندما لا يوجد مسمار في الأفق ، كما يقول حبيب. في الواقع ، عند Openai”https://www.technologyreview.com/2025/02/27/1112619/openai-just-released-gpt-4-5-and-says-it-is-its-biggest-and-best-chat-model-yet/amp/”> أعلن نموذجًا جديدًا في فبراير ، قال إنه سيكون آخر طراز غير مرئي للشركة.
يقول حبيب إن كسب الأداء “لا يمكن إنكاره” لبعض المهام ، ولكن ليس للعديد من الآخرين حيث يستخدم الناس عادة الذكاء الاصطناعي. حتى عند استخدام التفكير للمشكلة الصحيحة ، يمكن أن تسير الأمور. أظهر لي حبيب مثالاً على نموذج التفكير الرئيسي الذي طُلب منه العمل من خلال مشكلة كيمياء عضوية. لقد بدأ الأمر على ما يرام ، ولكن في منتصف الطريق من خلال عملية التفكير ، بدأت استجابات النموذج تشبه الانهيار: لقد تعثرت “الانتظار ، لكن …” مئات المرات. انتهى الأمر إلى أن يستغرق وقتًا أطول بكثير من نموذج غير عام في مهمة واحدة. تقول كيت أولسزوسكا ، التي تعمل على تقييم نماذج الجوزاء في DeepMind ، إن طرز Google يمكن أن تتعثر أيضًا في الحلقات.
إن الاتصال الهاتفي الجديد لـ Google هو محاولة لحل هذه المشكلة. في الوقت الحالي ، تم تصميمه ليس لإصدار المستهلك من الجوزاء ولكن للمطورين الذين يصنعون التطبيقات. يمكن للمطورين تعيين ميزانية لمقدار حوسبة الحوسبة التي يجب أن ينفقها النموذج على مشكلة معينة ، والفكرة هي رفض الاتصال الهاتفي إذا لم يكن المهمة تنطوي على الكثير من التفكير على الإطلاق. تكون المخرجات من النموذج أكثر تكلفة بست مرات عند تشغيل التفكير.
سبب آخر لهذه المرونة هو أنه لم يتضح بعد متى سيُطلب من المزيد من التفكير الحصول على إجابة أفضل.
“من الصعب حقًا رسم حدود ، على سبيل المثال ، ما هي المهمة المثالية الآن للتفكير؟” يقول راي.
تتضمن المهام الواضحة الترميز (قد يلصق المطورون مئات أسطر التعليمات البرمجية في النموذج ثم طلب المساعدة) ، أو توليد تقارير بحثية على مستوى الخبراء. سيتم تشغيل الاتصال الهاتفي لهذه ، وقد يجد المطورون النفقات التي تستحق العناء. ولكن ستكون هناك حاجة إلى مزيد من الاختبارات والتعليقات من المطورين لمعرفة متى تكون الإعدادات المتوسطة أو المنخفضة جيدة بما يكفي.
يقول حبيب إن مقدار الاستثمار في نماذج التفكير هو علامة على أن النموذج القديم لكيفية جعل النماذج أفضل يتغير. يقول: “يتم استبدال قوانين التحجيم”.
بدلاً من ذلك ، تراهن الشركات على أن أفضل الاستجابات ستأتي من أوقات تفكير أطول بدلاً من نماذج أكبر. لقد كان من الواضح لعدة سنوات أن تنفق شركات الذكاء الاصطناعى المزيد من الأموال على الاستدلال – عندما تكون النماذج “في الواقع””https://www.technologyreview.com/2025/01/31/1110776/deepseek-might-not-be-such-good-news-for-energy-after-all/”> تسريع كما نماذج التفكير تقلع. الاستدلال مسؤول أيضًا عن حصة متزايدة من الانبعاثات.
(بينما فيما يتعلق بموضوع النماذج التي “العقل” أو “التفكير”: لا يمكن لنموذج الذكاء الاصطناعي أداء هذه الأفعال بالطريقة التي نستخدم بها عادة هذه الكلمات عند الحديث عن البشر. سألت راي لماذا تستخدم الشركة لغة مجسمة مثل هذا. النماذج.)
حتى إذا استمرت نماذج التفكير في السيطرة ، فإن Google DeepMind ليست اللعبة الوحيدة في المدينة. عندما بدأت نتائج Deepseek في الدوران في ديسمبر ويناير ، أثارت انخفاضًا بقيمة 1 تريليون دولار في سوق الأوراق المالية لأنها وعدت أن نماذج التفكير القوية يمكن أن تكون رخيصة. يشار إلى النموذج باسم “الوزن المفتوح” – وبعبارة أخرى ، فإن إعداداته الداخلية ، التي تسمى الأوزان ، متاحة للجمهور ، مما يسمح للمطورين بتشغيله بمفرده بدلاً من الدفع للوصول إلى النماذج الملكية من Google أو Openai. (مصطلح “المصدر المفتوح” محجوز للنماذج التي تكشف عن البيانات التي تم تدريبها عليها.)
فلماذا تستخدم نماذج الملكية من Google عندما يكون أداء Deepseek جيدًا؟ يقول Kavukcuoglu أن الترميز والرياضيات والتمويل هي الحالات التي “هناك توقعات كبيرة من النموذج لتكون دقيقة للغاية ، لتكون دقيقة للغاية ، وأن تكون قادرة على فهم المواقف المعقدة حقًا” ، ويتوقع نماذج تسليم ذلك ، مفتوحة أم لا ، للفوز. من وجهة نظر DeepMind ، سيكون هذا المنطق أساس نماذج الذكاء الاصطناعى المستقبلية التي تعمل نيابة عنك وحل المشكلات لك.
يقول: “التفكير هو القدرة الرئيسية التي تبني الذكاء”. “في اللحظة التي يبدأ فيها النموذج في التفكير ، بدأت وكالة النموذج.”
تم تحديث هذه القصة لتوضيح مشكلة “overthinking.”