من فضلك تسجيل الدخول أو تسجيل لتفعل ذلك.

خدمة عشاق التكنولوجيا لأكثر من 25 عامًا.
TechSpot تعني تحليل التكنولوجيا والمشورة”https://www.techspot.com/ethics.html” الهدف=”_blank”> يمكنك الوثوق.

لماذا يهم: يتوصل الجميع إلى طرق جديدة ومبتكرة للعمل حول التكاليف الهائلة التي تنطوي عليها التدريب وإنشاء نماذج جديدة من الذكاء الاصطناعي. بعد ظهور ديبسيك المثير للإعجاب ، الذي هز وادي السيليكون ، قامت مجموعة من الباحثين بتطوير منافس مفتوح يتوافق مع قدرات Openai’s O1.

ابتكر باحثو ستانفورد وجامعة واشنطن تقنية لإنشاء نموذج جديد من الذكاء الاصطناعي يطلق عليه “s1.” لقد فتحوا بالفعل”https://github.com/simplescaling/s1″> github، جنبا إلى جنب مع الكود والبيانات المستخدمة لبناءها. ورقة”https://arxiv.org/pdf/2501.19393″> نشرت أوضح يوم الجمعة الماضي كيف حقق الفريق هذه النتائج من خلال الحيل الفنية الذكية.

بدلاً من تدريب نموذج التفكير من نقطة الصفر ، وهو مسعى باهظ الثمن يكلف الملايين ، أخذوا نموذجًا لغويًا حاليًا و “fine-tuned” باستخدام التقطير. لقد استخرجوا إمكانيات التفكير من أحد طرز الذكاء الاصطناعى في Google – على وجه التحديد ، Gemini 2.0 Flash Thinking التجريبي. ثم قاموا بتدريب النموذج الأساسي لتقليد عملية حل المشكلات خطوة بخطوة على مجموعة بيانات صغيرة.

“1024” العرض=”1600″ ALT SRC=”https://www.techspot.com/images2/news/bigimage/2025/02/2025-02-06-image-37.jpg” srcset=”https://www.techspot.com/images2/news/bigimage/2025/02/2025-02-06-image-37-j_500.webp 500w, https://www.techspot.com/images2/news/bigimage/2025/02/2025-02-06-image-37-j_1100.webp 1100w, https://www.techspot.com/images2/news/bigimage/2025/02/2025-02-06-image-37-j.webp 1600w” >

استخدم آخرون هذا النهج من قبل. في الواقع ، التقطير هو ما كان Openai”https://www.techspot.com/news/106579-microsoft-now-hosting-deepseek-r1-even-though-suspects.html”> الاتهام ديبسيك من القيام. ومع ذلك ، وجد فريق Stanford/UW طريقة منخفضة التكلفة لتنفيذها من خلال “supervised fine-tuning.”

تتضمن هذه العملية تعليم النموذج بشكل صريح كيفية التفكير في استخدام الأمثلة المنسقة. تتألف مجموعة البيانات الكاملة من 1000 سؤال وحلول تم اختيارها بعناية تم سحبها من نموذج Google.

يلاحظ TechCrunch أن”https://techcrunch.com/2025/02/05/researchers-created-an-open-rival-to-openais-o1-reasoning-model-for-under-50/”> التدريب استغرقت العملية 30 دقيقة ، باستخدام 16 NVIDIA H100 وحدات معالجة الرسومات. بطبيعة الحال ، كلف وحدات معالجة الرسومات هذه ثروة صغيرة – حوالي 25000 دولار لكل وحدة – ولكن الإيجار يعمل إلى أقل من 50 دولارًا في اعتمادات حساب السحابة.

اكتشف الباحثون أيضًا خدعة أنيقة لتعزيز قدرات S1 إلى أبعد من ذلك. لقد أصدروا تعليمات النموذج إلى “wait” قبل توفير إجابتها النهائية. سمح هذا الأمر بمزيد من الوقت للتحقق من تفكيره للوصول إلى حلول محسّنة قليلاً.

النموذج لا يخلو من تحذيراته. نظرًا لأن الفريق استخدم نموذج Google كمدرسه ، فهناك سؤال مفاده أن مهارات S1 ، على الرغم من أنها مثيرة للإعجاب لتكلفةه الضئيلة ، قد لا تكون قادرة على التوسع لمطابقة أفضل منظمة العفو الدولية التي تقدمها بعد. هناك أيضًا احتمال أن يحتج Google. يمكن أن ينتظر لمعرفة كيف تسير قضية Openai.

اقرأ المزيد

يتوقف Copilot عن العمل على الكود الذي يحتوي على كلمات محظورة متشددين من Github
سلسلة Ondo: مستقبل الأصول الرمزية المؤسسية

Reactions

0
0
0
0
0
0
بالفعل كان رد فعل لهذا المنصب.

ردود الفعل