Alibaba تكشف عن Qwen3 ، وهي عائلة من نماذج التفكير "الهجينة"

شركة التكنولوجيا الصينية علي بابا يوم الاثنين”https://qwenlm.github.io/blog/qwen3/” الهدف=”_blank” rel=”noreferrer noopener nofollow”> صدر QWEN3 ، وهي عائلة من طرازات الذكاء الاصطناعي التي تدعي الشركة يمكنها مطابقة ، وفي بعض الحالات ، تتفوق على أفضل النماذج المتاحة من Google و Openai.

معظم النماذج – أو ستكون قريبًا – متاحة للتنزيل ضمن ترخيص “مفتوح” على منصة AI Dev”https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f” الهدف=”_blank” rel=”noreferrer noopener nofollow”> معانقة الوجه و”https://github.com/QwenLM/Qwen3″ الهدف=”_blank” rel=”noreferrer noopener nofollow”> github. وهي تتراوح حجمها من 0.6 مليار معلمة إلى 235 مليار معلمة. (تتوافق المعلمات تقريبًا مع مهارات حل المشكلات في النموذج ، وتؤدي النماذج ذات المعلمات بشكل عام بشكل عام أفضل من تلك التي لديها معلمات أقل.)

زاد ارتفاع سلسلة النماذج المصنوعة من الصين مثل Qwen من الضغط على المختبرات الأمريكية مثل Openai لتقديم تقنيات الذكاء الاصطناعى أكثر قدرة. كما قاد صناع السياسة إلى تنفيذ قيود تهدف إلى الحد من قدرة شركات الذكاء الاصطناعى على الحصول على”https://techcrunch.com/2025/04/15/nvidia-h20-chip-exports-hit-with-license-requirement-by-us-government/”> رقائق ضروري لتدريب النماذج.

تقديم QWEN3!

نقوم بإطلاق و QWEN3 مفتوح الوزن ، وأحدث نماذج اللغة الكبيرة لدينا ، بما في ذلك نماذج 2 MOE و 6 طرز كثيفة ، تتراوح من 0.6B إلى 235B. يحقق نموذجنا الرئيسي ، QWEN3-235B-A22B ، نتائج تنافسية في تقييمات قياسية للترميز ، الرياضيات ، عام …”nofollow” HREF=”https://t.co/JWZkJeHWhC”> pic.twitter.com/jwzkjehwhc

– Qwen (alibaba_qwen)”nofollow” HREF=”https://twitter.com/Alibaba_Qwen/status/1916962087676612998?ref_src=twsrc%5Etfw”> 28 أبريل 2025

وفقًا لأبابا ، فإن نماذج QWEN3 عبارة عن نماذج “هجينة” – يمكن أن تستغرق بعض الوقت “للسبب” من خلال المشكلات المعقدة ، أو الإجابة على الطلبات الأكثر بساطة. يمكّن التفكير النماذج من التحقق بشكل فعال من الحقائق ، على غرار نماذج مثل Openai’s”https://techcrunch.com/2025/04/20/openais-o3-ai-model-scores-lower-on-a-benchmark-than-the-company-initially-implied/”> O3، ولكن على حساب الكمون الأعلى.

وكتب فريق QWEN في أ: “لدينا أوضاع تفكير ومفكر بسلاسة ، ونقدم للمستخدمين المرونة للتحكم في ميزانية التفكير”.”https://qwenlm.github.io/blog/qwen3/” الهدف=”_blank” rel=”noreferrer noopener nofollow”> منشور المدونة. “يمكّن هذا التصميم المستخدمين من تكوين ميزانيات خاصة بالمهمة بسهولة أكبر.”

تتبنى بعض النماذج أيضًا مزيجًا من بنية الخبراء (MOE) ، والتي يمكن أن تكون أكثر فعالية من الناحية الحسابية للرد على استعلامات. ينقسم Moe المهام إلى المهام الفرعية ويفوضها إلى نماذج “خبراء” أصغر متخصصة.

وقال علي بابا إن طرازات QWEN3 تدعم 119 لغة ، وتم تدريبها على مجموعة بيانات تبلغ حوالي 36 تريليون رمزًا. (الرموز هي أجزاء خام للبيانات التي يعالجها النموذج ؛ مليون رموز تعادل حوالي 750،000 كلمة.) قالت الشركة إن QWEN3 تم تدريبها على مجموعة من الكتب المدرسية ، و “أزواج الإجابة عن الأسئلة” ، ومقتطفات التعليمات البرمجية ، والبيانات المولدة من الذكاء الاصطناعى ، وأكثر من ذلك.

هذه التحسينات ، إلى جانب الآخرين ، عززت بشكل كبير قدرات QWEN3 مقارنة بسلفها ، QWEN2 ، على حد قول علي بابا. يبدو أن أيا من طرز QWEN3 هو الرأس والكتفين فوق الطرز الحديثة من أعلى الخط مثل Openai’s O3 و O4-MINI ، لكنهم مع ذلك فنانين أقوياء.

على Codeforces ، منصة لمسابقات البرمجة ، أكبر طراز QWEN3-QWEN-3-235B-A22B-فقط يتفوق على Openai’s”https://techcrunch.com/2025/01/31/openai-launches-o3-mini-its-latest-reasoning-model/”> O3-MINI و Google’s”https://techcrunch.com/2025/04/04/gemini-2-5-pro-is-googles-most-expensive-ai-model-yet/”> Gemini 2.5 Pro. QWEN-3-235B-A22B أيضًا أفضل O3-MINI على أحدث إصدار من AIME ، وهو معيار للرياضيات الصعبة ، و BFCL ، وهو اختبار لتقييم قدرة النموذج على “التفكير” حول المشكلات.

لكن QWEN-3-235B-A22B غير متاح للجمهور-على الأقل ليس بعد.

نتائج المعيار الداخلي لألبابا لـ QWEN3.ائتمانات الصورة:علي بابا

لا يزال أكبر نموذج QWEN3 العام ، QWEN3-32B ، قادرًا على المنافسة مع عدد من نماذج الذكاء الاصطناعى الملكية والمفتوحة ، بما في ذلك صيني AI Lab Deepseek’s”https://techcrunch.com/2025/01/27/deepseek-claims-its-reasoning-model-beats-openais-o1-on-certain-benchmarks/”> R1. Qwen3-32b يتجاوز Openai”https://techcrunch.com/2024/12/05/openais-o1-model-sure-tries-to-deceive-humans-a-lot/”> O1 نموذج في العديد من الاختبارات ، بما في ذلك المعيار الترميز livecodeBench.

وقالت Alibaba إن QWEN3 “Excels” في إمكانيات استدعاء الأدوات بالإضافة إلى اتباع الإرشادات ونسخ تنسيقات بيانات محددة. بالإضافة إلى نماذج التنزيل ، يتوفر QWEN3 من مقدمي الخدمات السحابية ، بما في ذلك الألعاب النارية AI و Vistrolic.

وقال Tuhin Srivastava ، المؤسس المشارك والمدير التنفيذي لشركة AI Cloud Host Baseten ، إن QWEN3 هي نقطة أخرى في خط الاتجاه للنماذج المفتوحة في مواكبة أنظمة المصدر المغلقة مثل Openai’s.

“تضاعف الولايات المتحدة تقييد مبيعات الرقائق على الصين والمشتريات من الصين ، ولكن نماذج مثل Qwen 3 التي هي حديثة ومفتوحة[…] وقال لـ TechCrunch: “سيكون استخدامه بلا شك محليًا. إنه يعكس حقيقة أن الشركات تقومان ببناء أدواتها الخاصة [as well as] شراء الرف عبر شركات طراز مغلق مثل الأنثروبور و Openai. “

Kyle Wiggers هو محرر AI TechCrunch. ظهرت كتاباته في الاتجاهات الفخارية والرقمية ، بالإضافة إلى مجموعة من المدونات الأدوات بما في ذلك شرطة Android و Android Authority و Droid-Life و XDA-Developers. يعيش في مانهاتن مع شريكه ، وهو معالج موسيقي.

عرض السيرة الذاتية”width: 1em;” ملء=”none” ViewBox=”0 0 24 24″>”var(–c-svg, currentColor)” د=”M16.5 12 9 19.5l-1.05-1.05L14.4 12 7.95 5.55 9 4.5z”/>

اقرأ المزيد

Alibaba تكشف عن Qwen3 ، وهي عائلة من نماذج التفكير “الهجينة”

Reactions

ردود الفعل