أطلقت Elon Musk Xai’s Grok 4-مما يطلق عليه “أذكى الذكاء الاصطناعي في العالم” ويدعي أنه يمكن أن يقوم بامتحانات على مستوى الدكتوراه والمنافسين على مستوى الاستيعاب مثل Gemini’s Gemini و Openai’s O3 على معايير صعبة
بواسطة”http://www.scientificamerican.com/author/deni-ellis-bechard/”> ديني إليس بيتشارد حرره”http://www.scientificamerican.com/author/dean-visser/”> عميد فيسر
صور فلوريانا/غيتي
أصدر Elon Musk أحدث نموذج للذكاء الاصطناعي من شركته XAI مساء الأربعاء. في جلسة تكشف عام لمدة ساعة ، أطلق على النموذج ، Grok 4 ، “أذكى الذكاء الاصطناعي في العالم” وادعى أنها قادرة على الحصول على درجات مثالية SAT وينتج عن GRE شبه المثالي في كل موضوع ، من العلوم الإنسانية إلى العلوم.
خلال الإطلاق عبر الإنترنت ، وصف Musk وأعضاء فريقه اختبار Grok 4 على مقياس يسمى”https://agi.safe.ai/”> امتحان الإنسانية الأخير (HLE) – أ”https://scale.com/leaderboard/humanitys_last_exam”> معيار 2500 سؤال مصمم لتقييم مهارة المعرفة والتفكير الأكاديمية لمنظمة العفو الدولية. تم إنشاؤه من قبل ما يقرب من 1000 خبير بشري عبر أكثر من 100 تخصص وتم إصداره في يناير 2025 ، يمتد الاختبار إلى موضوعات من الكلاسيكيات إلى الكيمياء الكمومية وخلط النص مع الصور. وبحسب ما ورد سجل Grok 4 25.4 في المائة من تلقاء نفسه. ولكن بالنظر إلى الوصول إلى الأدوات (مثل الوسائل الخارجية لتنفيذ الكود أو عمليات البحث على الويب) ، بلغت 38.6 في المائة. قفز ذلك إلى 44.4 في المائة مع إصدار يسمى Grok 4 Heavy ، والذي يستخدم عوامل AI متعددة لحل المشكلات. نماذج الذكاء الاصطناعى الأفضل الأداء التالي هما Google Gemini-Pro (التي حققت 26.9 في المائة مع الأدوات) ونموذج Openai’s O3 (الذي حصل على 24.9 في المائة أيضًا مع الأدوات). لم تظهر نتائج الاختبارات الداخلية لـ XAI على”https://agi.safe.ai/”> المتصدرين لهيلومع ذلك ، ولا يزال من غير الواضح ما إذا كان هذا يرجع إلى أن XAI لم يقم بعد بتقديم النتائج أو لأن هذه النتائج معلقة.”https://manifold.markets/Bayesian/humanitys-last-exam-lists-grok-4-at”> مشعب، منصة سوق التنبؤ الاجتماعي حيث يراهن المستخدمون على لعب الأموال (يسمى “Mana”) في الأحداث المستقبلية في السياسة والتكنولوجيا وغيرها من الموضوعات ، تنبأت بفرصة بنسبة 1 في المائة ، اعتبارًا من صباح يوم الجمعة ، أن Grok 4 سيؤدي لأول مرة على المتصدرين في HLE بنسبة 45 في المائة أو أكبر في الامتحان في غضون شهر من صدوره. (وفي الوقت نفسه ، ادعى XAI درجة 44.4 فقط.)
أثناء الإطلاق ، قام فريق XAI أيضًا بتشغيل مظاهرات حية تُظهر احتمالات Grok 4 Crunching Baseball ، وتحديد موظف XAI الذي لديه صورة ملف تعريف “أغرب” على X وتوليد تصور محاكي لـ”https://www.scientificamerican.com/black-holes/”> ثقب أسود. اقترح Musk أن النظام قد يكتشف تقنيات جديدة تمامًا بحلول في وقت لاحق من هذا العام – وربما “فيزياء جديدة” بحلول نهاية العام المقبل. توجد الألعاب والأفلام في الأفق أيضًا ، حيث تتوقع Musk أن تكون Grok 4 قادرة على عمل ألقاب قابلة للعب وأفلام قابلة للمشاهدة بحلول عام 2026. لدى Grok 4 أيضًا قدرات صوتية جديدة ، بما في ذلك الصوت الذي غنى أثناء الإطلاق ، وقال Musk إن توليد الصور الجديد وأدوات الترميز سيتم إصداره قريبًا. النسخة العادية من Grok 4 تكلف 30 دولارًا شهريًا ؛ SuperGrok Heavy – الحزمة الفاخرة مع العديد من الوكلاء وأدوات البحث – تتسع بسعر 300 دولار.
على دعم الصحافة العلمية
إذا كنت تستمتع بهذا المقال ، ففكر في دعم الصحافة الحائزة على جوائز”http://www.scientificamerican.com/getsciam/”> الاشتراك. من خلال شراء اشتراك ، تساعد على ضمان مستقبل القصص المؤثرة حول الاكتشافات والأفكار التي تشكل عالمنا اليوم.
“https://artificialanalysis.ai/”> التحليل الاصطناعي، منصة قياس مستقلة تصنف نماذج الذكاء الاصطناعى ، تسرد الآن Grok 4 على أنها أعلى في مؤشر ذكاء التحليل الاصطناعي ، قبل بقليل من Gemini 2.5 Pro و Openai’s O4-Mini. ويظهر Grok 4 كنموذج متاح للجمهور على”https://arcprize.org/leaderboard”> المتصدرين لجسد التجريد والمنطق ، أو ARC-AGI-1 ، والنسخة الثانية ، ARC-AGI-2- الصيدات التي تقيس التقدم نحو الذكاء العام “البشري”. يقول جريج كامرادت ، رئيس مؤسسة ARC Prize Foundation ، وهي منظمة غير ربحية تحافظ على اثنين من المتصدرين ، أنه عندما اتصل فريق XAI بالمؤسسة بنتائج Grok 4 ، قامت المنظمة بعد ذلك باختبار Grok 4 بشكل مستقل على مجموعة بيانات لم يكن لدى فريق Xai الوصول إليه وأكد النتائج. يقول كامرادت: “قبل أن نقوم بالإبلاغ عن أداء أي مختبر ، لا يتم التحقق منه إلا إذا نتحقق منه”. “وافقنا على [testing results] حرك ذلك [the xAI team] أظهر في الإطلاق. “
وفقًا لـ XAI ، يفوق Grok 4 أيضًا أنظمة الذكاء الاصطناعي الأخرى على عدد من المعايير الإضافية التي تشير إلى قوته في مواضيع STEM (اقرأ انهيارًا كاملاً للمعايير”https://kingy.ai/blog/grok-4-benchmarks-explained-why-its-performance-is-a-game-changer/”> هنا). أليكس أولتيانو ، محرر علوم البيانات العليا في منصة تعليم الذكاء الاصطناعي”https://www.datacamp.com/blog/grok-4″> Datacamp، اختبرها. يقول أولتيانو: “لقد كانت Grok قوية في الرياضيات والبرمجة في اختباراتي ، وقد تأثرت بجودة منطقها المذهل ، والذي يظهر نهجًا رائعًا وسليمًا لحل المشكلات”. “ومع ذلك ، فإن نافذة السياق الخاصة بها ليست منافسة للغاية ، وقد تصارع مع قواعد رمز كبيرة مثل تلك التي تواجهها في الإنتاج. كما أنها تقصر عندما طلبت تحليل PDF 170 صفحة ، على الأرجح بسبب نافذة السياق المحدودة وقدراتها المتعددة الضعيفة.” (تشير القدرات متعددة الوسائط إلى قدرة النموذج على تحليل أكثر من نوع من البيانات في نفس الوقت ، مثل مزيج من النص والصور والصوت والفيديو.)
على جبهة أكثر دقة ، ظهرت مشكلات مع Grok 4 منذ صدورها. عديد”https://x.com/jeremyphoward/status/1943436621556466171″> الملصقات على x-يملكه Musk نفسه-بالإضافة إلى Industry”https://techcrunch.com/2025/07/10/grok-4-seems-to-consult-elon-musk-to-answer-controversial-questions/”> الأخبار منافذ لقد ذكرت أنه عندما تم طرح أسئلة حول Grok 4 حول النزاع الإسرائيلي والفلسطيني ، فإن الإجهاض وقانون الهجرة الأمريكيين ، غالبًا ما بحث عن موقف Musk من هذه القضايا من خلال الرجوع إلى مشاركاته X ومقالاته المكتوبة عنه. ويأتي إصدار Grok 4 بعد العديد من الخلافات مع Grok 3 ، النموذج السابق ، الذي أصدر مخرجات تضمنت تعليقات معادية للسامية ، والثناء على هتلر ومطالبات “الإبادة الجماعية البيضاء” – الحواسين الذين اعترفوا بها XAI علنًا ، وعزوها إلى”https://www.bbc.com/news/articles/c4g8r34nxeno”> التلاعب غير المصرح به وذكر أن الشركة كانت”https://www.reuters.com/business/musks-xai-updates-grok-chatbot-after-white-genocide-comments-2025-05-17/”> تنفيذ التدابير التصحيحية.
في وقت من الأوقات أثناء الإطلاق ، علق موسك على كيف أن صنع الذكاء الاصطناعى أكثر ذكاءً من البشر أمر مخيف ، على الرغم من أنه قال إنه يعتقد أن النتيجة النهائية ستكون جيدة – ربما. وقال: “لقد توصلت إلى حد ما مع حقيقة أنه ، حتى لو لم يكن جيدًا ، أود على الأقل أن أكون على قيد الحياة لأرى ذلك يحدث”.