تستطيع نماذج الذكاء الاصطناعي إنشاء المقالات وأنواع أخرى من النصوص بسهولة. ومع ذلك، فهي ليست جيدة على الإطلاق في حل المسائل الرياضية، والتي تميل إلى إشراك التفكير المنطقي – وهو شيء يتجاوز قدرات معظم أنظمة الذكاء الاصطناعي الحالية.
ولكن هذا قد يتغير في النهاية. تقول شركة جوجل ديب مايند إنها دربّت نظامين متخصصين في الذكاء الاصطناعي لحل مسائل رياضية معقدة تتضمن التفكير المتقدم. وقد عمل النظامان – المسمى ألفا برووف وألفا جيومتري 2 – معًا لحل أربع من أصل ست مسائل من أولمبياد الرياضيات الدولي (IMO) لهذا العام، وهي مسابقة مرموقة لطلاب المدارس الثانوية. وقد فازا بما يعادل الميدالية الفضية.
وهذه هي المرة الأولى التي يحقق فيها أي نظام ذكاء اصطناعي مثل هذا المعدل المرتفع من النجاح في حل مثل هذه المشاكل. ويقول بوشميت كوهلي، نائب رئيس الأبحاث في شركة جوجل ديب مايند، والذي عمل على المشروع: “هذا تقدم كبير في مجال التعلم الآلي والذكاء الاصطناعي. لم يتم تطوير مثل هذا النظام حتى الآن والذي يمكنه حل المشاكل بهذا المعدل من النجاح وبهذا المستوى من العمومية”.
هناك بعض الأسباب التي تجعل من الصعب على أنظمة الذكاء الاصطناعي حل المسائل الرياضية التي تتطلب التفكير المتقدم. وغالبًا ما تتطلب هذه الأنواع من المسائل تكوين تجريدات والرسم عليها. كما تتضمن أيضًا تخطيطًا هرميًا معقدًا، فضلاً عن تحديد أهداف فرعية، والتراجع، وتجربة مسارات جديدة. وكل هذه الأمور تشكل تحديًا للذكاء الاصطناعي.
تقول كاتي كولينز، الباحثة في جامعة كامبريدج المتخصصة في الرياضيات والذكاء الاصطناعي ولكنها لم تشارك في المشروع: “غالبًا ما يكون تدريب نموذج للرياضيات أسهل إذا كان لديك طريقة للتحقق من إجاباته (على سبيل المثال، بلغة رسمية)، ولكن هناك بيانات رياضية أقل رسمية نسبيًا عبر الإنترنت مقارنة باللغة الطبيعية الحرة (لغة غير رسمية)”.
كان سد هذه الفجوة هو هدف شركة جوجل ديب مايند في إنشاء AlphaProof، وهو نظام قائم على التعلم التعزيزي يدرب نفسه على إثبات البيانات الرياضية بلغة البرمجة الرسمية Lean. والمفتاح هو إصدار من الذكاء الاصطناعي Gemini من شركة DeepMind تم ضبطه بدقة لترجمة المسائل الرياضية التي تم صياغتها بلغة طبيعية غير رسمية إلى بيانات رسمية، والتي يسهل على الذكاء الاصطناعي معالجتها. وقد أدى هذا إلى إنشاء مكتبة كبيرة من المسائل الرياضية الرسمية بدرجات متفاوتة من الصعوبة.
وتقول ويندا لي، المحاضرة في الذكاء الاصطناعي الهجين في جامعة إدنبرة، والتي قامت بمراجعة البحث ولكنها لم تشارك في المشروع، إن أتمتة عملية ترجمة البيانات إلى لغة رسمية تشكل خطوة كبيرة إلى الأمام بالنسبة لمجتمع الرياضيات.
ويضيف: “يمكننا أن نتمتع بثقة أكبر في صحة النتائج المنشورة إذا تمكنا من صياغة نظام الإثبات هذا، كما يمكن أن يصبح أكثر تعاونًا”.
نموذج الجوزاء يعمل جنبًا إلى جنب ألفا زيرو—نموذج التعلم التعزيزي الذي دربته شركة جوجل ديب مايند على إتقان ألعاب مثل جو والشطرنج—لإثبات أو دحض ملايين المشاكل الرياضية. وكلما زاد عدد المشاكل التي نجحت في حلها، أصبحت ألفا برووف أفضل في التعامل مع المشاكل ذات التعقيد المتزايد.
على الرغم من أن AlphaProof تم تدريبه لمعالجة المشكلات عبر مجموعة واسعة من الموضوعات الرياضية، فإن AlphaGeometry 2 – وهي نسخة محسنة من نظام لقد تم تحسين برنامج DeepMind الذي أعلنت عنه شركة Google في شهر يناير لمعالجة المشاكل المتعلقة بحركات الأجسام والمعادلات التي تتضمن الزوايا والنسب والمسافات. ولأنه تم تدريبه على بيانات اصطناعية أكثر بكثير من سابقه، فقد كان قادرًا على التعامل مع أسئلة هندسية أكثر تحديًا.
لاختبار قدرات الأنظمة، كلّف باحثو Google DeepMind هذه الأنظمة بحل ست مسائل طرحت على البشر المتنافسين في مسابقة IMO لهذا العام وإثبات صحة الإجابات. وقد حلت AlphaProof مسألتين في الجبر ومسألة واحدة في نظرية الأعداد، وكانت إحداها الأصعب في المسابقة. كما نجحت AlphaGeometry 2 في حل مسألة في الهندسة، ولكن مسألتين في علم التوافقيات (وهو مجال من مجالات الرياضيات يركز على عد الأشياء وترتيبها) ظلتا دون حل.
يقول أليكس ديفيز، مهندس الأبحاث في فريق AlphaProof: “بشكل عام، يعمل برنامج AlphaProof بشكل أفضل بكثير في الجبر ونظرية الأعداد مقارنة بالتركيبات الحسابية. وما زلنا نعمل على فهم سبب ذلك، وهو ما نأمل أن يقودنا إلى تحسين النظام”.
قام عالما الرياضيات الشهيران تيم جورز وجوزيف مايرز بفحص إجابات الأنظمة. ومنح كل من الإجابات الأربع الصحيحة الدرجة الكاملة (سبعة من سبعة)، مما منح الأنظمة ما مجموعه 28 نقطة من أصل 42 نقطة كحد أقصى. وسيحصل المشارك البشري الذي يحصل على هذه الدرجة على ميدالية فضية ويخسر الميدالية الذهبية، والتي تبدأ عتبة الحصول عليها عند 29 نقطة.
وهذه هي المرة الأولى التي يتمكن فيها أي نظام ذكاء اصطناعي من تحقيق أداء بمستوى الميدالية في أسئلة المنظمة البحرية الدولية. وقال جورز خلال مؤتمر صحفي: “بصفتي عالم رياضيات، أجد هذا الأمر مثيرًا للإعجاب للغاية، ويمثل قفزة كبيرة عما كان ممكنًا في السابق”.
واتفق مايرز على أن إجابات الأنظمة الرياضية تمثل تقدمًا كبيرًا مقارنة بما كان الذكاء الاصطناعي قادرًا على تحقيقه في السابق. وقال: “سيكون من المثير للاهتمام أن نرى كيف يمكن للأشياء أن تتوسع وما إذا كان من الممكن جعلها أسرع، وما إذا كان من الممكن أن تمتد إلى أنواع أخرى من الرياضيات”.
يقول كولينز إن إنشاء أنظمة الذكاء الاصطناعي القادرة على حل مشكلات رياضية أكثر صعوبة قد يمهد الطريق أمام تعاون مثير بين البشر والذكاء الاصطناعي، مما يساعد علماء الرياضيات على حل وابتكار أنواع جديدة من المشكلات. وهذا بدوره قد يساعدنا في معرفة المزيد عن كيفية تعامل البشر مع الرياضيات.
وتقول: “لا يزال هناك الكثير مما لا نعرفه عن كيفية حل البشر للمشكلات الرياضية المعقدة”.