حصل الذكاء الاصطناعي من شركة Google DeepMind على الميدالية الفضية في أولمبياد الرياضيات الدولي (IMO) لهذا العام، وهي المرة الأولى التي يصل فيها أي ذكاء اصطناعي إلى منصة التتويج.
تعتبر IMO المسابقة الأكثر شهرة في العالم للشباب المتخصصين في الرياضيات. تتطلب الإجابة الصحيحة على أسئلة الاختبار مهارة رياضية تفتقر إليها أنظمة الذكاء الاصطناعي عادةً.
في شهر يناير، أطلقت شركة Google DeepMind أظهرت AlphaGeometry، وهو نظام ذكاء اصطناعي يمكنه الإجابة على بعض أسئلة الهندسة التي يطرحها IMO بالإضافة إلى قدرة البشر على ذلك. ومع ذلك، لم يكن هذا النظام من مسابقة حية، ولم يتمكن من الإجابة على أسئلة من تخصصات رياضية أخرى، مثل نظرية الأعداد والجبر والتركيبات، وهو أمر ضروري للفوز بميدالية IMO.
لقد أطلقت شركة Google DeepMind الآن ذكاء اصطناعيًا جديدًا يُدعى AlphaProof، والذي يمكنه حل مجموعة واسعة من المشكلات الرياضية، وإصدارًا محسنًا من AlphaGeometry، والذي يمكنه حل المزيد من الأسئلة الهندسية.
عندما اختبر الفريق كلا النظامين معًا في أسئلة IMO لهذا العام، أجابوا بشكل صحيح على أربعة من أصل ستة أسئلة، مما منحهم درجة 28 من أصل 42 نقطة ممكنة. كان هذا كافيًا للفوز بالميدالية الفضية ونقطة واحدة فقط تحت عتبة الميدالية الذهبية لهذا العام.
في المسابقة التي أقيمت في مدينة باث بالمملكة المتحدة الأسبوع الماضي، فاز 58 متسابقًا بالميدالية الذهبية، وفاز 123 متسابقًا بالميدالية الفضية.
“نحن جميعًا ندرك تمامًا أن الذكاء الاصطناعي سوف يصبح في النهاية أفضل من البشر في حل معظم المشكلات الرياضية، ولكن المعدل الذي يتحسن به الذكاء الاصطناعي مذهل”، كما يقول جريجور دوليناروقال رئيس المنظمة البحرية الدولية: “إن خسارة الميدالية الذهبية في أولمبياد المنظمة البحرية الدولية 2024 بفارق نقطة واحدة فقط قبل بضعة أيام أمر مثير للإعجاب حقًا”.
في مؤتمر صحفي، تيموثي جورز وقال أحد الباحثين في جامعة كامبريدج، والذي ساعد في وضع علامات على إجابات ألفا بروف، إن أداء الذكاء الاصطناعي كان مفاجئًا ويبدو أنه وجد “مفاتيح سحرية” للإجابة على المشكلات بطريقة مماثلة للبشر. وقال جورز: “اعتقدت أن هذه المفاتيح السحرية ربما تكون أبعد قليلاً مما يمكنها فعله، لذلك كان الأمر بمثابة مفاجأة كبيرة في حالة أو حالتين عندما وجد البرنامج هذه المفاتيح بالفعل”.
يعمل AlphaProof بشكل مشابه لذكاءات Google DeepMind السابقة التي يمكنها تغلب على أفضل البشر في لعبة الشطرنج و يذهبتعتمد كل هذه الذكاءات الاصطناعية على نهج التجربة والخطأ المسمى بالتعلم التعزيزي، حيث يجد النظام طريقه الخاص لحل مشكلة ما من خلال العديد من المحاولات. ومع ذلك، تتطلب هذه الطريقة مجموعة كبيرة من المشكلات المكتوبة بلغة يمكن للذكاء الاصطناعي فهمها والتحقق منها، في حين أن معظم المشكلات المشابهة لـ IMO مكتوبة باللغة الإنجليزية.
وللتغلب على هذا، توماس هوبرت في DeepMind، استخدم زملاؤه برنامج Gemini AI من Google، وهو نموذج لغوي مثل النموذج الذي يعمل به ChatGPT، لترجمة هذه المشكلات إلى لغة برمجة تسمى Lean حتى يتمكن الذكاء الاصطناعي من تعلم كيفية حلها.
وقال هيوبرت في المؤتمر الصحفي: “في البداية، سيكون قادرًا على حل أبسط المشكلات، والتعلم من حل تلك المشكلات البسيطة لمهاجمة المشكلات الأصعب فأصعب”. كما ينتج إجاباته في Lean، بحيث يمكن التحقق من صحتها على الفور.
ورغم أن أداء ألفا بروف مثير للإعجاب، إلا أنه يعمل ببطء، إذ يستغرق ما يصل إلى ثلاثة أيام لإيجاد بعض الحلول بدلاً من 4.5 ساعة لكل ثلاثة أسئلة وهو ما يسمح به للمنافسين. كما فشل في الإجابة على السؤالين المتعلقين بالتركيبات، وهي دراسة العد وترتيب الأرقام. ويقول: “ما زلنا نعمل على فهم سبب ذلك، وهو ما نأمل أن يقودنا إلى تحسين النظام”. اليكس ديفيز في Google DeepMind.
كما أنه ليس من الواضح كيف يصل AlphaProof إلى إجاباته أو ما إذا كان يستخدم نفس النوع من الحدس الرياضي الذي يستخدمه البشر، كما قال جاورز، ولكن قدرته على ترجمة البراهين من Lean إلى اللغة الإنجليزية تجعل من السهل التحقق من صحتها.
النتيجة مثيرة للإعجاب وتشكل إنجازًا مهمًا، كما يقول جوردي ويليامسون في جامعة سيدني، أستراليا. “كانت هناك محاولات سابقة عديدة لتطبيق التعلم التعزيزي على البراهين الرسمية، ولم تحقق أي منها نجاحًا كبيرًا”.
في حين أن نظامًا مثل AlphaProof قد يكون مفيدًا لعلماء الرياضيات العاملين في المساعدة في تطوير البراهين، فمن الواضح أنه لا يمكن أن يساعد في تحديد المشكلات التي يجب حلها والعمل عليها، وهو ما يستغرق جزءًا كبيرًا من وقت الباحثين، كما يقول يانغ هوي هي في معهد لندن للعلوم الرياضية.
وقال هوبرت إن فريقه يأمل أن يتمكن AlphaProof من المساعدة في تحسين نماذج اللغة الكبيرة الخاصة بشركة Google، مثل Gemini، من خلال تقليل الاستجابات غير الصحيحة.
وقد عرضت شركة التداول XTX Markets جائزة قدرها 5 ملايين دولار – تسمى أولمبياد الرياضيات للذكاء الاصطناعي – للذكاء الاصطناعي القادر على تحقيق الميدالية الذهبية في IMO، لكن AlphaProof غير مؤهل لأنه غير متاح للجمهور. يقول أليكس جيركو من XTX Markets: “نأمل أن تلهم التطورات التي حققتها DeepMind المزيد من الفرق للمشاركة في جائزة AIMO، وبالطبع نرحب بالمشاركة العامة من DeepMind نفسها”.
المواضيع: