10 فبراير 2025
3 دقائق قراءة
يمكن لمنظمة العفو الدولية من Google التغلب على أذكى المدارس الثانوية في الرياضيات
يصل Alphageometry2 من Google إلى مستوى طلاب Medal Medal في أولمبياد الرياضيات الدولية
بواسطة”http://www.scientificamerican.com/author/davide-castelvecchi/”> Davide Castelvecchi & &”http://www.scientificamerican.com/author/nature-magazine/”> مجلة الطبيعة
Google DeepMind’s AI Alphageometry2 مشاكل في أولمبياد الرياضيات الدولية.
Wirestock ، Inc./Alamy ألبوم الصور
قبل عام ، فاجأ Alphageometry ، وهو حل المشكلات الاصطناعية (AI) التي أنشأتها Google DeepMind ، العالم”https://www.nature.com/articles/d41586-024-02441-2″> أداء على مستوى الميداليات الفضية في أولمبياد الرياضيات الدولية (IMO) ، وهي مسابقة مرموقة تضع مشاكل في الرياضيات الصعبة لطلاب المدرسة الثانوية الموهوبين.
على دعم الصحافة العلمية
إذا كنت تستمتع بهذا المقال ، ففكر في دعم الصحافة الحائزة على جوائز”http://www.scientificamerican.com/getsciam/”> الاشتراك. من خلال شراء اشتراك ، تساعد على ضمان مستقبل القصص المؤثرة حول الاكتشافات والأفكار التي تشكل عالمنا اليوم.
حل المشكلات في الهندسة الإقليدية هو أحد الموضوعات الأربعة التي تغطيها مشاكل IMO – بينما يغطي الآخرون فروع نظرية الأرقام والجبر والمدمج. تتطلب الهندسة مهارات محددة من الذكاء الاصطناعي ، لأن المنافسين يجب أن يقدموا دليلًا صارمًا على بيان حول الأشياء الهندسية على متن الطائرة. في يوليو ، ظهرت Alphageometry2 لأول مرة إلى جانب نظام تم كشف النقاب عنه حديثًا ، Alphaproff ، والذي طور DeepMind لحل أسئلة غير القياس في مجموعات مشكلة IMO.
اللغة الرياضية
قياس Alphageometry عبارة عن مجموعة من المكونات التي تتضمن نموذجًا للغة المتخصصة ونظامًا “عصبيًا عصبيًا”-لا يتدرب على التدريب من خلال التعلم من البيانات مثل شبكة عصبية ولكنه يحتوي على منطق تجريدي يرمز إليه البشر. قام الفريق بتدريب نموذج اللغة على التحدث بلغة رياضية رسمية ، مما يجعل من الممكن التحقق تلقائيًا من إخراجها من أجل الصرامة المنطقية – وللتعزل عن “الهلوسة” ، والبيانات غير المتماسكة أو الخاطئة التي تعرضها AI chatbots.
بالنسبة إلى Alphageometry2 ، قام الفريق بإجراء العديد من التحسينات ، بما في ذلك دمج نموذج اللغة الكبير في Google ، Gemini. قدم الفريق أيضًا القدرة على التفكير من خلال نقل الأشياء الهندسية حول الطائرة – مثل تحريك نقطة على طول خط لتغيير ارتفاع المثلث – وحل المعادلات الخطية.
كان النظام قادرًا على حل 84 ٪ من جميع مشاكل الهندسة الواردة في IMOS في السنوات الـ 25 الماضية ، مقارنة مع 54 ٪ لأول مرة. (استخدمت الفرق في الهند والصين مناهج مختلفة العام الماضي لتحقيق أداء على مستوى الذهب في الهندسة ، ولكن في مجموعة فرعية أصغر من مشاكل الهندسة المنظمة البحرية الدولية.)
يكتب مؤلفو ورقة DeepMind أن التحسينات المستقبلية لقياس Alphageometry ستشمل التعامل مع مشاكل الرياضيات التي تنطوي على عدم المساواة والمعادلات غير الخطية ، والتي ستكون مطلوبة لـ “حل الهندسة بالكامل”.
تقدم سريع
قد يفوز نظام الذكاء الاصطناعى الأول الذي يحقق درجة ذهبية للمواطن الإجمالي بجائزة 5 ملايين دولار أمريكي تسمى جائزة أولمبياد الرياضية من الذكاء الاصطناعي-على الرغم من أن هذه المنافسة تتطلب أن تكون الأنظمة مفتوحة المصدر ، وهذا ليس هو الحال بالنسبة لـ DeepMind.
يقول Buzzard إنه لا يفاجأ بالتقدم السريع الذي أحرزه DeepMind والفرق الهندية والصينية. لكنه يضيف ، على الرغم من أن المشكلات صعبة ، إلا أن الموضوع لا يزال بسيطًا من الناحية المفاهيمية ، وهناك العديد من التحديات التي يجب التغلب عليها قبل أن تتمكن الذكاء الاصطناعي من حل المشكلات على مستوى الرياضيات البحثية.
باحثو الذكاء الاصطناعى سوف ينتظرون بفارغ الصبر التكرار التالي للمنظمة البحرية الدولية في صن شاين كوست ، أستراليا ، في يوليو. بمجرد أن يتم نشر مشكلاتها للمشاركين البشريين لحلها ، فإن الأنظمة المستندة إلى الذكاء الاصطناعي تحصل على حلها أيضًا. (لا يُسمح لموكلاء الذكاء الاصطناعي بالمشاركة في المنافسة ، وبالتالي ليسوا مؤهلين للفوز بالميداليات.) يُنظر إلى المشكلات الجديدة على أنها الاختبار الأكثر موثوقية للأنظمة المستندة إلى الآلة ، لأنه لا يوجد خطر من أن المشاكل أوهم كان الحل موجودًا عبر الإنترنت وقد يكون “تسرب” في مجموعات بيانات التدريب ، ويختلف النتائج.
هذه المقالة مستنسخة بإذن وكان نشرت لأول مرة في 7 فبراير 2025.