احصل على النشرة الإخبارية اليومية العلمية الشهيرة
الاختراقات ، والاكتشافات ، ونصائح DIY المرسلة كل يوم من أيام الأسبوع.
لأول مرة على الإطلاق ،”https://www.popsci.com/category/ai/” الهدف=”_blank”> نماذج الذكاء الاصطناعي حقق درجات على مستوى الذهب المرموقة في”https://www.imo-official.org/default.aspx” rel=”noreferrer” الهدف=”_blank”> الرياضيات الدولية أولمبياد، أحد العرض الأول في العالم”https://www.popsci.com/science/new-soft-cell-shape/” الهدف=”_blank”> الرياضيات المسابقات. نجاحهم هو حق لا يمكن إنكاره لأكبر مؤيدي التكنولوجيا. ولكن كما هو الحال ،”https://www.popsci.com/technology/deepmind-robot-soccer/” الهدف=”_blank”> جوجل و”https://www.popsci.com/technology/ai-chess-cheat/” الهدف=”_blank”> Openaiلا تزال برامج الذكاء الاصطناعى الأكثر حافة وتجريبية لا تستطيع التغلب على مراهق ذكي للغاية.
قد يبدو الأمر مثيرًا للسخرية ، لكن الرياضيات المعقدة لا تزال واحدة من أكبر عقبات الذكاء الاصطناعي. هناك العديد من التحليلات حول سبب ظهور هذه القضية ، ولكن بشكل عام ، يتعلق الأمر”https://www.popsci.com/technology/chatgpt-google-chatbot-sentient/” الهدف=”_blank”> كيف تعمل التكنولوجيا. بعد تلقي مطالبة ، مثل الذكاء الاصطناعي”https://www.popsci.com/technology/chatgpt-human-inaccurate/” الهدف=”_blank”> chatgpt و”https://www.popsci.com/technology/google-gemini-inaccuracies-race/” الهدف=”_blank”> Google Gemini كسر الكلمات والحروف لأسفل إلى “الرموز المميزة” ، ثم تحليل وتوقع استجابة مناسبة. بالنسبة إلى الذكاء الاصطناعي ، فإن الإجابة هي مجرد سلسلة من الرموز المميزة على الأرجح. البشر ، ومع ذلك ، يعالجهم ككلمات وجمل وأفكار كاملة.
بالنظر إلى هذه المعلمات ، لا تمتلك الذكاء الاصطناعى إمكانيات “المنطق” المطلوبة للتعامل مع المطالبات الرياضية المعقدة. ويرجع ذلك إلى حد كبير إلى أن مطالبات الرياضيات لا تحتوي عادة على إجابات متعددة محتملة – فقط حل واحد وصحيح. اليوم ، ستمنحك حاسبة الجيب دائمًا الإجابة الحقيقية بشكل موضوعي لضرب 4596 في 4859 (22331،964). وفي الوقت نفسه ، قد لا يزال Chatgpt يقدم لك إجابة قدرها 22325364:
تحسينات كبيرة
منذ عام 1959 ، عملت أولمبياد الرياضيات الدولية (IMO) كأحد الأحداث الأولى في العالم للشباب –بشر– أزيز. سيحتاج العديد من علماء الرياضيات لفترة أطول من وقتهم المخصص للإجابة على واحدة من مشاكل IMO – ولن يتمكن معظم الناس من حل أي منها.
استضافت أستراليا مؤخرًا مسابقة IMO السنوية السادسة والستين في كوينزلاند ، حيث اجتمع 641 مراهقًا من 112 دولة في 15 يوليو لمعالجة ستة أسئلة في أقل من 4.5 ساعات. هذه المرة ، ومع ذلك ، كان لديهم بعض المنافسة الإضافية: زوج من نماذج التفكير التجريبية من Google و Openai.
برامج الروبوت بشكل جيد. كلتا الشركتين لديها”https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/” rel=”noreferrer” الهدف=”_blank”> منذ الإعلان أن برامجهم”https://x.com/alexwei_/status/1946477742855532918″ rel=”noreferrer” الهدف=”_blank”> سجل عالية بما فيه الكفاية في اختبار IMO لهذا العام لكسب ميداليات ذهبية. تمكنت كل منظمة العفو الدولية من حل 5 من المشكلات الست في الوقت المحدد ، وحصل على 35 من أصل 42 نقطة ممكنة كحد أقصى. هذا العام ، حصل حوالي 10 في المائة فقط من الوافدين البشريين على درجة على مستوى الذهب.
كان يمثل تحسنا كبيرا من”https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/” rel=”noreferrer” الهدف=”_blank”> عرض جوجل الأخير في IMO. في عام 2024 ، وصلت نسخة من AI Deepmind المنطقية AI إلى درجة Medalal الفضية بعد حل أربع من ستة مشاكل ، على الرغم من أنها تتطلب 2-3 أيام من الحساب بدلاً من الحد الزمني 4.5 ساعة. وفقًا لرئيس المنظمة البحرية الدولية غريغور دولينار ، فإن إحدى النقاط الأكثر إثارة للاهتمام في نتائج هذا العام لم تكن فقط حسابات برامج الذكاء الاصطناعى ، ولكن الطرق التي أوضحوا بها “التفكير” للوصول إلى كل إجابة.
“كانت حلولهم مذهلة في كثير من النواحي. عثر طلاب المنظمة البحرية الدولية على أنهم واضحون ودقيقون ، ومعظمهم يسهل متابعتهم” ، قال دولينار عبر”https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/” rel=”noreferrer” الهدف=”_blank”> إعلان جوجل.
المخاوف الكبيرة
هناك معلم آخر على الأقل من IMO لكلتا الشركتين: درجة مثالية. هذا العام ، قام خمسة مراهقين بسحب هذا الإنجاز. وحتى إذا كان Google أو Openai يربط البشر في IMO في السنوات القادمة ، فقد لا يزال النصر يتطلب سياقًا. مثل”https://phys.org/news/2025-07-humans-ai-international-math-contest.html” rel=”noreferrer” الهدف=”_blank”> لاحظت AFP، لم يتمكن منظمو IMO من تأكيد مقدار قوة الحوسبة المطلوبة إما من خلال نموذج الذكاء الاصطناعى ، أو إذا كان هناك أي إشراف بشري إضافي أثناء الحسابات.
وعلى الرغم من أن القفزة التكنولوجية الأخيرة من الذكاء الاصطناعي مثيرة للإعجاب ، إلا أنها لا تزال مطلوبة على الأرجح”https://www.popsci.com/technology/ai-more-energy/” الهدف=”_blank”> كميات ضخمة مقلقة الطاقة والماء. شركات مثل Google و Openai و Microsoft كلها”https://www.popsci.com/technology/ai-energy-use-study/” الهدف=”_blank”> الاستثمار بكثافة في مشاريع مركز البيانات لدعم مشاريع الذكاء الاصطناعي – كلها تحتاج إلى مصادر الطاقة. في بعض الحالات ، قد يشمل ذلك حتى”https://www.popsci.com/technology/ai-more-energy/” الهدف=”_blank”> توسيع استخدام الوقود الأحفوري. قدّر الوكالة الدولية للرقص سابقًا أنه في هذا المعدل ، قد تكون صناعة الذكاء الاصطناعى”https://www.popsci.com/technology/ai-energy-use-study/” الهدف=”_blank”> تستهلك الكثير من الطاقة مثل الأرجنتين، إن لم يكن”https://www.nytimes.com/2023/10/10/climate/ai-could-soon-need-as-much-electricity-as-an-entire-country.html” rel=”noreferrer” الهدف=”_blank”> دول متعددة مجتمعة. هذه مشكلة أن الذكاء الاصطناعى – وليس صانعيها – لم تحلها بعد.
المزيد من الصفقات والمراجعات وأدلة الشراء
اختبر فريق Popsci مئات المنتجات وقضى آلاف الساعات في محاولة للعثور على أفضل معدات وأدوات يمكنك شراؤها.