التكنولوجيا
يتم إجراء اختبار لأداء نموذج الذكاء الاصطناعى في جميع أنحاء الصناعة من قبل عمالقة التكنولوجيا ، مما يجعل المقارنة العلمية موضوعية مستحيلة ، وادعى الباحثون
بواسطة”http://www.newscientist.com/author/matthew-sparkes/”> ماثيو سباركس
“0 0 32 32″ الإصدار=”1.1″ دور=”img” ملء=”rgb(0, 0, 0)” xmlns: xlink=”http://www.w3.org/1999/xlink”>
نماذج الذكاء الاصطناعى تتجه مباشرة في chatbot Arena
Andriy Onufriyenko/Getty Images
تم تشويه طاولة الدوري القياسي في الصناعة لتصنيف نماذج الذكاء الاصطناعي عن عمد من قبل عمالقة التكنولوجيا ، وادعى الباحثون ، مما أدى إلى صورة مضللة هي AIS هي الأفضل.
“wsite-title”> سارة هوكر في Cohere Labs ، لا يزعم منظمة غير ربحية أمريكية ، وزملاؤها أنهم وجدوا أن الشعبية”https://lmarena.ai/”> chatbot Arena Benchmark هو “ملعب مشوه” ، مع سياسات تنتهي بها المطاف إلى إعطاء ميزة لشركات كبيرة مثل Meta و Amazon و Google من خلال السماح لهم بتجاهل النماذج التي تسجل بشكل سيء.
أكثر من عالم جديد
استكشف آخر الأخبار والمقالات والميزات