أطلقت النماذج اللغوية الكبيرة العنان لقوة الذكاء الاصطناعي. والآن حان الوقت لتولي أنظمة الذكاء الاصطناعي الأكثر كفاءة المسؤولية.
من
معهد ألين للذكاء الاصطناعي، الأنثروبي، جوجل، ميتا، مايكروسوفت، OpenAI
متى
الآن
لا تخطئ: الحجم مهم في عالم الذكاء الاصطناعي. عندما OpenAI”https://www.technologyreview.com/2020/07/20/1005454/openai-machine-learning-language-generator-gpt-3-nlp/”>أطلقت GPT-3 مرة أخرى في عام 2020، كان أكبر نموذج لغة تم بناؤه على الإطلاق. وأظهرت الشركة ذلك”https://www.technologyreview.com/2021/02/24/1017797/gpt3-best-worst-ai-openai-natural-language”> تحجيم هذا النوع من النماذج كان كافياً لإرسال الأداء عبر السقف. أدى ذلك إلى إطلاق طفرة تكنولوجية استمرت من خلال نماذج أكبر منذ ذلك الحين. وكما قال نعوم براون، عالم الأبحاث في OpenAI، أمام حشد من الحضور في TEDAI سان فرانسيسكو في أكتوبر/تشرين الأول، “يمكن تلخيص التقدم المذهل في الذكاء الاصطناعي على مدى السنوات الخمس الماضية في كلمة واحدة: النطاق”.
ولكن مع تراجع المكاسب الهامشية للنماذج الجديدة المتطورة، يحاول الباحثون اكتشاف كيفية تحقيق المزيد بموارد أقل. بالنسبة لمهام معينة، يمكن الآن للنماذج الأصغر التي تم تدريبها على مجموعات بيانات أكثر تركيزًا”https://www.technologyreview.com/2024/09/25/1104465/a-tiny-new-open-source-ai-model-performs-as-well-as-powerful-big-ones/”>الأداء مماثل للأداء الأكبر حجمًا، إن لم يكن أفضل. وهذا يعد بمثابة نعمة للشركات الحريصة على نشر الذكاء الاصطناعي بعدة طرق محددة. لا تحتاج إلى الإنترنت بالكامل في النموذج الخاص بك إذا كنت تقدم نفس النوع من الطلب مرارًا وتكرارًا.
تتباهى معظم شركات التكنولوجيا الكبرى الآن بإصدارات ذات حجم ممتع من نماذجها الرئيسية لهذا الغرض: تقدم OpenAI كلا من GPT-4o وGPT-4o mini؛ يحتوي Google DeepMind على Gemini Ultra وGemini Nano؛ ويأتي Anthropic’s Claude 3 بثلاث نكهات: Opus كبيرة الحجم، وSonnet متوسطة الحجم، وHaiku الصغيرة. تعد Microsoft رائدة في مجموعة من نماذج اللغات الصغيرة التي تسمى Phi.
يقدم عدد متزايد من الشركات الصغيرة نماذج صغيرة أيضًا. تدعي شركة AI الناشئة Writer أن أحدث نموذج لغوي لها يطابق أداء أكبر نماذج المستوى الأعلى في العديد من المقاييس الرئيسية على الرغم من وجود 20 فقط من المعلمات في بعض الحالات (القيم التي يتم حسابها أثناء التدريب وتحديد كيفية تصرف النموذج) .
استكشاف كاملا”https://www.technologyreview.com/2025/01/03/1109178/10-breakthrough-technologies-2025/”> قائمة 2025 التي تضم 10 تقنيات متقدمة.
تعد النماذج الأصغر حجمًا أكثر كفاءة، مما يجعلها أسرع في التدريب والجري. هذه أخبار جيدة لأي شخص يريد منحدرًا بأسعار معقولة. وقد يكون ذلك مفيدًا للمناخ أيضًا: نظرًا لأن النماذج الأصغر حجمًا تعمل بجزء صغير من جاذبية الكمبيوتر التي يتطلبها أبناء عمومتها العمالقة، فإنها تحرق طاقة أقل.
كما أن هذه النماذج الصغيرة تتنقل بشكل جيد: حيث يمكنها العمل مباشرة في جيوبنا، دون الحاجة إلى إرسال طلبات إلى السحابة. الصغير هو الشيء الكبير التالي.