الذكاء الاصطناعي: تكرار لتحديات السحابة المبكرة وسباق التشغيل الحاسم

على مدى العامين الماضيين، ركزت معظم المناقشات حول الذكاء الاصطناعي على سباق النماذج؛ أي نموذج أكبر أو أسرع أو يحقق نتائج أفضل في المعايير.

ولكن مع انتقال الذكاء الاصطناعي من كونه أنظمة تجريبية إلى صميم المنتجات وسير العمل، بدأ يظهر نمط مألوف من الأيام الأولى للحوسبة السحابية: أصبحت الأنظمة قابلة للبرمجة بشكل غير مسبوق، ولكن تشغيلها أصبح أكثر تعقيداً.

هذا يعني أن المنافسة الأكثر أهمية في مجال الذكاء الاصطناعي تتحول الآن من السؤال: من يملك النموذج الأفضل؟ إلى: من يستطيع تشغيل الذكاء الاصطناعي بشكل موثوق وفعال وآمن على نطاق واسع؟

الذكاء الاصطناعي يصل الآن إلى حدود التشغيل، لا حدود النماذج

عند تحليل بيانات القياس عن بعد الواقعية من آلاف أنظمة الإنتاج، تتضح صورة مقلقة. يفشل ما يقرب من طلب واحد من كل 20 طلباً للذكاء الاصطناعي بمجرد أن تصل التطبيقات إلى نطاق واسع. وتنبع غالبية هذه الإخفاقات الآن من قيود السعة مثل حدود المعدل والحصص والحد الأقصى للتزامن، وليس من أخطاء النموذج أو ضعف الدقة. هذه قصة مختلفة تماماً عن مخططات المعايير التي اعتادت عليها معظم الفرق.

تتزايد أيضاً كمية البيانات المرسلة مع كل طلب. في العديد من بيئات الإنتاج، ضاعف المستخدمون المتوسطون استهلاكهم للرموز (tokens)، بينما شهد المستخدمون الكثيفون زيادة مضاعفة في الحجم. هذا النمو يعد مؤشراً على حالات استخدام الذكاء الاصطناعي الأكثر طموحاً، ومحركاً مباشراً لزيادة التكاليف والضغط على البنية التحتية لتكنولوجيا المعلومات.

يمكن رؤية هذا التأثير بشكل أوضح في ما تصفه العديد من الفرق بانتشار وحدات معالجة الرسومات (GPU sprawl)؛ حيث تنتشر الأساطيل المجزأة عبر السحابات والمجموعات المحلية. تبقى بعض وحدات معالجة الرسومات في وضع الخمول بينما تكون وحدات أخرى مشبعة باستمرار، وهناك ارتباط ضئيل جداً بين المكان الذي تُستهلك فيه ساعات وحدة معالجة الرسومات والمكان الذي تتولد فيه القيمة التجارية.

والنتيجة مألوفة لأي شخص شهد فترة التبني المبكر للحوسبة السحابية؛ إنفاق جامح، أداء غير متوقع، وأزمات في القدرات تظهر من العدم.

كيف تتجلى هذه التحديات في منطقة آسيا والمحيط الهادئ؟

في جميع أنحاء منطقة آسيا والمحيط الهادئ، وخاصة في رابطة دول جنوب شرق آسيا (آسيان)، نشهد حالياً ضغوطاً هيكلية: يتسارع تبني الذكاء الاصطناعي، لكن النضج التشغيلي غير متساوٍ.

تحرز سنغافورة تقدماً كبيراً في مجال الحوكمة والمراقبة، مدفوعة جزئياً بالتوقعات التنظيمية ومشهدها السحابي الأكثر نضجاً. في المقابل، تتحرك أسواق مثل إندونيسيا وماليزيا وتايلاند بسرعة كبيرة في نشر الذكاء الاصطناعي، وغالباً ما تدفعه نحو الخدمات الموجهة للعملاء، بينما تتأخر الممارسات التشغيلية عن هذا الركب.

وبينما تطرح المؤسسات في هذه الأسواق بنيات متعددة النماذج وتعتمد على الوكلاء، فإنها تواجه مشكلات تتعلق بالموثوقية والرؤية المحدودة وأداء النماذج غير المتسق. يتزايد استخدام الرموز بسرعة، لكن ممارسات التحسين، مثل التخزين المؤقت الفوري وهندسة السياق، لا تزال غير مستغلة بالقدر الكافي.

هذه الفجوة بين الاستعداد والنشر تخلق بالفعل ديوناً تشغيلية وتكاليف سيكون من الصعب التخلص منها لاحقاً.

التخصصات التشغيلية الأربعة التي تحتاجها فرق الذكاء الاصطناعي

مع تطور الذكاء الاصطناعي بشكل يماثل الأيام الأولى للحوسبة السحابية، فإن الخبر السار هو أننا نستطيع التنبؤ، ولو قليلاً، بالاتجاهات المستقبلية.

والآن، السؤال الذي يجب أن يطرحه قادة الذكاء الاصطناعي هو: ما هي التخصصات التي ستميز الفرق التي ستتعامل بفعالية مع هذا التعقيد المتزايد؟

من وجهة نظري، هناك أربعة أمور أساسية يجب على فرق الذكاء الاصطناعي اعتمادها لتحقيق النجاح المستدام:

1. إنشاء الرؤية والإسناد

لا يمكنك إدارة ما لا يمكنك رؤيته، والذكاء الاصطناعي ليس استثناءً.

تحتاج الفرق إلى معرفة كيفية تخصيص ساعات عمل وحدات معالجة الرسومات (GPU) والرموز (tokens) لتطبيقات وفرق وحالات استخدام محددة، لربط هذا الاستهلاك بزمن الاستجابة، ومعدلات الخطأ، وتأثير المستخدم النهائي.

وهذا يمكنهم من فصل أعباء العمل الحيوية للأعمال عن الضوضاء الخلفية، مما يوفر وضوحاً بشأن الخدمات التي ترفع التكاليف أو تستهلك القدرة بشكل مفرط.

عندما يكون الاستخدام مرئياً ويمكن إسناده إلى تطبيق أو خدمة معينة، تصبح القرارات المتعلقة بمكان التحسين، أو حماية السعة، أو إعادة الاتصال أقل عاطفية وأكثر استناداً إلى البيانات.

2. فرض الضوابط والضمانات

بدون الضمانات الكافية، ستستهلك أنظمة الذكاء الاصطناعي كل السعة المتاحة لها.

تتضمن الضوابط التشغيلية حدود المعدل والحد الأقصى للميزانية، بالإضافة إلى الضمانات المتعلقة بسلوك الوكيل لمنع عمليات إعادة المحاولة اللانهائية، والحلقات، وسير العمل غير المحكم من استنزاف الموارد المشتركة.

تهدف هذه الضوابط إلى جعل الاستهلاك قابلاً للتنبؤ به، وضمان أن تجربة واحدة خارجة عن السيطرة لا يمكن أن تؤثر على خدمات الإنتاج الأساسية.

وبدون هذا الانضباط، تميل برامج الذكاء الاصطناعي إلى الوصول إلى حدودها الاقتصادية قبل وقت طويل من بلوغ حدودها التقنية. وينتهي الأمر بنماذج أولية مثيرة للإعجاب، لكن اقتصاديات الوحدة الخاصة بها غير مستدامة.

3. تحسين استخدام وحدات معالجة الرسومات قبل زيادة الإمداد

تسعى معظم الفرق للحصول على المزيد من وحدات معالجة الرسومات، بينما تواجه ما لديها بالفعل مشكلة في الاستخدام الفعال.

تمثل مثيلات وحدات معالجة الرسومات بالفعل حصة كبيرة من تكاليف الحوسبة، وتنمو هذه النسبة مع تعمق المؤسسات في التدريب والاستدلال على نطاق واسع.

لكن وحدات معالجة الرسومات الخاملة أو غير المستغلة بالقدر الكافي تخلق شعوراً بالنقص حتى في ظل توافر الإمكانيات. في المقابل، يمكن للعديد من الفرق ملاحظة ارتفاع إجمالي فاتورة وحدات معالجة الرسومات، لكنها لا تستطيع تحديد أعباء العمل التي تزيد الاستهلاك، أو الخطوات اللازمة لتحسين الكفاءة.

ما تعلمناه خلال الأيام الأولى للحوسبة السحابية هو أنه في هذه الحالات، يصبح الإفراط في التزويد هو الإجراء الأكثر أماناً، ولكن ذلك يؤدي إلى ارتفاع غير مبرر في الإنفاق حتى عندما تكون هناك سعة غير مستخدمة داخل الأسطول.

إن التعامل مع البنية التحتية لوحدات معالجة الرسومات كنظام أساسي يعني تتبع الاستخدام لتمكين الفرق من التمييز بين النقص الحقيقي في السعة وسوء التخصيص أو التجزئة. بعد ذلك، يمكنهم اتخاذ قرار بشأن تحرير الطاقة الإنتاجية الموجودة أو إضافة المزيد من الإمدادات بالفعل.

4. التصميم من أجل الكفاءة على مستوى طبقة التطبيق

تنشأ التكاليف المرتفعة للذكاء الاصطناعي ومعدلات الفشل من طريقة تجميع التطبيقات معاً، وليس من النماذج بحد ذاتها.

تؤدي الأنماط غير الفعالة والتوجيه السيئ عبر مزودي الخدمات والمطالبات غير المحسنة إلى زيادة استخدام الرموز، وارتفاع خطر انتهاء المهلات، والأخطاء، والسلوك غير المتسق.

ولكن من خلال الرؤية المناسبة للمطالبات والوكلاء والأدوات في بيئة الإنتاج، يمكن للفرق ملاحظة كيفية تدفق الطلبات فعلياً عبر النظام وضبط الجودة وزمن الاستجابة والتكلفة بطريقة محكمة.

يؤدي ذلك إلى تحويل طبقة التطبيق من صندوق أسود إلى بيئة تكون فيها الخيارات الهندسية الفعالة مدروسة، قابلة للقياس، ومتوافقة مع نتائج الأعمال.

ما يجب على القادة فعله في سباق الذكاء الاصطناعي الجديد

لقد علمتنا الأيام الأولى للحوسبة السحابية أن قابلية البرمجة، بدون انضباط تشغيلي، يمكن أن تشكل عائقاً بقدر ما هي ميزة. يمر الذكاء الاصطناعي الآن بنقطة تحول مماثلة؛ لن يكون الفائزون هم من يمتلكون القدرة على الوصول إلى أقوى النماذج فحسب، بل أيضاً أولئك الذين يتعاملون مع الذكاء الاصطناعي كقدرة هندسية وتشغيلية طويلة الأجل.

الاختبار الحاسم لأي مؤسسة هو قدرتها على توضيح أين تذهب نفقات الذكاء الاصطناعي، وكيف يتصرف الوكلاء في بيئة الإنتاج، وما هي أعباء العمل التي ستحظى بالحماية أولاً في حال انخفاض مفاجئ في القدرة.

إذا كانت الإجابة الصادقة هي لا أعرف بعد، فإن المرحلة التالية من رحلة الذكاء الاصطناعي ستكون واضحة: التوقف عن مطاردة الإصدار التالي من النماذج، والتركيز على بناء الأسس التشغيلية التي ستساعد على توسيع نطاق الذكاء الاصطناعي بشكل آمن ومستدام.