منذ بداية طفرة الذكاء الاصطناعي التوليدي، كان هناك صراع حول كيفية تدريب نماذج الذكاء الاصطناعي الكبيرة. في أحد المعسكرين، توجد شركات التكنولوجيا مثل OpenAI التي تمتلك هذه التقنية ادعى فمن “المستحيل” تدريب الذكاء الاصطناعي دون تصفح الإنترنت للبيانات المحمية بحقوق الطبع والنشر. وفي المعسكر الآخر هناك فنانون يزعمون أن شركات الذكاء الاصطناعي استولت على ملكيتهم الفكرية دون موافقة أو تعويض.
تعتبر شركة Adobe غير عادية إلى حد ما من حيث أنها تقف إلى جانب المجموعة الأخيرة، مع نهج يبرز كمثال على كيفية إنشاء منتجات الذكاء الاصطناعي التوليدية دون حذف البيانات المحمية بحقوق الطبع والنشر من الإنترنت. أصدرت شركة Adobe نموذجها لتوليد الصور Firefly، والذي تم دمجه في أداة تحرير الصور الشهيرة Photoshop، منذ عام واحد.
في مقابلة خاصة مع مراجعة تكنولوجيا معهد ماساتشوستس للتكنولوجيا، يصر قادة الذكاء الاصطناعي في Adobe على أن هذا هو السبيل الوحيد للمضي قدمًا. ويقولون إن الخطر لا يقتصر على سبل عيش المبدعين فحسب، بل على النظام البيئي للمعلومات بأكمله. ما تعلموه يوضح أن بناء التكنولوجيا المسؤولة لا يجب أن يأتي على حساب ممارسة الأعمال التجارية.
“ونحن نشعر بالقلق من أن الصناعة، وخاصة وادي السليكون، لا تتوقف لتتساءل كيف أو لماذا”. يقول ديفيد وادواني، رئيس أعمال الوسائط الرقمية في Adobe: “إن مجرد قدرتك على بناء شيء ما لا يعني أنه يجب عليك بناءه دون النظر إلى التأثير الذي تحدثه”.
هذه الأسئلة وجهت إنشاء Firefly. عندما بدأت طفرة الصور التوليدية في عام 2022، كان هناك رد فعل عنيف كبير ضد الذكاء الاصطناعي من المجتمعات الإبداعية. كان العديد من الأشخاص يستخدمون نماذج الذكاء الاصطناعي التوليدية كآلات محتوى مشتقة لإنشاء الصور بأسلوب فنان آخر، مما أثار أ معركة قانونية على حقوق النشر والاستخدام العادل. كما أن أحدث تقنيات الذكاء الاصطناعي التوليدية جعلت عملية الإنشاء أسهل كثيرًا التزييف العميق والمعلومات الخاطئة.
يقول وادواني إنه سرعان ما أصبح من الواضح أنه من أجل تقديم الائتمان المناسب للمبدعين واليقين القانوني للشركات، لا تستطيع الشركة بناء نماذجها عن طريق استخراج شبكة البيانات.
تريد شركة Adobe جني فوائد الذكاء الاصطناعي التوليدي بينما لا تزال “تدرك أن هذه الفوائد مبنية على العمل البشري. ويقول إيلي جرينفيلد، كبير مسؤولي التكنولوجيا للوسائط الرقمية في شركة Adobe: “علينا أن نتوصل إلى كيفية تعويض الأشخاص بشكل عادل عن هذا العمل الآن وفي المستقبل”.
لكشط أو عدم كشط
أصبح استخراج البيانات عبر الإنترنت، وهو أمر شائع في الذكاء الاصطناعي، مثيرًا للجدل إلى حد كبير مؤخرًا. تواجه شركات الذكاء الاصطناعي مثل OpenAI وStability.AI وMeta وGoogle العديد من الدعاوى القضائية بشأن بيانات تدريب الذكاء الاصطناعي. تجادل شركات التكنولوجيا بأن البيانات المتاحة للجمهور هي لعبة عادلة. يختلف الكتاب والفنانون ويضغطون من أجل نموذج قائم على الترخيص، حيث يتم تعويض المبدعين مقابل إدراج أعمالهم في مجموعات بيانات التدريب.
يقول غرينفيلد إن Adobe قامت بتدريب Firefly على المحتوى الذي كان له ترخيص صريح يسمح بتدريب الذكاء الاصطناعي، مما يعني أن الجزء الأكبر من بيانات التدريب يأتي من مكتبة Adobe للصور المخزنة. ويضيف أن الشركة تقدم للمبدعين تعويضات إضافية عند استخدام المواد لتدريب نماذج الذكاء الاصطناعي.
وهذا على النقيض من الوضع الراهن في الذكاء الاصطناعي اليوم، حيث تقوم شركات التكنولوجيا بتجميع الويب بشكل عشوائي وتمتلك فهم محدود ماذا تتضمن بيانات التدريب. وبسبب هذه الممارسات، فإن مجموعات بيانات الذكاء الاصطناعي تتضمن حتما محتوى محمي بحقوق الطبع والنشر بيانات شخصية، وقد كشفت الأبحاث عن محتوى سام، مثل مواد الاعتداء الجنسي على الأطفال.
يمنح استخراج الإنترنت شركات التكنولوجيا وسيلة رخيصة للحصول على الكثير من بيانات التدريب على الذكاء الاصطناعي، وعادةً ما يسمح الحصول على المزيد من البيانات للمطورين ببناء نماذج أكثر قوة. يقول جرينفيلد إن قصر برنامج Firefly على البيانات المرخصة للتدريب كان رهانًا محفوفًا بالمخاطر.
يقول غرينفيلد: “لكي نكون صادقين، عندما بدأنا مع Firefly بنموذج الصور الخاص بنا، لم نكن نعرف ما إذا كنا سنكون قادرين على تلبية احتياجات العملاء دون محو الويب أم لا”.
“ووجدنا أننا قادرون على ذلك، وهو أمر عظيم”.
يقوم مشرفو المحتوى البشري أيضًا بمراجعة بيانات التدريب للتخلص من المحتوى المرفوض أو الضار، والملكية الفكرية المعروفة، وصور الأشخاص المعروفين، وتمتلك الشركة تراخيص لكل شيء تتدرب عليه منتجاتها.
يقول جرينفيلد إن استراتيجية Adobe كانت تتمثل في دمج أدوات الذكاء الاصطناعي التوليدية في منتجاتها الحالية. في Photoshop، على سبيل المثال، يمكن لمستخدمي Firefly ملء مناطق الصورة باستخدام أوامر نصية. وهذا يسمح لهم بمزيد من التحكم في العملية الإبداعية، ويساعدهم على الإبداع.
ومع ذلك، لا يزال يتعين القيام بالمزيد من العمل. تريد الشركة أن تجعل Firefly أسرع. في الوقت الحالي، تستغرق خوارزميات الإشراف على محتوى الشركة حوالي 10 ثوانٍ للتحقق من مخرجات النموذج، على سبيل المثال، كما يقول جرينفيلد. تحاول Adobe أيضًا معرفة كيف يمكن لبعض عملاء الأعمال إنشاء محتوى محمي بحقوق الطبع والنشر، مثل شخصيات Marvel أو Mickey Mouse. تعاونت Adobe مع شركات مثل IBM وMattel وNVIDIA وNASCAR، مما يسمح لهذه الشركات باستخدام الأداة مع ملكيتها الفكرية. وهي تعمل أيضا على صوتي, أدوات مزامنة الشفاه و جيل ثلاثي الأبعاد.
القمامة في الداخل والقمامة في الخارج
كما أن قرار عدم استخلاص الإنترنت يمنح Adobe ميزة في الإشراف على المحتوى. من الصعب جدًا التحكم في الذكاء الاصطناعي التوليدي، ولا يعرف المطورون أنفسهم سبب إنشاء النماذج للصور والنصوص التي يقومون بها. لقد تم طرح نماذج الذكاء الاصطناعي التوليدية مشكوك فيه والمحتوى السام في العديد من الحالات.
يقول جرينفيلد إن كل هذا يعود إلى ما تم تدريبه عليه. ويقول إن نموذج أدوبي لم ير قط صورة لجو بايدن أو دونالد ترامب، على سبيل المثال، ولا يمكن إقناعه بتوليد معلومات سياسية مضللة. لا تحتوي بيانات التدريب الخاصة بنموذج الذكاء الاصطناعي على محتوى إخباري أو أشخاص مشهورين. ولم يتم تدريبه على أي مواد محمية بحقوق الطبع والنشر، مثل صور ميكي ماوس.
يقول جرينفيلد: “إنها لا تفهم ما هو هذا المفهوم”.
تطبق Adobe أيضًا الإشراف الآلي على المحتوى عند نقطة الإنشاء للتأكد من أن إبداعات Firefly آمنة للاستخدام المهني. يُحظر على العارضة إنشاء قصص إخبارية أو صور عنيفة. تم أيضًا حظر بعض أسماء الفنانين. يأتي المحتوى الذي تم إنشاؤه بواسطة Firefly مع تسميات التي تشير إلى أنه تم إنشاؤها باستخدام الذكاء الاصطناعي، وسجل تحرير الصورة.
خلال عام انتخابي حاسم، تعد الحاجة إلى معرفة من قام بإعداد جزء من المحتوى وكيف يتم ذلك أمرًا مهمًا بشكل خاص. لقد كانت Adobe مدافعًا قويًا عن التصنيفات الموجودة على محتوى الذكاء الاصطناعي التي توضح مكان نشأته ومع من.
بدأت الشركة مبادرة أصالة المحتوى، وهي جمعية تروج لاستخدام العلامات التي تخبرك ما إذا كان المحتوى تم إنشاؤه بواسطة الذكاء الاصطناعي أم لا، إلى جانب نيويورك تايمز وتويتر (الآن X). تضم المبادرة الآن أكثر من 2500 عضو. وهو أيضًا جزء من التطوير C2PA، علامة قياسية في الصناعة والذي يوضح مصدر جزء المحتوى وكيفية إنشائه.
“لقد طال انتظارنا [for] يقول غرينفيلد: “تعليم أفضل في مجال محو الأمية الإعلامية والأدوات التي تدعم قدرة الناس على التحقق من صحة أي محتوى يدعي أنه يمثل الواقع”.
يسلط نهج Adobe الضوء على حاجة شركات الذكاء الاصطناعي إلى التفكير بعمق في الإشراف على المحتوى، كما تقول كلير ليبوفيتش، رئيسة قسم الذكاء الاصطناعي وسلامة الوسائط في منظمة Partnership on AI غير الربحية.
ويضيف ليبوفيتش أن نهج Adobe تجاه الذكاء الاصطناعي التوليدي يخدم تلك الأهداف المجتمعية من خلال مكافحة المعلومات الخاطئة بالإضافة إلى تعزيز أهداف العمل، مثل الحفاظ على استقلالية المبدعين وإسنادهم.
وتقول: “إن المهمة التجارية لشركة Adobe لا تتمثل في منع المعلومات الخاطئة في حد ذاتها”. “إنها لتمكين المبدعين. أليس هذا مزيجًا رائعًا حقًا من المهمة والتكتيكات، لتكون قادرًا على ضرب عصفورين بحجر واحد؟
يوافق وادواني. تقول الشركة إن الميزات التي تعمل بنظام Firefly هي من بين أكثر ميزاتها شيوعًا، وأن 90% من مستخدمي تطبيق الويب الخاص بـ Firefly هم عملاء جدد تمامًا لشركة Adobe.
يقول وادواني: “أعتقد أن النهج الذي اتبعناه كان بالتأكيد مفيدًا للأعمال”.
تصحيح: نسخة سابقة من هذه المقالة تحتوي على عنوان ديفيد وادواني خاطئ. لقد تم تعديل هذا.