خدمة مجتمع عشاق التكنولوجيا لأكثر من 25 عامًا.
TechSpot يعني التحليل الفني والمشورة يمكنك الوثوق. اقرأ لدينا بيان الأخلاق.
بطاطا ساخنة: أصبح تدريب نماذج الذكاء الاصطناعي المتقدمة باستخدام مواد خاصة قضية مثيرة للجدل. تواجه العديد من الشركات الآن تحديات قانونية من المؤلفين والمؤسسات الإعلامية في المحكمة. اعترفت ميتا باستخدام مجموعة بيانات “القرصنة” المعروفة، Books3، إلا أن الشركة مترددة في تعويض الكتاب بشكل مناسب.
رفعت مجموعة من المؤلفين دعوى قضائية ضد شركة Meta، زاعمة الاستخدام غير القانوني للمواد المحمية بحقوق الطبع والنشر في تطوير نماذجها اللغوية الكبيرة Llama 1 وLlama 2. ردًا على ذلك، خاطبت شركة فيسبوك الكاتبة والممثلة الكوميدية سارة سيلفرمان، والمؤلف ريتشارد كادري، وغيرهم من أصحاب الحقوق الذين يقودون الإجراء القانوني، معترفين بأن طلاب الماجستير في القانون التابعين لها قد تم تدريبهم باستخدام كتب محمية بحقوق الطبع والنشر.
ميتا لديها اعترف لاستخدام مجموعة بيانات Books3، من بين العديد من المواد الأخرى، لتدريب Llama 1 وLlama 2 LLMs. الكتب3 هي أ مجموعة معروفة تتألف من مجموعة نص عادي تضم أكثر من 195000 كتاب يبلغ إجمالي حجمها حوالي 37 جيجابايت. تم إنشاء الأرشيف بواسطة باحث الذكاء الاصطناعي شون بريسر في عام 2020 كوسيلة لتوفير مصدر بيانات أفضل للتحسين التعلم الالي خوارزميات.
أدى التوافر الواسع النطاق لمجموعة بيانات Books3 إلى استخدامها على نطاق واسع في تدريب الذكاء الاصطناعي من قبل العديد من الباحثين. استخدمت شركات التكنولوجيا الكبرى، بما في ذلك شركة ميتا، Books3 ومجموعات البيانات الأخرى المثيرة للجدل لمنتجات الذكاء الاصطناعي التجارية الخاصة بها. وعلى هذا الحساب، قالت صحيفة نيويورك تايمز رفع دعوى قضائية ضد OpenAI ومايكروسوفت بزعم استخدام الملايين من المقالات المحمية بحقوق الطبع والنشر لتطوير برنامج الدردشة ChatGPT.
أعلنت OpenAI صراحةً عن تدريب نماذج الذكاء الاصطناعي دون استخدام المواد المحمية بحقوق الطبع والنشر أمر “مستحيل”، بحجة أنه يجب على القضاة والمحاكم رفض دعاوى التعويض التي يرفعها أصحاب الحقوق. مرددًا هذا الموقف، اعترف ميتا باستخدام Books3 لكنه نفى أي سوء سلوك متعمد.
اعترفت شركة Meta باستخدام أجزاء من مجموعة بيانات Books3 لكنها قالت إن استخدامها للأعمال المحمية بحقوق الطبع والنشر لتدريب حاملي شهادة الماجستير في القانون لا يتطلب “موافقة أو ائتمانًا أو تعويضًا”. تدحض الشركة ادعاءات انتهاك حقوق الطبع والنشر “المزعومة” للمدعين، معتبرة أن أي نسخ غير مصرح بها من الأعمال المحمية بحقوق الطبع والنشر في Books3 يجب أن تعتبر استخدامًا عادلاً.
علاوة على ذلك، تعارض ميتا صحة الحفاظ على الإجراء القانوني كدعوى جماعية، وترفض تقديم أي “إغاثة” مالية للمؤلفين المقاضين أو غيرهم من المشاركين في جدل Books3. تم استهداف مجموعة البيانات، التي تتضمن مواد محمية بحقوق الطبع والنشر مصدرها موقع القراصنة Bibliotik، في عام 2023 من قبل المجموعة الدنماركية لمكافحة القرصنة رايتس ألاينس، التي تطالب بحظر الأرشفة الرقمية لمجموعة بيانات Books3 وتستخدم إشعارات قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية لفرض عمليات الإزالة هذه.