تحتفل TechSpot بالذكرى السنوية الخامسة والعشرين لتأسيسها. TechSpot يعني التحليل الفني والمشورة يمكنك الوثوق.
ماذا حدث للتو؟ لقد اتخذ الجدل الدائر حول الانتهاكات المحتملة لحقوق الطبع والنشر المتعلقة ببيانات تدريب نماذج اللغات الكبيرة منعطفًا كبيرًا. رفعت صحيفة نيويورك تايمز دعوى قضائية ضد شركتي OpenAI وMicrosoft لاستخدام ملايين من مقالاتها لتدريب أنظمتهما دون إذن أو تعويض.
ليس سرًا أن LLMs تستخدم مجموعات كبيرة من المعلومات من الإنترنت كبيانات تدريب، لكن صحيفة نيويورك تايمز تدعي في دعوى انتهاك حقوق الطبع والنشر التي رفعتها أن محتواها قد تم “تركيزه بشكل خاص”. وتزعم الدعوى المرفوعة في محكمة مانهاتن الفيدرالية أن الشركات “تسعى للاستفادة مجانًا من استثمارات التايمز الهائلة في صحافتها من خلال استخدامها لبناء منتجات بديلة دون إذن أو دفع”.
تنص الدعوى على أن الملايين من المقالات الإخبارية المحمية بحقوق الطبع والنشر في صحيفة التايمز، والتحقيقات المتعمقة، ومقالات الرأي، والمراجعات، والأدلة الإرشادية، والمزيد تم استخدامها لتدريب روبوتات الدردشة، التي تتنافس الآن مع منفذ الأخبار كمصدر للمعلومات. .
تسلط الدعوى الضوء أيضًا على المعلومات التي قدمها Bing والتي أخطأت في تعريف محتوى المنشور. وتضمنت “أكثر 15 نوعًا من الأطعمة الصحية للقلب”، ولم يتم ذكر اثني عشر منها في قصة التايمز. ادعاء آخر هو أن المحتوى الذي تم إنشاؤه هو مقتطفات حرفية من مقالات نيويورك تايمز، مما يعني أن المنشور يفقد المشاهدين ويدفع العملاء لأمثال ChatGPT.
وتقول الدعوى إن المدعى عليهم يجب أن يتحملوا مسؤولية “مليارات الدولارات من الأضرار القانونية والفعلية”. كما يطلب من الشركات تدمير أي نماذج لروبوتات الدردشة وبيانات التدريب التي تستخدم مواد محمية بحقوق الطبع والنشر من The Times. تعتقد OpenAI أن استخدامها لمحتوى صحيفة نيويورك تايمز يقع ضمن “الاستخدام العادل” لأنه يخدم غرضًا “تحويليًا” جديدًا.
تقضي البدلة أيضًا وقتًا طويلاً في عرض كيفية العثور على محتواها في مجموعات البيانات العامة، مثل WebText2، كما يتم ترجيحها بشكل كبير هناك بسبب جودتها الملموسة. pic.twitter.com/fO8iE8yAtN
– ماثيو بيرمان (@ ماثيو بيرمان) 28 ديسمبر 2023
كان ذكرت في أغسطس الماضي، كانت التايمز تجري “مفاوضات متوترة” حول التوصل إلى اتفاق ترخيص مع OpenAI وMicrosoft من شأنه أن يسمح للأولى بتدريب نموذج GPT بشكل قانوني على المواد التي نشرتها التايمز، وهو أمر قررت الصحيفة حظره سابقًا. لكن المحادثات انهارت، مما أدى إلى رفع الدعوى القضائية الحالية. لدى OpenAI بالفعل اتفاقية مع رويترز لاستخدام محتواها لأغراض التدريب.
تصدرت عملية تجريف البيانات العديد من العناوين الرئيسية هذا العام. هدد إيلون ماسك بذلك مقاضاة مايكروسوفت في أبريل/نيسان الماضي بسبب ادعاء بأنها كانت تستخدم بيانات تويتر (كما كانت في ذلك الوقت) بشكل غير قانوني لتدريب نماذج الذكاء الاصطناعي. في أبريل، وقع أكثر من 8000 مؤلف، بما في ذلك شخصيات بارزة مثل جيمس باترسون، ومارغريت أتوود، وجوناثان فرانزين رسالة مفتوحة مطالبة القادة من أكبر ست شركات في مجال الذكاء الاصطناعي بعدم استخدام عملهم في نماذج التدريب دون الحصول أولاً على الموافقة وتقديم التعويض. على الرغم من هذا الالتماس، فقد تم رفع دعوى قضائية ضد OpenAI من قبل المؤلفين في عدة مناسبات بسبب انتهاك حقوق الطبع والنشر.
في دعوى قضائية منفصلة ولكن مماثلة، أطلق الفنانون حملة دعوى حقوق النشر ضد المولدات الفنية العاملة بالذكاء الاصطناعي Stable Diffusion وMidjourney في يناير.