ترفع صحيفة نيويورك تايمز دعوى قضائية ضد شركة OpenAI ومعاونها الوثيق (والمستثمر)، شركة مايكروسوفت، بدعوى انتهاك قانون حقوق الطبع والنشر من خلال تدريب نماذج الذكاء الاصطناعي التوليدية على محتوى التايمز.
في ال دعوى قضائية، المرفوعة أمام المحكمة الفيدرالية في مانهاتن، تزعم صحيفة التايمز أن الملايين من مقالاتها تم استخدامها لتدريب نماذج الذكاء الاصطناعي، بما في ذلك تلك التي تدعم تقنية OpenAI التي تحظى بشعبية كبيرة. ChatGPT ومايكروسوفت مساعد طيار، دون موافقتها. وتدعو التايمز OpenAI وMicrosoft إلى “تدمير” النماذج وبيانات التدريب التي تحتوي على المواد المخالفة وتحمل المسؤولية عن “مليارات الدولارات من الأضرار القانونية والفعلية” المتعلقة بـ “النسخ والاستخدام غير القانوني لأعمال التايمز ذات القيمة الفريدة”. “.
وجاء في شكوى التايمز: “إذا لم تتمكن التايمز وغيرها من المؤسسات الإخبارية من إنتاج صحافتها المستقلة وحمايتها، فسيكون هناك فراغ لا يمكن لأي كمبيوتر أو ذكاء اصطناعي أن يملأه”. “سيتم إنتاج صحافة أقل، وستكون التكلفة التي يتحملها المجتمع هائلة”.
وفي بيان عبر البريد الإلكتروني، قال متحدث باسم OpenAI: “نحن نحترم حقوق منشئي المحتوى ومالكيه ونلتزم بالعمل معهم لضمان استفادتهم من تكنولوجيا الذكاء الاصطناعي ونماذج الإيرادات الجديدة. لقد كانت محادثاتنا الجارية مع صحيفة نيويورك تايمز مثمرة وتمضي قدما بشكل بناء، لذلك نحن مندهشون وخيبة الأمل إزاء هذا التطور. ونأمل أن نجد طريقة مفيدة للطرفين للعمل معًا، كما نفعل مع العديد من الناشرين الآخرين.
نماذج الذكاء الاصطناعي التوليدية “تتعلم” من الأمثلة إلى المقالات الحرفية والأكواد ورسائل البريد الإلكتروني والمقالات والمزيد، ويبحث البائعون مثل OpenAI عن الويب بحثًا عن ملايين إلى مليارات من هذه الأمثلة لإضافتها إلى مجموعات التدريب الخاصة بهم. بعض الأمثلة موجودة في المجال العام. والبعض الآخر ليس كذلك، أو يخضع لتراخيص مقيدة تتطلب الاستشهاد أو أشكالًا محددة من التعويض.
يجادل الباعة مبدأ الاستخدام العادل يوفر حماية شاملة لممارسات تجريف الويب الخاصة بهم. أصحاب حقوق الطبع والنشر يختلفون؛ مئات من المؤسسات الإخبارية تستخدم الآن تعليمات برمجية لمنع OpenAI وGoogle وغيرهما من مسح مواقعهم الإلكترونية بحثًا عن بيانات التدريب.
أدى الصراع بين البائع ومنافذ البيع إلى عدد متزايد من المعارك القانونية، وآخرها معركة التايمز.
انضمت الممثلة سارة سيلفرمان إلى دعويين قضائيتين في يوليو/تموز تتهمان Meta وOpenAI بـ “ابتلاع” مذكرات سيلفرمان لتدريب نماذج الذكاء الاصطناعي الخاصة بهما. وفي دعوى منفصلة، ادعى آلاف الروائيين، بما في ذلك جوناثان فرانزين وجون غريشام، أن شركة OpenAI حصلت على عملهم كبيانات تدريبية دون إذنهم أو علمهم. وقد انتهت قضية العديد من المبرمجين ضد Microsoft وOpenAI وGitHub مساعد طيار، وهي أداة لتوليد التعليمات البرمجية تعمل بالذكاء الاصطناعي، والتي يقول المدعون إنها تم تطويرها باستخدام التعليمات البرمجية المحمية ببروتوكول IP الخاص بهم.
على الرغم من أن صحيفة التايمز ليست أول من رفع دعوى قضائية ضد بائعي الذكاء الاصطناعي بسبب انتهاكات مزعومة للملكية الفكرية تتضمن أعمالًا مكتوبة، إلا أنها أكبر ناشر متورط في مثل هذه الدعوى حتى الآن – وواحدة من أوائل الناشرين الذين سلطوا الضوء على الضرر المحتمل لعلامتهم التجارية من خلال “الهلوسة”. أو حقائق مختلقة من نماذج الذكاء الاصطناعي التوليدية.
تشير شكوى التايمز إلى العديد من الحالات التي قدم فيها برنامج Bing Chat من Microsoft (المعروف الآن باسم Copilot)، والذي يدعمه نموذج OpenAI، معلومات غير صحيحة قيل أنها جاءت من The Times – بما في ذلك نتائج “أكثر 15 نوعًا من الأطعمة الصحية للقلب”. “، 12 منها لم يتم ذكرها في أي مقال في صحيفة التايمز.
تشير التايمز أيضًا إلى أن OpenAI وMicrosoft يعملان بشكل فعال على بناء منافسين لناشري الأخبار باستخدام أعمال التايمز، مما يضر بأعمال التايمز من خلال توفير معلومات لا يمكن الوصول إليها عادةً بدون اشتراك – وهي معلومات لا يتم الاستشهاد بها دائمًا ، أحيانا تحقيق الدخل علاوة على ذلك، تم تجريدها من الروابط التابعة التي تستخدمها صحيفة التايمز لتوليد العمولات.
وكما تشير شكوى التايمز، فإن نماذج الذكاء الاصطناعي التوليدية تميل إلى اجترار بيانات التدريب، على سبيل المثال، إعادة إنتاج نتائج حرفية تقريبًا من المقالات. وبعيدًا عن القلس، فقد حدث ذلك في OpenAI في مناسبة واحدة على الأقل دون قصد تمكين مستخدمي ChatGPT من التجول في المحتوى الإخباري المحمي بنظام حظر الاشتراك غير المدفوع.
تقول الشكوى: “يسعى المدعى عليهم إلى الاستفادة مجانًا من استثمار التايمز الضخم في صحافتها”، متهمة OpenAI وMicrosoft “باستخدام محتوى التايمز دون مقابل لإنشاء منتجات تحل محل التايمز وتسرق الجماهير منها”.
تقع التأثيرات على أعمال الاشتراك في الأخبار – وحركة مرور الويب للناشر – في قلب دعوى مماثلة بشكل عرضي رفعها الناشرون في وقت سابق من الشهر ضد Google. في هذه القضية، جادل المدعى عليهم، مثل صحيفة التايمز، بتجارب Google GenAI، بما في ذلك الذكاء الاصطناعي بارد روبوت الدردشة و بحث عن الخبرة التوليدية، وسحب محتوى الناشرين والقراء وعائدات الإعلانات من خلال وسائل مانعة للمنافسة.
هناك مصداقية لتأكيدات الناشرين. نموذج حديث من المحيط الأطلسي وجد أنه إذا قام محرك بحث مثل Google بدمج الذكاء الاصطناعي في البحث، فسوف يجيب على استفسار المستخدم بنسبة 75٪ من الوقت دون الحاجة إلى النقر للوصول إلى موقعه على الويب. يقدر الناشرون في دعوى Google أنهم سيخسرون ما يصل إلى 40% من حركة المرور الخاصة بهم.
هذا لا يعني أنهم سينجحون في المحكمة. وقارنت هيذر ميكر، الشريك المؤسس في OSS Capital والمستشارة في شؤون الملكية الفكرية بما في ذلك ترتيبات الترخيص، مثال صحيفة التايمز عن القلس بـ “استخدام معالج النصوص للقص واللصق”.
وقال ميكر لـ TechCrunch عبر البريد الإلكتروني: “في الشكوى، تقدم صحيفة نيويورك تايمز مثالاً لجلسة ChatGPT حول مراجعة مطعم عام 2012”. “السؤال المطروح لـ ChatGPT هو “ما هي الفقرات الافتتاحية لمراجعته؟” ثم تطلب المطالبات التالية بشكل متكرر “الجملة التالية”. إن استفزاز روبوت الدردشة لإعادة إنتاج المدخلات ليس أساسًا معقولًا لانتهاك حقوق الطبع والنشر… إذا قام المستخدم عن قصد بنسخ برنامج الدردشة الآلي، فهذا خطأ المستخدم. ولهذا السبب معظم [lawsuits like this] من المحتمل أن تفشل.”
وبدلاً من محاربة بائعي الذكاء الاصطناعي في المحكمة، اختارت بعض وسائل الإعلام توقيع اتفاقيات ترخيص معهم. وكالة أسوشيتد برس أصابت كما فعلت صفقة مماثلة في يوليو/تموز مع شركة OpenAI، وأكسيل سبرينغر، الناشر الألماني الذي يمتلك Politico وBusiness Insider. هذا الشهر.
وتقول صحيفة The Times في شكواها إنها حاولت التوصل إلى ترتيب ترخيص مع Microsoft وOpenAI في أبريل، لكن المحادثات لم تكن مثمرة في النهاية.
تم التحديث الساعة 4:24 بالتوقيت الشرقي مع سياق إضافي وتعليق من OpenAI.