حقق تجريف بيانات OpenAI فوزًا كبيرًا بعد أن رفضت محكمة نيويورك دعوى حقوق الطبع والنشر الخاصة بـ Raw Story

7 نوفمبر 2024 الساعة 7:13 مساءً

الائتمان: VentureBeat مصنوع من Midjourney

“content”>

انضم إلى نشراتنا الإخبارية اليومية والأسبوعية للحصول على آخر التحديثات والمحتوى الحصري حول تغطية الذكاء الاصطناعي الرائدة في الصناعة.”https://venturebeat.com/newsletters/?utm_source=VBsite&utm_medium=desktopNav” نوع البيانات=”link” معرف البيانات=”https://venturebeat.com/newsletters/?utm_source=VBsite&utm_medium=desktopNav”> اعرف المزيد

المنطقة الجنوبية من نيويورك لديها”https://storage.courtlistener.com/recap/gov.uscourts.nysd.616533/gov.uscourts.nysd.616533.117.0.pdf”> مرفوض دعوى انتهاك حقوق النشر التي رفعتها”https://www.rawstory.com/” الهدف=”_blank” rel=”noreferrer noopener”> قصة خام وسائل الإعلام، وشركة و”https://www.alternet.org/”> ألترنيت Media, Inc.، وهي منافذ إخبارية بديلة ذات توجهات يسارية على الإنترنت، ضد OpenAI، مما أدى فعليًا إلى إغلاق الادعاءات القائلة بأن”https://venturebeat.com/category/ai/”> الذكاء الاصطناعي التوليدي انتهكت الشركة حقوق الطبع والنشر باستخدام محتوى إخباري مسروق في بيانات التدريب الخاصة بها.

يمكن اعتبار هذا الرفض بمثابة لحظة مهمة في المعركة المستمرة حول حقوق الطبع والنشر وأدوات الذكاء الاصطناعي – لا سيما بموجب المادة 1202 (ب) من قانون حقوق النشر الرقمية للألفية (DMCA) – ولكن تجدر الإشارة إلى أن قضايا أخرى فشلت أيضًا في إثبات نجاحها. المطالبات بموجب هذا الحكم.

دعونا نتعمق في ما حدث، ولماذا رفض القاضي القضية، وماذا يعني ذلك بالنسبة لمستقبل الذكاء الاصطناعي وحقوق النشر وشرعية شركات التكنولوجيا.”https://venturebeat.com/ai/generative-ai-secret-sauce-data-scraping-under-attack/” الهدف=”_blank” rel=”noreferrer noopener”> كشط المحتوى من الويب دون إذن صريح من المبدعين أو تعويضهم.

فهم القسم 1202(ب) من قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية

تدور الدعوى حول القسم 1202 (ب) من قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية، وهو حكم يهدف إلى حماية “معلومات إدارة حقوق الطبع والنشر” (CMI).

يتضمن ذلك أسماء المؤلفين وعناوينهم وبيانات التعريف الأخرى التي تحدد الأعمال المحمية بحقوق الطبع والنشر. يحظر القسم 1202 (ب) إزالة أو تغيير هذه المعلومات دون تصريح، خاصة إذا كان القيام بذلك يسهل انتهاك حقوق الطبع والنشر.

في هذه الحالة، زعمت Raw Story وAlterNet أن OpenAI استخدمت مقالات من مواقعها الإلكترونية لتدريب ChatGPT ونماذج أخرى دون الحفاظ على CMI، مما ينتهك المادة 1202 (ب).

OpenAI ليست شركة الذكاء الاصطناعي الوحيدة التي من المحتمل أن تكون قد قامت باستخلاص مثل هذه المواد من الويب – في حين يميل مقدمو نماذج الذكاء الاصطناعي إلى حماية مجموعات بيانات التدريب الخاصة بهم عن كثب، فإن الصناعة بشكل عام قامت بلا شك باستخلاص مساحات كبيرة من الويب لتدريب نماذجها المختلفة (وهي ممارسة مشابهة إلى ما فعلته Google للزحف إلى نتائج البحث وفهرستها في منتج محرك البحث الرئيسي الخاص بها). بهذه الطريقة، يرى بعض المبدعين أن عملية استخراج البيانات هي بمثابة “الخطيئة الأصلية” للذكاء الاصطناعي.

في هذه القضية، ادعى المدعيان Raw Story وAlternet أن مخرجات الذكاء الاصطناعي الخاصة بـ OpenAI – الاستجابات التي تولدها النماذج – كانت تعتمد أحيانًا على مقالاتهم وأن الشركة انتهكت حقوق الطبع والنشر عن عمد بعد إزالة CMI.

لماذا رفضت المحكمة ادعاءات Raw Story

وافقت القاضية كولين مكماهون على طلب OpenAI برفض القضية على أساس عدم أهليتها. وعلى وجه التحديد، وجد القاضي أن المدعين لم يتمكنوا من إثبات تعرضهم لضرر ملموس وفعلي من تصرفات OpenAI، وهو مطلب أساسي بموجب المادة الثالثة من دستور الولايات المتحدة لبدء أي دعوى قضائية.

كما نظر القاضي مكماهون أيضًا في المشهد المتطور لواجهات نماذج اللغة الكبيرة (LLM)، مشيرًا إلى أن تحديثات هذه الأنظمة تزيد من تعقيد عملية الإسناد والتتبع. وشددت على أن التحسينات المتكررة للذكاء الاصطناعي التوليدي تجعل من غير المرجح إعادة إنتاج المحتوى حرفيًا، مما يجعل ادعاءات المدعين أكثر تخمينًا.

وأشار القاضي إلى أن “احتمال قيام ChatGPT بإخراج محتوى مسروق من إحدى مقالات المدعين يبدو بعيدًا”. ويعكس هذا صعوبة رئيسية في هذه الأنواع من الحالات: فالذكاء الاصطناعي التوليدي مصمم لتجميع المعلومات بدلاً من تكرارها حرفياً. فشل المدعون في تقديم أدلة مقنعة على أن أعمالهم المحددة قد تم انتهاكها بشكل مباشر بطريقة أدت إلى ضرر يمكن تحديده.

يتماشى الحكم مع قضايا مماثلة حيث كافحت المحاكم لتطبيق قانون حقوق الطبع والنشر التقليدي على الذكاء الاصطناعي التوليدي. على سبيل المثال، قضية Doe 1 v. GitHub التي تتضمن مساعد الطيار من Microsoft”https://www.law360.com/articles/1855576/github-openai-get-developers-copyright-claim-tossed”> كما تم التعامل معها المطالبات بموجب القسم 1202 (ب). هناك، وجدت المحكمة أن الكود الذي تم إنشاؤه بواسطة Copilot لم يكن “نسخة متطابقة” من النص الأصلي، بل مقتطفات تم إعادة تكوينها، مما يجعل من الصعب إثبات انتهاك متطلبات CMI.

انقسام متزايد حول القسم 1202 (ب)

يسلط قرار Raw Story الضوء على الشكوك الأوسع التي تواجهها المحاكم فيما يتعلق بالقسم 1202 (ب)، خاصة فيما يتعلق بالذكاء الاصطناعي التوليدي.

لا يوجد حاليًا إجماع ثابت حول كيفية تطبيق القسم 1202(ب) على مجموعة واسعة من المحتوى عبر الإنترنت. في إحدى الزوايا، فرضت بعض المحاكم ما يسمى بشرط “الهوية” – مما يعني أنه يجب على المدعين إثبات أن الأعمال المخالفة هي نسخة طبق الأصل من المحتوى الأصلي، مطروحًا منها CMI. لكن آخرين سمحوا بتفسيرات أكثر مرونة.

على سبيل المثال، رفضت المحكمة في المنطقة الجنوبية من ولاية تكساس مؤخرًا شرط التطابق، مشيرة إلى أنه حتى النسخ الجزئية يمكن أن تعتبر انتهاكًا إذا تمت إزالة CMI عمدًا.

وفي الوقت نفسه، في الدعوى التي رفعتها سارة سيلفرمان ومجموعة من المؤلفين، رأت المحكمة أن المدعية”https://venturebeat.com/ai/judge-dismisses-most-of-sarah-silvermans-copyright-infringement-lawsuit-against-openai/”> فشل في العرض أدلة كافية على أن OpenAI قامت بإزالة CMI بشكل فعال من محتواها. هذا الحكم، مثله مثل حكم Raw Story، يسلط الضوء على عبء الأدلة الذي يواجهه المدعين.

كما أوضحت ماريا كروسي”https://www.authorsalliance.org/2024/10/30/copyright-management-information-1202b-and-ai/”> في قطعة بالنسبة لتحالف المؤلفين، “إن الارتفاع في مطالبات §1202(ب) يثير أسئلة صعبة، وهي: كيف تنطبق §1202(b) على استخدام عمل محمي بحقوق الطبع والنشر كجزء من مجموعة بيانات يجب تنظيفها وإعادة هيكلتها ومعالجتها بطرق تفصل معلومات إدارة حقوق الطبع والنشر عن المحتوى نفسه؟”

لماذا يهم هذا الحكم الذكاء الاصطناعي ومنشئي المحتوى؟

يعد رفض الدعوى القضائية التي رفعتها Raw Story أكثر من مجرد فوز لـ OpenAI، فهو مؤشر على كيفية تعامل المحاكم مع مطالبات حقوق الطبع والنشر المماثلة في المشهد سريع التطور للذكاء الاصطناعي التوليدي. مع OpenAI ومستثمرها Microsoft تدافع حاليًا ضد دعوى قضائية مماثلة مرفوعة من قبل نيويورك تايمز، لا يمكن للحكم إلا أن يساعد في إنشاء بعض السوابق لرفض هذه المطالبات والمطالبات المستقبلية.

في الواقع، يشير الحكم إلى أنه بدون ضرر واضح يمكن إثباته أو استنساخ دقيق، قد يتم تحدي المدعين للحصول على يومهم في المحكمة.

يتطرق حكم القاضي مكماهون أيضًا إلى نقطة أوسع حول كيفية تجميع الذكاء الاصطناعي للبيانات مقابل تكرارها مباشرة. لا يسترجع ChatGPT الخاص بـ OpenAI المقالات مباشرة من Raw Story، بل يستخدم بدلاً من ذلك بيانات التدريب لإنتاج مخرجات جديدة تشبه الكتابة البشرية. وهذا يجعل إثبات الانتهاكات بموجب قوانين حقوق النشر الحالية أمرًا صعبًا بطبيعته.

بالنسبة لمنشئي المحتوى، يثير هذا تحديًا كبيرًا: كيفية ضمان الائتمان المناسب ومنع الاستخدام غير المصرح به لعملهم في مجموعات بيانات التدريب. اتفاقيات الترخيص مثل تلك التي أبرمتها OpenAI”https://venturebeat.com/ai/openai-strikes-content-deal-conde-nast-future-of-publishing/”> ناشري الأخبار الكبار مثل مجلة فوج و سلكي مالك كوندي ناست يمكن أن يصبح معيارًا جديدًا، مما يمنح الشركات طريقة لاستخدام المحتوى المحمي بحقوق الطبع والنشر بشكل قانوني مع تعويض منشئيه.

بين الروبوت والمكان الصعب

لا تزال المحاكم تتوصل إلى كيفية التعامل مع الذكاء الاصطناعي التوليدي، وتشير الأحكام الأخيرة إلى أنها مترددة في تمديد إجراءات الحماية بموجب المادة 1202 (ب) ما لم يُظهر المدعين ضررًا حقيقيًا ومحددًا. يتم تجميع المحتوى الناتج عن الذكاء الاصطناعي بدلاً من تكراره، مما يجعل من الصعب إثبات انتهاكات حقوق الطبع والنشر.

بالنسبة للمدعين، هذا يعني إثبات أن الضرر هو معركة شاقة. تشير المحاكم إلى أن المطالبات الغامضة ليست كافية، حيث يحتاج المدعون إلى أدلة دامغة على الضرر. بالنسبة للمطورين وشركات التكنولوجيا، حتى لو بدت الاحتمالات مواتية، فلا أحد يريد رفع دعوى قضائية. تعد الشفافية وسجلات البيانات والامتثال ضرورية لتجنب المشاكل القانونية.

أشارت القاضية مكماهون إلى أنه يمكن إعادة النظر في القضية (كتبت: “مع شرح لماذا لن يكون التعديل المقترح عديم الجدوى”، ولكن لا تزال هناك عقبات كبيرة.

VB ديلي

ابق على اطلاع! احصل على آخر الأخبار في صندوق الوارد الخاص بك يوميا

بالاشتراك فإنك توافق على VentureBeat”http://venturebeat.com/terms-of-service/”> شروط الخدمة.

شكرا للاشتراك. تحقق من المزيد”http://venturebeat.com/newsletters/”> النشرات الإخبارية VB هنا.

حدث خطأ.

اقرأ المزيد