قامت OpenAI وGoogle بتدريب نماذج الذكاء الاصطناعي الخاصة بهما على النص المكتوب من مقاطع فيديو YouTube، مما قد ينتهك حقوق الطبع والنشر لمنشئي المحتوى، وفقًا لـ اوقات نيويورك. التقرير، الذي يصف الجهود التي بذلتها شركات OpenAI وGoogle وMeta من أجل تعظيم كمية البيانات التي يمكنهم تغذيتها لأنظمة الذكاء الاصطناعي الخاصة بهم، يستشهد بالعديد من الأشخاص الذين لديهم معرفة بممارسات الشركات. يأتي ذلك بعد أيام فقط من تصريح الرئيس التنفيذي لموقع YouTube، نيل موهان، في مقابلة مع بلومبرج أصول أن استخدام OpenAI المزعوم لمقاطع فيديو YouTube لتدريب مولده الجديد لتحويل النص إلى فيديو، Sora، سوف يتعارض مع سياسات المنصة.
بحسب ال نيويورك تايمز، استخدمت OpenAI أداة Whisper للتعرف على الكلام لنسخ أكثر من مليون ساعة من مقاطع فيديو YouTube، والتي تم استخدامها بعد ذلك لتدريب GPT-4. المعلومات ذكرت سابقًا أن OpenAI استخدمت مقاطع فيديو وبودكاست على YouTube لتدريب نظامي الذكاء الاصطناعي. وبحسب ما ورد كان رئيس OpenAI جريج بروكمان من بين الأشخاص في هذا الفريق. وقال مات براينت، المتحدث باسم جوجل، إنه وفقًا لقواعد جوجل، لا يُسمح بـ “القصاص أو التنزيل غير المصرح به لمحتوى يوتيوب”. نيويورك تايمزقائلًا أيضًا إن الشركة لم تكن على علم بأي استخدام من هذا القبيل بواسطة OpenAI.
ومع ذلك، يزعم التقرير أن هناك أشخاصًا في Google كانوا يعرفون ولكنهم لم يتخذوا أي إجراء ضد OpenAI لأن Google كانت تستخدم مقاطع فيديو YouTube لتدريب نماذج الذكاء الاصطناعي الخاصة بها. قال جوجل نيويورك تايمز إنه يفعل ذلك فقط مع مقاطع الفيديو من منشئي المحتوى الذين وافقوا على ذلك. تواصلت Engadget مع Google وOpenAI للتعليق.
ال نيويورك تايمز يزعم التقرير أيضًا أن جوجل طلبت من فريق تعديل سياسة الخصوصية الخاصة بها في يونيو 2023 لتغطية استخدامها للمحتوى المتاح للجمهور على نطاق أوسع، بما في ذلك مستندات جوجل وجداول بيانات جوجل، لتدريب نماذج ومنتجات الذكاء الاصطناعي الخاصة بها. وتم نشر التغييرات، التي تقول جوجل إنها تم إجراؤها من أجل الوضوح، في يوليو/تموز. قال براينت نيويورك تايمز وأن هذا النوع من البيانات لا يُستخدم إلا بإذن المستخدمين الذين اشتركوا في اختبارات الميزات التجريبية لجوجل، وأن الشركة “لم تبدأ التدريب على أنواع إضافية من البيانات بناءً على هذا التغيير في اللغة”. أضاف التغيير Bard كمثال على ما يمكن استخدام هذه البيانات من أجله.
تصحيح، 6 أبريل 2024، الساعة 3:45 مساءً بالتوقيت الشرقي: ذكرت هذه القصة في الأصل أن Google قامت بتحديث سياسة الخصوصية الخاصة بها في يونيو 2022. وتم إجراء تحديث السياسة بالفعل في عام 2023. نعتذر عن الخطأ.