أنهت منصة التواصل الاجتماعي Reddit عقدًا مميزًا لترخيص المحتوى مع Google. وتبلغ قيمة الصفقة نحو 60 مليون دولار سنويا سوف توفر البحث وعملاق الإعلانات مع بيانات Reddit للتدريب الذكاء الاصطناعي (AI) عارضات ازياء.
حسب مصادر، هذه هي أول اتفاقية رئيسية لـ Reddit لتوفير مجموعة كبيرة من المحتوى الذي أنشأه المستخدمون لمطور الذكاء الاصطناعي.
بالنسبة إلى Reddit، التي تقدم طلبًا لاكتتاب عام أولي (IPO) من شأنه أن يكشف عن مواردها المالية، تُظهر الصفقة الملحمية دفع الشركة لتنويع الإيرادات من خلال ترخيص البيانات.
البحث عن مصادر إيرادات جديدة قبل الاكتتاب العام
ويأتي الاتفاق في الوقت الذي تستعد فيه الشركة للقيام بالاكتتاب العام المرتقب الأوراق العامة في وقت مبكر من هذا الأسبوع. سيعطي التقديم المستثمرين لمحة غير مسبوقة عن الميزانية العمومية لـ Reddit حيث تهدف الشركة البالغة من العمر 16 عامًا إلى طرح أسهمها للاكتتاب العام.
موقع Reddit، الذي تبلغ قيمته آخر مرة 10 مليارات دولار في عام 2021، ينوي لبيع حوالي 10% من أسهمها في الطرح. سيكون الاكتتاب العام أول منصة رئيسية لوسائل التواصل الاجتماعي تصل إلى الأسواق منذ ظهور Pinterest لأول مرة في عام 2019.
بالنسبة لـ Reddit، فإن الإدراج الوشيك للأسهم يتوج سنوات من الترقب والضغوط على الشركة لإظهار نموذج أعمال قابل للتطبيق في وول ستريت.
وعززت الشركة مبادراتها لتنويع الإيرادات، بما في ذلك خطوتها الأخيرة لفرض رسوم على الشركات للوصول إلى البيانات API. والجدير بالذكر أن عمالقة التكنولوجيا مثل جوجل واجهوا ردود فعل عنيفة بسبب حذف مواقع الويب دون إذن للحصول على بيانات تدريب الذكاء الاصطناعي، مما أثار مخاوف بشأن حقوق الطبع والنشر.
تمنح هذه الصفقة Google مجموعة هائلة من بيانات المحادثة التي تغطي كل موضوع يمكن تخيله تقريبًا لتحسين نماذج الذكاء الاصطناعي الخاصة بها.
محتوى المستخدم حول تقدم الذكاء الاصطناعي ورد الفعل العنيف الأخير على عمالقة التكنولوجيا
في الآونة الأخيرة، واجهت OpenAI والداعمة Microsoft مشكلة دعوى قضائية ادعاء الدمج غير المصرح به للكتب الواقعية في مجموعة بيانات ChatGPT، برنامج الدردشة الآلي الخاص به يحظى بشعبية كبيرة.
قاد المؤلفان نيكولاس باسبانيس ونيكولاس غيج الدعوى الجماعية المقترحة، بدعوى انتهاك حقوق الطبع والنشر.
يعكس هذا الجدل قضايا مماثلة رفعها المبدعون ضد مطوري الذكاء الاصطناعي، بما في ذلك دعوى قضائية حديثة واسعة النطاق تستهدف ممارسات جمع البيانات في Google.قدمته شركة كلاركسون للمحاماةوأكدت الشكوى أن جوجل قامت بحذف بيانات المستخدمين دون موافقة لتحسين خدمات الذكاء الاصطناعي مثل مساعد الكتابة Bard.
لقد اعتمد الأمر على سياسة الخصوصية المحدثة لشركة Google، مع الإشارة صراحةً إلى استخراج المعلومات المتاحة للجمهور لتعزيز الذكاء الاصطناعي الخاص بها. على الرغم من تصريح جوجل هذه ليست ممارسة جديدةامتدت الدعوى القضائية لتشمل العروض الجديدة فقط، وسلطت الضوء على القلق المتزايد بشأن استغلال البيانات الشخصية.
كما سلط الضوء على الحاجة إلى مصادر شفافة لبيانات التدريب. من خلال ترخيص محتوى Reddit، تتمتع Google بإمكانية الوصول إلى مجموعة من المحادثات البشرية الواقعية التي يتم تحديثها باستمرار حول المجتمعات المتخصصة التي تغطي الرياضة والصحة والعلوم والأطعمة وتربية الأطفال والمزيد.
يحمل هذا التفاعل في الوقت الفعلي الخاضع للإشراف الذاتي قيمة هائلة لتطوير الذكاء الاصطناعي للغة الطبيعية. منذ تأسيسها عام 2005 على يد ستيف هوفمان وألكسيس أوهانيان، قامت Reddit ببناء قاعدة مستخدمين متفاعلين تقود اتجاه المحادثات الكبيرة والصغيرة. تتراوح المناقشات بانتظام من المرح إلى الشخصية العميقة.
يقدم هذا السجل الرقمي المتطور باستمرار باحثو الذكاء الاصطناعي لا نهاية لهم كمية كبيرة من البيانات اللغوية التي تعكس كيفية تواصل الناس، ومناقشة، وشرح، وإبلاغ بعضهم البعض.
على هذا النحو، فإن الوصول إلى الخطاب اليومي للموقع الذي يشاركه أكثر من 50 مليون مستخدم نشط يوميًا سيحفز التقدم في لغة الذكاء الاصطناعي.