الائتمان: بريماكوف / شاترستوك
إذا كنت تدير موقع ويب WordPress أو لديك مدونة على Tumblr، فمن المحتمل أنك قد أنتجت ونشرت قدرًا كبيرًا من المحتوى هناك. على الرغم من أننا نعلم جميعًا أن الإنترنت ليس “خاصًا”، فمن المحتمل أنك نشرت تلك النصوص والصور معتقدًا أنها ملكك، ولن تتم سرقتها من قبل الشركات نفسها التي اعتمدت عليها لاستضافتها.
وفي الواقع، يستعد WordPress وTumblr للقيام بذلك. كما ذكرت لأول مرة من قبل 404 وسائل الإعلاموقد أبرمت الشركة الأم لكلا الموقعين، Automattic، صفقة لبيع بيانات المستخدم من Tumblr وWordPress إلى شركات الذكاء الاصطناعي مثل Midjourney وOpenAI. تنوي شركات الذكاء الاصطناعي استخدام البيانات لتدريب أنظمتها.
وكأن ذلك لم يكن سيئًا بما فيه الكفاية، فقد سارت الاستعدادات للبيع بشكل سيئ، ويبدو أن فئات كبيرة من منشورات Tumblr التي لم يكن من المفترض بيعها قد تمت إضافتها إلى المزيج على أي حال. تتضمن تلك البيانات ما يلي:
-
مشاركات خاصة من الحسابات العامة
-
المشاركات على الحسابات المحذوفة أو المعلقة
-
يسأل دون إجابة
-
إجابات خاصة
-
مشاركات صريحة
-
منشورات من حسابات الشركاء، مثل الحملات الإعلانية التي لا يمتلك Tumblr الحقوق فيها. (تم تسمية شركة Apple هنا على وجه التحديد.)
من المحتمل أن هذه البيانات لم يتم إرسالها فعليًا إلى OpenAI وMidjourney، وقد تم تحديدها ومسحها لهذا الاستخدام. ومع ذلك، لم تتمكن 404 Media من تأكيد ذلك. ومع ذلك، يمكنهم التأكيد على أن المشاركات المحمية بكلمة مرور والرسائل المباشرة والوسائط التي تم تحديدها على أنها CSAM لم تكن موجودة في المجموعة. لذلك … هذا جيد.
قد لا تكون جميع مواقع WordPress
التلقائي يحدد ذلك فقط وردبرس.كوم تتأثر المواقع بعملية استخراج البيانات هذه، على عكس المحتوى الذي تم إنشاؤه على نظام WordPress CMS الذي قد تستخدمه مع موقع مستضاف في مكان آخر. من الناحية النظرية، مواقع WordPress CMS الخاصة بك لا يجب أن تكون المستضافة مع Automattic في مأمن من هذه الإجراءات.
ومع ذلك، لم تتمكن 404 Media من تأكيد ما إذا كان استخدام المكونات الإضافية التلقائية مثل JetPack سيؤدي إلى إدخال موقع مستضاف ذاتيًا في سياسات مشاركة البيانات الرديئة الخاصة بـ Automattic.
لا يلزمك أن تكون موافقًا على بيع بياناتك تلقائيًا
يخبر أحد المصادر 404 Media أن Automattic ستضيف إعدادًا جديدًا لخصائصها يوم الأربعاء للسماح للمستخدمين بإلغاء الاشتراك في بيع البيانات ومشاركتها مع شركات خارجية. تلقى المنفذ نسخة من قسم الأسئلة الشائعة الجديد، والذي يوضح بالتفصيل أن خيار إلغاء الاشتراك هذا سيمنع برامج الزحف من الوصول إلى مواقعك إذا قمت بتمكينه “من البداية”. إذا اخترت إلغاء الاشتراك لاحقًا، فسوف يتصل Automattic بالشركاء و”يطلب منهم” إزالة المحتوى الخاص بك من مجموعات البيانات والتدريب الخاصة بهم.
وهذه الصياغة ليست مشجعة بشكل خاص. ومع ذلك، كلما تلقائي يفعل أطلق خيار إلغاء الاشتراك هذا، وأقترح عليك استخدامه على مواقع Tumblr وWordPress الخاصة بك على أي حال.
بعد قطعة الوسائط 404، تلقائي نشرت بيانا قائلًا إنها تحظر برامج زحف منصات الذكاء الاصطناعي الرئيسية، وتقوم بتحديث قوائمها لإضافة قوائم جديدة؛ يحتوي على ميزات لمنع محركات البحث من فهرسة مواقعك، مما قد يؤدي أيضًا إلى تثبيط زحف الذكاء الاصطناعي؛ وأنهم يشاركون فقط المحتوى العام المستضاف على WordPress وTumblr من المواقع التي لم تختر إلغاء الاشتراك. ومع ذلك، فإنهم يعترفون بعدم وجود قوانين تمنع برامج الزحف من الالتزام بهذه التفضيلات، وأنهم يعملون مع بعض شركات الذكاء الاصطناعي، “طالما أن خططهم تتوافق مع ما يهتم به مجتمعنا: الإسناد، وإلغاء الاشتراك، والتحكم. “
ماذا ستفعل شركات الذكاء الاصطناعي بهذه البيانات؟
تتطلب شركات مثل Midjourney وOpenAI ضخم مجموعات البيانات لتدريب أنظمة الذكاء الاصطناعي الخاصة بهم. لن تكون برامج مثل Midjourney وChatGPT ممكنة دون دفع كميات هائلة من المعلومات في طريقها: إنها الطريقة التي “يتعلمون بها” كيفية القيام بالأشياء التي يقومون بها.
لذلك يمكن تغذية منشورات مدونة WordPress الخاصة بك المليئة بالوصفات المفضلة لديك إلى نماذج الذكاء الاصطناعي التوليدية لتدريبهم على كيفية “التحدث” عن الطعام (أو أي شيء على الإطلاق)؛ يمكن لمقالب الصور الخاصة بك على Tumblr تدريب العارضات على كيفية التعرف على موضوعات مثل السيارة أو الطائر. إن البيانات الواردة من جميع مواقعك، بالإضافة إلى مواقع الملايين من المستخدمين، لا تقدر بثمن بالنسبة لشركات الذكاء الاصطناعي، مما يعني أنها لأقصى حد ذات قيمة للشركات التي تمتلك تلك المواقع، ويمكن بيعها. من المرجح أن تجني شركة Automattic الكثير من المال من هذه الصفقة، تمامًا كما من المحتمل أن يجني Reddit الكثير من المال في صفقة ترخيص محتوى الذكاء الاصطناعي الخاصة بها مع Google.
من الممتع النشر والمشاركة على الإنترنت، ولكن قد يكون الوقت قد حان لاستعادة ما تملكه: إذا لم تكن تمتلك المنصة التي تشارك أفكارك الأصلية عليها، ففكر في نقلها إلى منصة تمتلكها، قبل تصبح أفكارك عجلات تدريب للذكاء الاصطناعي.
جيك بيترسون
محرر التكنولوجيا العليا
جيك بيترسون هو محرر التكنولوجيا الأول في Lifehacker. حصل على بكالوريوس الفنون الجميلة في السينما والتلفزيون من جامعة نيويورك، حيث تخصص في الكتابة. يساعد جيك الأشخاص في استخدام التكنولوجيا بشكل احترافي منذ عام 2016، حيث بدأ كمتخصص تقني في متجر 5th Avenue Apple Store في نيويورك، ثم ككاتب في موقع Gadget Hacks. وفي ذلك الوقت، قام بكتابة وتحرير آلاف الأخبار والمقالات الإرشادية حول أجهزة iPhone وAndroid، بما في ذلك التقارير عن العروض التوضيحية المباشرة من عمليات إطلاق المنتجات من Samsung وGoogle. في عام 2021، انتقل إلى Lifehacker ويغطي كل شيء بدءًا من أفضل استخدامات الذكاء الاصطناعي في حياتك اليومية ل أي ماك بوك للشراء. يغطي فريقه كل ما يتعلق بالتكنولوجيا، بما في ذلك الهواتف الذكية وأجهزة الكمبيوتر ووحدات التحكم في الألعاب والاشتراكات. يعيش في ولاية كونيتيكت.