من فضلك تسجيل الدخول أو تسجيل لتفعل ذلك.

لقد تركت ثورة روبوتات الدردشة عالمنا غارقًا في النصوص التي تم إنشاؤها بواسطة الذكاء الاصطناعي: لقد تسللت إلى خلاصات الأخبار وأوراق الفصل الدراسي وصناديق البريد الوارد لدينا. إنها وفيرة بشكل سخيف لدرجة أن الصناعات ظهرت لتوفير التحركات والتحركات المضادة. بعض الشركات تقدم خدمات ل”https://zapier.com/blog/ai-content-detector/” الهدف=”_blank”> تحديد النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي من خلال تحليل المادة، بينما يقول آخرون إن أدواتهم سوف “”https://www.humanizeai.pro/” الهدف=”_blank”> أنسنة” النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي واجعله غير قابل للاكتشاف. كلا النوعين من الأدوات لهما”https://www.trails.umd.edu/news/detecting-ai-may-be-impossible-thats-a-big-problem-for-teachers” الهدف=”_blank”> أداء مشكوك فيهومع تحسن روبوتات الدردشة، سيصبح من الصعب معرفة ما إذا كانت الكلمات قد تم تجميعها معًا بواسطة إنسان أو خوارزمية.

إليك طريقة أخرى: إضافة نوع من العلامة المائية أو بيانات اعتماد المحتوى إلى النص من البداية، مما يتيح للأشخاص التحقق بسهولة مما إذا كان النص قد تم إنشاؤه بواسطة الذكاء الاصطناعي. جديد”https://www.nature.com/articles/s41586-024-08025-4″ الهدف=”_blank”>البحث من”https://spectrum.ieee.org/tag/google”>جوجل DeepMind، الموصوفة اليوم في المجلة طبيعة، يقدم طريقة للقيام بذلك. ويقول النظام، المسمى SynthID-Text، إنه لا يؤثر على “جودة النص أو دقته أو إبداعه أو سرعته”.”https://www.linkedin.com/in/pushmeet-kohli-4838994/” rel=”noopener noreferrer” الهدف=”_blank”> بوشميت كوهلي، نائب رئيس الأبحاث في Google DeepMind ومؤلف مشارك في هذه الورقة. لكن الباحثين يعترفون بأن نظامهم أبعد ما يكون عن أن يكون مضمونًا، وليس متاحًا للجميع بعد، فهو مجرد عرض توضيحي أكثر من كونه حلاً قابلاً للتطوير.

قامت Google بالفعل بدمج نظام العلامات المائية الجديد هذا في نظامها”https://gemini.google.com/” الهدف=”_blank”> الجوزاء أعلنت شركة chatbot اليوم. كما أنها مفتوحة المصدر للأداة و”https://ai.google.dev/responsible” الهدف=”_blank”> جعلها متاحة للمطورين والشركات، مما يسمح لهم باستخدام الأداة لتحديد ما إذا كانت مخرجات النص قد جاءت من تلقاء أنفسهم”https://spectrum.ieee.org/tag/large-language-models”> نماذج لغة كبيرة (“https://spectrum.ieee.org/tag/llms” الهدف=”_blank”> ماجستير في القانون)، أنظمة الذكاء الاصطناعي التي تعمل على تشغيل روبوتات الدردشة. ومع ذلك، لا يتمكن حاليًا سوى Google وهؤلاء المطورين من الوصول إلى الكاشف الذي يتحقق من العلامة المائية. وكما يقول كوهلي: “على الرغم من أن SynthID ليس حلاً سحريًا لتحديد المحتوى الناتج عن الذكاء الاصطناعي، إلا أنه يمثل لبنة بناء مهمة لتطوير أدوات تعريف أكثر موثوقية للذكاء الاصطناعي”.

صعود أوراق اعتماد المحتوى

بيانات اعتماد المحتوى كانت موضوعًا ساخنًا للصور ومقاطع الفيديو، ويُنظر إليها على أنها إحدى الطرق لمكافحة ظهور”https://spectrum.ieee.org/tag/deepfakes” الهدف=”_blank”> التزييف العميق. انضمت شركات التكنولوجيا ووسائل الإعلام الكبرى معًا في مبادرة تسمى”https://c2pa.org/” الهدف=”_blank”>C2PA، والتي طورت نظامًا لإرفاق البيانات الوصفية المشفرة بملفات الصور والفيديو للإشارة إلى ما إذا كانت حقيقية أو تم إنشاؤها بواسطة الذكاء الاصطناعي. لكن النص يمثل مشكلة أصعب بكثير، حيث يمكن تعديل النص بسهولة لإخفاء العلامة المائية أو إزالتها. على الرغم من أن SynthID-Text ليست المحاولة الأولى لإنشاء نظام علامة مائية للنص، إلا أنها أول محاولة يتم اختبارها على 20 مليون مطالبة.

ويرى الخبراء الخارجيون الذين يعملون على بيانات اعتماد المحتوى أن بحث DeepMind يعد خطوة جيدة. يقول إنه “يحمل وعدًا بتحسين استخدام بيانات اعتماد المحتوى الدائم من C2PA للمستندات والنصوص الأولية”.”https://www.linkedin.com/in/andrewjenks/” الهدف=”_blank”> أندرو جينكس، مدير مصدر الوسائط في Microsoft والرئيس التنفيذي لـ C2PA. يقول: “هذه مشكلة يصعب حلها، ومن الجيد أن نرى بعض التقدم يتم إحرازه”.”https://www.linkedin.com/in/bmaccormack/” الهدف=”_blank”> بروس ماكورماك، عضو اللجنة التوجيهية لـ C2PA.

كيف تعمل العلامات المائية النصية لجوجل

يعمل SynthID-Text عن طريق التدخل بشكل خفي في عملية الإنشاء: فهو يغير بعض الكلمات التي”https://spectrum.ieee.org/tag/chatbots” الهدف=”_blank”>الدردشة الآلية المخرجات إلى المستخدم بطريقة غير مرئية للبشر ولكنها واضحة لكاشف SynthID. وكتب الباحثون في ورقتهم البحثية: “مثل هذه التعديلات تقدم توقيعًا إحصائيًا في النص الذي تم إنشاؤه”. “خلال مرحلة اكتشاف العلامة المائية، يمكن قياس التوقيع لتحديد ما إذا كان النص قد تم إنشاؤه بالفعل بواسطة علامة LLM ذات العلامة المائية.”

تعمل دورات LLM التي تشغل برامج الدردشة الآلية عن طريق إنشاء جمل كلمة بكلمة، والنظر في سياق ما حدث من قبل لاختيار الكلمة التالية المحتملة. بشكل أساسي، يتدخل SynthID-Text عن طريق تعيين درجات الأرقام بشكل عشوائي للكلمات المرشحة والحصول على كلمات إخراج LLM ذات درجات أعلى. لاحقًا، يمكن للكاشف أن يأخذ جزءًا من النص ويحسب نتيجته الإجمالية؛ سيحصل النص الذي يحمل علامة مائية على درجة أعلى من النص الذي لا يحمل علامة مائية. قام فريق DeepMind بفحص أداء نظامهم مقابل أدوات وضع العلامات المائية النصية الأخرى التي تغير عملية الإنشاء، ووجدوا أنه قام بعمل أفضل في اكتشاف النص الذي يحمل علامة مائية.

ومع ذلك، أقر الباحثون في ورقتهم البحثية أنه لا يزال من السهل تغيير النص الذي تم إنشاؤه بواسطة الجوزاء وخداع الكاشف. على الرغم من أن المستخدمين لن يعرفوا الكلمات التي يجب تغييرها، إذا قاموا بتحرير النص بشكل كبير أو حتى طلبوا من برنامج chatbot آخر تلخيص النص، فمن المحتمل أن تكون العلامة المائية محجوبة.

اختبار العلامات المائية النصية على نطاق واسع

وللتأكد من أن SynthID-Text لم يجعل روبوتات الدردشة تنتج استجابات أسوأ، قام الفريق باختباره على 20 مليون مطالبة مقدمة إلى”https://gemini.google.com/” الهدف=”_blank”> الجوزاء. تم توجيه نصف هذه المطالبات إلى نظام SynthID-Text وحصلت على استجابة بعلامة مائية، بينما حصل النصف الآخر على استجابة Gemini القياسية. إذا حكمنا من خلال تعليقات المستخدمين “ممتازة” و”ممتازة”، فإن الردود ذات العلامة المائية كانت مرضية للمستخدمين تمامًا مثل الاستجابات القياسية.

وهو أمر رائع بالنسبة إلى Google والمطورين الذين يعتمدون على Gemini. لكن معالجة المشكلة الكاملة المتمثلة في تحديد النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي (والذي يسميه البعض”https://www.nytimes.com/2024/06/11/style/ai-search-slop.html” الهدف=”_blank”> منظمة العفو الدولية انحدار) سيتطلب من العديد من شركات الذكاء الاصطناعي تنفيذ تقنيات العلامات المائية – من الناحية المثالية، بطريقة قابلة للتشغيل البيني بحيث يتمكن كاشف واحد من التعرف على النص من العديد من شهادات LLM المختلفة. وحتى في حالة توقيع جميع شركات الذكاء الاصطناعي الكبرى على بعض الاتفاقات، وهو أمر غير مرجح، ستظل هناك مشكلة شهادات LLM مفتوحة المصدر، والتي يمكن تغييرها بسهولة لإزالة أي وظيفة للعلامة المائية.

يلاحظ MacCormack من C2PA أن الاكتشاف يمثل مشكلة خاصة عندما تبدأ في التفكير عمليًا في التنفيذ. يقول: “هناك تحديات تتعلق بمراجعة النص بشكل عام، حيث يتعين عليك معرفة نموذج العلامة المائية الذي تم تطبيقه لمعرفة كيف وأين تبحث عن الإشارة”. بشكل عام، كما يقول، ما زال أمام الباحثين الكثير من العمل. ويقول ماكورماك إن هذا الجهد “ليس طريقًا مسدودًا، ولكنه الخطوة الأولى على طريق طويل”.

اقرأ المزيد

بهذه الخطوة الأولى، ربما تكون Google قد حلت مشكلة ضخمة تتعلق بمحتوى الذكاء الاصطناعي
يقوم Google DeepMind بجعل العلامة المائية النصية AI مفتوحة المصدر

Reactions

0
0
0
0
0
0
بالفعل كان رد فعل لهذا المنصب.

ردود الفعل