إذا لم يتمكن OpenAI ChatGPT من توليد حقيقة غير متحيزة، فكيف سيولد Sora العالم المادي؟

تم العثور على العديد من العيوب الرئيسية في نماذج اللغات الكبيرة OpenAI ChatGPT وGoogle Gemini. إنهم يولدون معلومات بعيدة كل البعد عن الحقيقة غير المتحيزة. يواجه نظام توليد الصور والفيديو الجديد مشكلة مع الحقيقة، لكنه يواجه أيضًا مشكلة مع العالم المادي. ليس لديهم نموذج داخلي للعالم المادي. وهذا يؤدي إلى أن تكون الحركة خاطئة. ما ينبغي أن يكون الأشياء المادية تظهر وتختفي.

قالت OpenAI إنها ستكون قادرة على استخدام نظام توليد الفيديو لإنتاج بيانات التدريب في العالم الحقيقي. المعنى الضمني هو أن بيانات التدريب هذه ستكون مفيدة للسيارات ذاتية القيادة أو للروبوتات البشرية. ومع ذلك، إذا كان الفيديو مهلوسًا ولا يتماشى مع فيزياء العالم الحقيقي، فسيكون ذلك أمرًا فظيعًا لإنتاج كميات هائلة من بيانات التدريب التي لا يمكن التحقق منها بواسطة مختبرين بشريين.

أسس غاري ماركوس شركة Geometric Intelligence في عام 2014، واستحوذت شركة Uber لاحقًا على شركة التعلم الآلي. يشعر غاري بالدهشة لأن بعض الأشخاص لم يدركوا بعد أن الذكاء الاصطناعي التوليدي يتمتع بأهمية كبيرة عندما يتعلق الأمر بالنماذج العالمية والتفكير عالي المستوى والواقعية

ويشير إلى أن الصور ومقاطع الفيديو من OpenAI Sora قد تبدو واقعية ولكنها ترتكب أخطاء جوهرية. مقطع فيديو لقرد يلعب الشطرنج له مظهر واقعي للقرد ولكن رقعة الشطرنج هي 7X7 وليست 8X8. هناك ثلاثة ملوك.

pic.twitter.com/vb9giSg9np

– سام التمان (@ سما) 15 فبراير 2024

هناك رجل ذو ستة أصابع يحمل وحيد القرن وقرن وحيد القرن يخترق رأسه.

دقة الصور ومقاطع الفيديو حول كيفية استخدام OpenAI لحساب 16X.

كانت هناك مقاطع فيديو أخرى ذات مظهر واقعي لامرأة تمشي في طوكيو لكن النساء يأخذن الخطوات اليسرى على التوالي.

يشير ماركوس وآخرون إلى مشاكل التقليد المفترض للواقع مع الفيزياء الأساسية. يبدو أن الإجراءات تحاكي محرك اللعبة Unreal. لن تحتوي بيانات التدريب باستخدام الفيديو الواقعي على أشياء تكسر الفيزياء.

ولأن مواطن الخلل لا تنبع من البيانات، فهي تنبع من خلل في كيفية إعادة بناء النظام للواقع. واحدة من أكثر الأشياء الرائعة حول مواطن الخلل الفيزيائية الغريبة التي يعاني منها سورا هي أن معظم هذه الأخطاء ليست أشياء تظهر في البيانات. بدلاً من ذلك، تشبه هذه الأخطاء في بعض النواحي هلوسة نموذج اللغة الكبيرة الناتجة عن إلغاء ضغط البيانات (تقريبًا)، المعروف أيضًا باسم الضغط مع فقدان البيانات. إنهم لا يستمدون من العالم.

المزيد من البيانات لن تحل هذه المشكلة. ومثل أنظمة الذكاء الاصطناعي التوليدية الأخرى، لا توجد طريقة لتشفير (وضمان) قيود مثل “كن صادقًا” أو “التزم بقوانين الفيزياء” أو “لا تخترع (أو تزيل) الأشياء فحسب”.

سيكون المكان والزمان والسببية أمرًا أساسيًا في أي نموذج عالمي جاد.

سورا رائع، لكنه يشبه التحويل والربط

بريان وانغ هو أحد قادة الفكر المستقبلي ومدون مشهور في مجال العلوم ويتابعه مليون قارئ شهريًا. تم تصنيف مدونته Nextbigfuture.com في المرتبة الأولى في مدونة أخبار العلوم. وهو يغطي العديد من التكنولوجيا والاتجاهات الثورية بما في ذلك الفضاء، والروبوتات، والذكاء الاصطناعي، والطب، والتكنولوجيا الحيوية لمكافحة الشيخوخة، وتكنولوجيا النانو.

يشتهر بتحديد التقنيات المتطورة، وهو حاليًا مؤسس مشارك لشركة ناشئة وجمع التبرعات للشركات ذات الإمكانات العالية في المراحل المبكرة. وهو رئيس قسم الأبحاث المخصصة لاستثمارات التكنولوجيا العميقة والمستثمر الملائكي في Space Angels.

وهو متحدث متكرر في الشركات، وكان متحدثًا في TEDx، ومتحدثًا في جامعة Singularity وضيفًا في العديد من المقابلات الإذاعية والبودكاست. إنه منفتح على التحدث أمام الجمهور وتقديم المشورة للتعاقدات.

اقرأ أكثر

إذا لم يتمكن OpenAI ChatGPT من توليد حقيقة غير متحيزة، فكيف سيولد Sora العالم المادي؟

Reactions

ردود الفعل