أعلنت شركة ميتا نموذج توليد الفيديو بالذكاء الاصطناعي “Movie Gen” من أجل إنتاج مقاطع فيديو عالية الدقة ومزوّدة بالصوت.
ويأتي هذا الإعلان بعد عدة أشهر من كشف شركة OpenAI عن نموذجها المشابه لتوليد الفيديو، المعروف باسم Sora.
ويعتمد نموذج Movie Gen على مدخلات نصية لتوليد مقاطع فيديو جديدة تلقائيًا، بالإضافة إلى تحرير اللقطات الحالية أو الصور الثابتة. ووفقًا لصحيفة نيويورك تايمز، فإن الأصوات المُضافة إلى مقاطع الفيديو تولّد أيضًا بالذكاء الاصطناعي، مع إضافة الضوضاء والمؤثرات الصوتية والموسيقى الخلفية المناسبة للفيديو، كما يمكن للنموذج إنشاء مقاطع الفيديو بأبعاد مختلفة.
وإلى جانب توليد مقاطع فيديو جديدة، تقول ميتا إن نموذج Movie Gen يمكنه أيضًا إنشاء مقاطع فيديو مخصصة من الصور أو تعديل مقاطع الفيديو الحالية، وتغيير عناصر مختلفة فيها. على سبيل المثال: عرضت الشركة صورة ثابتة لرجل، وقد أنشأ النموذج منها مقطع فيديو يظهره واقفًا في معمل يجري تجربة كيميائية، بالإضافة إلى أمثلة أخرى متنوعة.
ويمكن استخدام نموذج Movie Gen لتحرير اللقطات الحالية وتغيير الأسلوب والتنقلات أو إضافة عناصر جديدة لم تكن موجودة من قبل. وفي أحد الأمثلة التي قدمتها ميتا تمكّن النموذج من تحرير مقطع فيديو بسيط لعدّاء بعدة طرق بالذكاء الاصطناعي، كتغيير خلفية المشهد، أو مظهر العدّاء، فقط باستخدام أوامر نصية، وقد عرضت الشركة أمثلة أخرى لعمليات التحرير.
وأوضح كريس كوكس، مدير المنتجات في ميتا، في منشور له عبر منصة ثردز أن الشركة “ليست جاهزة بعدُ لإطلاق هذه الأداة كمنتج تجاري قريبًا”، مشيرًا إلى أن التكلفة المرتفعة ومدة توليد مقاطع الفيديو تُعد من التحديات الرئيسية.
ومع أن OpenAI قد أعلنت نموذج Sora مطلع العام الجاري، لكن الأداة المعتمدة عليه لم تُطرح للاستخدام العام بعدُ، وقد استقال حديثًا أحد المسؤولين عن تطوير النموذج من OpenAI، وانتقل إلى جوجل.
وتثير أدوات توليد الصور والفيديو بالذكاء الاصطناعي مخاوف تتعلق بالملكية والاستخدامات الضارة المحتملة، إذ أشارت تقارير إلى أن الشركات الناشئة في مجال الذكاء الاصطناعي تدرب الأدوات والنماذج الخاصة بها باستخدام آلاف مقاطع الفيديو المستخرجة من يوتيوب، وهو ما يُعد انتهاكًا لشروط استخدام المنصة وفقًا لما صرح به الرئيس التنفيذي ليوتيوب، نيل موهان.
وأكدّت ميتا في منشور على مدونتها أنها درّبت Movie Gen “بمزيج من مجموعات البيانات المرخصة والمتاحة للجمهور”، لكنها لم تحدد بالضبط مصادر تلك البيانات.