في العام الماضي، قمت بإنشاء نسخة عميقة لحيوان طفلي المحشو، الغزال بادي، لأجعله يبدو وكأنه يقضي إجازة ممتعة. كانت هذه التجربة تهدف إلى محاكاة الأحداث المصورة في أحد إعلانات جيميني التي كانت تعرضها جوجل. ورغم أنني لم أعرض مقاطع فيديو مغامرات بادي على طفلي البالغ من العمر أربع سنوات، إلا أنها كانت تجربة كاشفة دفعتني للتفكير مليًا في الخط الفاصل بين التسلية البريئة بالذكاء الاصطناعي التوليدي والانحدار الكامل نحو الواقع الافتراضي. ربما يمثل هذا المخطط الدائري حلقة مثالية، أو ربما لا. ولكن ما أعرفه يقينًا هو أن الأدوات اللازمة لإنشاء مقاطع فيديو واقعية ومدهشة أصبحت متاحة بسهولة، ولا تتطلب سوى القليل من الجهد أو المعرفة. وهذا التوجه يتواصل بقوة مع ظهور نموذج أومني الجديد ضمن عائلة جيميني.
التعرف على جوجل أومني: جيل جديد من النماذج التوليدية
أومني هو اسم عائلة جديدة من النماذج التوليدية التي تزعم جوجل أنها ستكون قادرة يومًا ما على تحويل أي نوع من المدخلات – سواء كانت صورًا أو مقاطع فيديو أو نصوصًا – إلى أي شيء آخر. ولكن في الوقت الحالي، يركز النموذج على إنشاء مقاطع الفيديو. أومني فلاش هو أول هذه النماذج التي أطلقتها جوجل، وهو متاح الآن ضمن منصة الشركة لإنشاء وتحرير الفيديو بالذكاء الاصطناعي، فلو (Flow). لا يزال بإمكانك استخدام النموذج السابق، فيو (Veo)، إذا رغبت في ذلك، ولكن أومني يقدم تحسينات عديدة على نموذج فيو.
باستخدام أومني، يمكنك تحميل مقطع فيديو واستخدامه جنبًا إلى جنب مع نص كمطالبة، كنقطة بداية للإبداع الذي يولده الذكاء الاصطناعي. تدعي جوجل أيضًا أن أومني يدمج المزيد من المعرفة الواقعية عند إنتاج مقاطع الفيديو، ويمكنه القيام بعمل أفضل في الحفاظ على تناسق الشخصيات طوال الفيديو. لم تكن هناك سوى طريقة واحدة لمعرفة ما إذا كانت هذه الادعاءات صحيحة حقًا: لقد أحضرت بادي، رفيقي الاصطناعي، ليحزم حقائبه الصغيرة التي تم إنشاؤها بالذكاء الاصطناعي لمغامرة أخرى.
تجربتي مع بادي: نتائج مدهشة ومحيرة
كانت النتائج خليطًا محيرًا. بعض المقاطع كانت جيدة جدًا، وأكثر اتساقًا وصدقًا مع مطالبتي مما كانت عليه عندما اختبرت فيو قبل خمسة أشهر. لكن حتى أفضل المقاطع التي أنتجها أومني لي كانت لا تزال تحتوي على بعض العيوب الغريبة للذكاء الاصطناعي، مثلما غير بادي اتجاهه فجأة أثناء القفز بالمظلة.
في مقطع فيديو آخر، أعطيت أومني بعض الحرية الفنية بمطالبة نصية: قم بإنشاء مونتاج لبادي وهو يحزم أمتعته لقضاء إجازة، وينطلق على متن سفينة سياحية لقضاء إجازة استوائية. المزاج لطيف ومرح. يحزم بادي شيئًا مضحكًا في حقيبته يتم تشغيله لاحقًا في المقطع. وقد أظهر المقطع بادي وهو يحزم وعاءً من العسل، وفي وقت لاحق من المقطع، تناوله وكأنه زجاجة واقية من الشمس. مع الصوت المضاف آه، يقوم برش العسل على حافره.
بصراحة، لم يكن الأمر سيئًا على الإطلاق. إلا أن زجاجة العسل كانت تتغير باستمرار طوال الفيديو، من وعاء إلى زجاجة بخاخ شفافة مملوءة بالماء، ثم تعود إلى زجاجة ضغط مليئة بالعسل. ولا أستطيع حتى أن أصف كيف توصل النموذج إلى الإطار الأخير للفيديو، وكأنه جمع مجموعة من عناصر التسلسل الذي صنعه للتو بشكل عشوائي.
يمكنك استخدام المطالبات النصية لاقتراح تعديلات على مقاطع الفيديو الخاصة بك، وسأمنح جوجل الفضل في أن هذا يعمل بشكل أفضل مع أومني مما كان عليه عندما اختبرت فيو 3. لكن النتائج كانت سيئة جدًا مع فيو لدرجة أنني وجدت أنه من الأسهل أن أنشئ مقطع فيديو جديدًا من الصفر في كل مرة أردت فيها تغيير شيء ما. أومني يأخذ تعديلاتك في الاعتبار، لكن النتائج لا تظهر دائمًا بالشكل المطلوب.
لقد طلبت منه التركيز على تعابير وجه بادي في مقاطع إجازته، وانتهت النتائج بظهورها غريبة. كما كان يمنح بادي قرونًا من حين لآخر، وهو ما لا يملكه الغزال بادي. بادي هو رضيع. وعندما طلبت منه إزالة القرون التي ظهرت في أحد المشاهد، امتثل لذلك، ثم أضاف القرون في جميع المشاهد الأخرى!
المشكلة هي أن لا شيء من هذا مجاني. يتكلف إنشاء مقاطع الفيديو أرصدة تتراوح من 15 إلى 40 نقطة بناءً على طول المشهد والمكونات التي تبدأ بها. جولة واحدة من التعديلات تكلف 40 رصيدًا. لدي خطة AI Pro بقيمة 20 دولارًا شهريًا والتي تأتي مع 1000 نقطة كل شهر. بعد حوالي 20 مقطعًا تم إنشاؤها مع بعض التعديلات على بعضها، وصلت إلى 145 رصيدًا. إذا كانت لديك أفكار محددة حول الفيديو الذي تريد من أومني إنشاءه، فقد تجد نفسك أمام الكثير من التغييرات المكلفة مع النموذج للحصول على فيديو قريب من رؤيتك.
تجارب التزييف العميق: هل يمكن لأومني خداع الواقع؟
إحدى نقاط القوة المزعومة لدى أومني هي قدرته على إضافة عناصر تم إنشاؤها بالذكاء الاصطناعي إلى مقاطع الفيديو الحقيقية، لذلك منحت بادي فترة راحة وقمت بالتزييف العميق لنفسي. بدءًا من فيديو سيلفي بتعبير وجه محايد، قمت بدفع أومني لإنشاء مقاطع فيديو لي وأنا أتناول طبقًا من السباغيتي، وأجلس في مقعد طائرة، وأقف أمام برج إيفل وأتناول قطعة من الخبز الفرنسي. أستطيع أن أقول بصدق إنني لم أكن مستعدة لما رأيته.
هناك بعض عيوب الذكاء الاصطناعي في مقاطع الفيديو المزيفة الخاصة بي. صوت الشوكة التي تضرب وعاء المعكرونة مصطنع قليلاً. وهناك امرأة في خلفية فيديو الطائرة تظهر مرتين. لكن بغض النظر عن تلك الأخطاء الصغيرة والشعور الغريب الغامض الذي يصاحبها، فإنها مقنعة للغاية.
عرضت على زوجي مقطع المعكرونة؛ كان يعلم أنني كنت أختبر أداة فيديو تعمل بالذكاء الاصطناعي، لكنني لم أخبره بما تم إنشاؤه بالذكاء الاصطناعي في المشهد. وبدون معرفة ما هو مولّد بالذكاء الاصطناعي في هذا المقطع، فقد صدق أنني كنت جالسة أمام الكاميرا أتناول المعكرونة، وقال إن دليله الوحيد على وجود شيء غير طبيعي هو أن الوعاء يبدو غير مألوف. بدا تناول المعكرونة في حد ذاته حقيقيًا بما يكفي لإقناع زوجي. الرجل الذي نظر إلي في الحياة الواقعية بشكل أساسي كل يوم على مدى العقد الماضي.
تتميز عمليات التزييف العميق الأخرى بمستويات متفاوتة من الجودة الكافية لخداع الأشخاص على وسائل التواصل الاجتماعي. تبدو بعض مقاطع برج إيفل كرتونية بعض الشيء، لكن أحدها مقنع بدرجة كافية لدرجة أنك قد تحتاج إلى إعادة مشاهدته عدة مرات للتأكد من أنه من صنع الذكاء الاصطناعي. أنا أعرف أن تلك ليست أنا عندما أدار الذكاء الاصطناعي رأسي وكشف عن شعري المسحوب للخلف على شكل ذيل حصان. لكنني لست متأكدة من أن أي شخص آخر سيعرف الفرق، وهذا يجعلني أشعر بالغرابة.
في عمق الوادي الغريب
أنا مرهقة قليلاً من كل هذا، لأكون صادقة. لقد صدمت عندما اختبرت فيو 3 بالواقعية التي يمكن أن ينتجها. وقد صدمت من مدى سهولة تصوير أشخاص مزيفين في صور مزيفة مرارًا وتكرارًا خلال السنوات القليلة الماضية. من المحتمل أن أشعر بالصدمة من أومني أيضًا، وأعتقد أنني كذلك، لكن حدة الصدمة تلاشت قليلاً.
لا يزال ليس من السهل تمامًا إنشاء تحفة سينمائية من إنتاج الذكاء الاصطناعي كما تريد جوجل أن تصدق. لكن أومني يحسن فيو بعدة طرق ملحوظة. إذا كان لديك حساب جوجل وبطاقة ائتمان، فيمكنك التقاط مقطع فيديو لنفسك وأنت جالس في المنزل وتجعله يبدو وكأنك في رحلة إلى جزيرة ماوي بجهد بسيط. لا أعتقد أننا في سفوح التفرد بالضبط، لكننا بالتأكيد في عمق الوادي الغريب.
ملاحظة: تم إنشاء جميع الصور ومقاطع الفيديو في هذه القصة بواسطة جوجل جيميني.