مولد فيديو Google's Veo 3 AI هو حلم Monger Slop

حتى للوهلة الأولى ، هناك شيء ما عن الجسم في الشارع. الورقة البيضاء التي تحتها نظيفة للغاية ، وحركات الضباط خالية تمامًا من الغرض. “نحن بحاجة إلى إزالة الشارع” ، يقول أحدهم بإيماءة اليد الحازمة ، على الرغم من أن شفتيها لا تتحرك. إنه منظمة العفو الدولية ، حسناً. ولكن ها هي كيكر: لم يتضمن موجه أي حوار.

أضاف Veo 3 ، نموذج توليد الفيديو الجديد من Google ، هذا الخط من تلقاء نفسه. على مدار الـ 24 ساعة الماضية ، قمت بإنشاء عشرات المقاطع التي تصور التقارير الإخبارية والكوارث والقطط الكرتونية الأبله مع الصوت المقنع – بعضها اخترع النموذج من تلقاء نفسه. إنه أكثر من زاحف قليلاً وأكثر تطوراً مما كنت أتخيله. وعلى الرغم من أنني لا أعتقد أنه سيؤدي إلى دفعنا إلى يوم القيامة الخاطئة حتى الآن ، فإن Veo 3 يضربني كآلة مطلقة من الذكاء الاصطناعي.

جوجل”https://www.youtube.com/live/o8NiE3XMPrM?si=MghM5cXF4bPaLtiv&t=4852″> قدم VEO 3 في I/O هذا الأسبوع ، تسليط الضوء على أهم قدرتها الجديدة: توليد الصوت للذهاب مع فيديو AI الخاص بك. “نحن ندخل عصرًا جديدًا من الخلق” ، أوضح نائب الرئيس من Google Gemini ، جوش وودوارد ، في الكلمة الرئيسية ، واصفاها بأنها “واقعية بشكل لا يصدق”. لم أكن قد بيعت تمامًا ، لكن بعد ذلك ، بعد بضعة أيام ، قمت بإنشاء مقطع فيديو لمذيع الأخبار يعلن عن حريق في Edele. كل ما يتطلبه الأمر كان موجه نص أساسي ، بضع دقائق ، واشتراك باهظ الثمن”http://www.theverge.com/news/670495/google-ai-ultra-plan-pricing-launch-io-2025″> خطة Google AI Ultra. وأنت تعرف ماذا؟ لم يكن وودوارد مبالغًا فيه. إنه واقعي مثل الجحيم.

جربت مطالبة مرساة الأخبار بعد رؤية ما تمكن أليخاندرا كارابالو ، مدرب سريري في عيادة سايبرلو في كلية الحقوق بجامعة هارفارد ، من إنتاجه.”https://www.threads.com/@esqueer_/post/DJ7bCPVSIbP?xmt=AQF0P8R-Bahfjc6xateus7AWbfIgfx_5EwNXUxqAZQMsXw”> واحدة من مقاطعها يضم مذيع أخبار يعلن عن وفاة وزير الدفاع الأمريكي بيت هيغسيث. لم يمت ، لكن المقطع مقنع بشكل لا يصدق. منشور بما في ذلك سلسلة من مقاطع الفيديو مع”https://www.reddit.com/r/interestingasfuck/comments/1ksh3iy/all_these_videos_are_ai_generated_audio_included/”> الشخصيات التي تم إنشاؤها من الذكاء الاصطناعى تحتج على المطالبات المستخدمة لإنشاءها لديه 50000 upvotes على رديت. تشمل المشاهد الكوارث ، والامرأة في سرير في المستشفى باستخدام أنبوب التنفس ، وشخصية تتعرض للتهديد تحت تهديد السلاح – كل ذلك مع الحوار المنطوق وأصوات الخلفية الواقعية. أشياء حقيقية!

ربما أكون ساذجًا ، لكن بعد اللعب مع Veo 3 لست كذلك تمامًا كما كنت قلقا كما كنت في البداية. بالنسبة للمبتدئين ، توجد درابزين واضحة في مكانها. لا يمكنك المطالبة به لإنشاء مقطع فيديو من بايدن تعثر والسقوط. لا يمكن أن يكون لديك مذيع أخبار يعلن عن اغتيال الرئيس ، أو حتى إنشاء مقطع فيديو لمدير تنفيذي لشركة التكنولوجيا التي ترتدي القميص والسلسلة تضحك بينما تمطر الدولار من حوله. هذه بداية.

ومع ذلك ، يمكنك توليد بعض القرف المقلق. بدون أي حلول ذكية ، دفعت VEO 3 إلى إنشاء فيديو من إبرة الفضاء على النار. ابتداءً من صورتي الخاصة لجبل رينير ، أنشأت مقطع فيديو له يندلع بالدخان والحمم البركانية. إلى جانب مقطع من مذيعة الأخبار التي تعلن عن الكارثة المذكورة ، أستطيع أن أرى كيف يمكنك أن تشرب بعض الأذى بسهولة مع هذه الأداة.

إليك الأخبار الأفضل: لا يبدو وكأنه آلة DeepFake جاهزة. أعطيتها بضع صور لنفسي وطلبت ذلك لإنشاء مقطع فيديو مع حوار محدد ولن يمتثل. طلبت ذلك أيضًا إحضار زوج من الأحذية العملاقة في صورة إلى الحياة وجعلهم يخرجون من مكان الحادث ؛ لقد تمكنت من الدوس الذي يدوم الحذاء عبر الرصيف مع بعض الضوضاء الهزلية في الخلفية.

كان لدي وقت أسهل في إنشاء مقاطع فيديو عندما كانت مطالبي أقل تحديدًا ، وهو ما أكدت شيئًا”https://www.threads.com/@andrump3/post/DJ41_6qRMM_”> أشار زميلي أندرو مارينو: VEO 3 ممتازة في إنشاء نوع من محتوى YouTube الأقل شملاً على YouTube يستهدف الأطفال.

إذا لم تتعرض مطلقًا إلى حفرة لا نهاية لها من القمامة على YouTube Kids ، اسمحوا لي أن ينولك. تخيل مشاهدة أسوأ ثلاثية الأبعاد عرضًا لشاحنة وحش تقود إلى أسفل المنحدر ، وهبطت في ضريبة القيمة المضافة من الطلاء الملون. بجانبها ، تدفع شاحنة وحش أخرى إلى أسفل منحدر آخر في ضريبة القيمة المضافة أخرى من الطلاء – هذه المرة ، لون مختلف. الآن شاهد ذلك مرة أخرى. ومرة أخرى. ومرة أخرى. هناك ساعات من هذه الأشياء على YouTube المصممة لتفتت الأطفال الصغار. عادةً ما تكون مقاطع الفيديو هذه غير ضارة ، فقط السعرات الحرارية الفارغة المصممة لرفع وجهات النظر التي تجعل الكوكوميلون تبدو المواطن كين. في حوالي 10 دقائق مع Veo 3 ، ألقيت معًا مقطعًا يتبع نفس الصيغة الأساسية – كاملة مع موسيقى الخلفية Jaunty. لكن المقطع الأكثر إثارة للقلق بالنسبة لي هو القطط الكرتونية على رصيف.

اعتقدت أنه سيكون من المضحك أن تشكو القطط لبعضها البعض من أن الأسماك لا تعض. في غضون بضع دقائق فقط ، كان لدي مقطع كامل مع قطتين وبعض الحوار الذي تم إنشاؤه من الذكاء الاصطناعى لم أكتبه أبدًا. إذا كان من السهل إنشاء مقطع مدته 10 ثوانٍ ، فإن تمديده إلى مقطع فيديو على YouTube مدته سبع دقائق سيكون تافهاً. في شكله الحالي ، تعود المقاطع إلى Veo 2 عند محاولة تمديدها إلى مشاهد أطول ، والتي تزيل الصوت. لكن الطريقة التي تدفع بها Google هذه الأدوات إلى الأمام بلا هوادة ، لا أستطيع أن أتخيل أنها ستكون طويلة قبل أن تتمكن من تحرير مقطع فيديو كامل طوله مع VEO 3.

بصراحة ، أتساءل عما إذا كان هذا النوع من الاستخدامات للفيديو الذي تم إنشاؤه من الذكاء الاصطناعى هو ميزة وليس خطأ. أظهرت لنا Google بعض الفيديو المولدة من الذكاء الاصطناعى من صانعي الأفلام الحقيقيين ،”http://www.theverge.com/news/670977/darren-aronofsky-is-involved-in-a-new-film-with-ai-generated-visuals”> بما في ذلك إليزا ماكنيت، الذي يعمل مع دارين أرونوفسكي في فيلم جديد مع بعض العناصر التي يتم إنشاؤها من الذكاء الاصطناعى. وبالتأكيد ، يمكن أن يكون فيديو الذكاء الاصطناعي أداة مثيرة للاهتمام في الأيدي اليمنى. لكنني أعتقد أن ما من المرجح أن نراه هو انتشار نوع من”http://www.theverge.com/2024/10/8/24258764/iphone-pixel-camera-google-photos-memories-ai-edits”> صور لطيفة أن الذكاء الاصطناعى جيد جدا في توليد – هذه المرة ، في ستيريو.

اقرأ المزيد

مولد فيديو Google’s Veo 3 AI هو حلم Monger Slop

Reactions

ردود الفعل