الصورة عبر جوجل / ديب مايند
“content-text”>Genie 2 هي من بنات أفكار قسم أبحاث الذكاء الاصطناعي بالشركة، Deepmind، ويمكنها إنشاء عوالم ثلاثية الأبعاد قابلة للعب “based on a single prompt image.”
“content-text”>تم وصفها بأنها قفزة زلزالية إلى الأمام بالمقارنة مع Genie 1، التي قدمت طريقة لتوليد عوالم ثنائية الأبعاد، ولكن ما الذي ننظر إليه بالفعل هنا؟
“content-text”>بعد نظرة سريعة، من المغري أن نعلن أن Google نجحت في إنشاء نموذج قادر على تحويل المطالبات البدائية إلى عوالم افتراضية موسعة. الشركة نفسها حريصة على اقتراح نفس الشيء، حيث كتبت أن Genie 2 يمكنها فعل ذلك “generate a vast diversity of rich 3D worlds” مع القدرات الناشئة مثل “object interactions, complex character animation, physics, and the ability to model and thus predict the behavior of other agents.”
“content-text”>”Below (as pictured) are example videos of people interacting with Genie 2. For every example, the model is prompted with a single image generated by Imagen 3, GDM’s state-of-the-art text-to-image model,” تقول الشركة.
“content-text”>”This means anyone can describe a world they want in text, select their favorite rendering of that idea, and then step into and interact with that newly created world (or have an AI agent be trained or evaluated in it). At each step, a person or agent provides a keyboard and mouse action, and Genie 2 simulates the next observation. Genie 2 can generate consistent worlds for up to a minute, with the majority of examples shown lasting 10-20s.”
الصورة عبر جوجل
“content-text”>الأمثلة التي اختارتها جوجل لعرض نموذجها الجديد موحدة في عقمها. تتجول نماذج الشخصيات في تفسيرات مبتذلة للغابات والصحاري، ونادرًا ما تكون مأهولة بالهياكل وأوراق الشجر التي تتكرر بشكل متكرر. أهرامات تنحني وتلتوي عندما تتأرجح الكاميرا في الأعلى. غابة من الأشجار يتردد صداها إلى ما لا نهاية.
“content-text”>تأخذ التفاعلات الناشئة شكل حركات أساسية ورسوم متحركة للشخصية تملق للخداع. تتميز المقاطع القصيرة التي شاركتها Google (والتي من المفترض أن تعرض فقط أفضل مخرجات Genie 2) بنسخ طبق الأصل من سيناريوهات ألعاب الفيديو المألوفة بشكل غامض والتي تتفكك بسرعة وتتحلل عند وضعها تحت أي نوع من التدقيق.
“content-text”>”Genie 2 generates new plausible content on the fly and maintains a consistent world for up to a minute,” تنص جوجل. هذه الجملة ليست التأييد الرنان الذي تعتقد الشركة أنه كذلك.
فشلت Google وشركات الذكاء الاصطناعي الأخرى في فهم عملية الخلق
“content-text”>لا يطمح مطورو الألعاب (والمبدعون المقطوعون من أي قطعة قماش) إلى الإبداع “plausible content.” الناس (وأنا أتحدث عن البشر الذين يعملون على ألعابك المفضلة، وليس أصحاب العمل في الشركات) يبدعون من أجل البهجة والإلهام والترفيه.
“content-text”>نحن نخلق للتواصل مع بعضنا البعض وتفكيك حالتنا الإنسانية المشتركة. إن خلق أي شيء يعني إرسال أجزاء من نفسك إلى الأثير الأبدي، على أمل أن يجد شخص ما، في مكان ما، معنى في الفوضى التعاونية المتعمدة، التي لا يمكن التنبؤ بها، والتي غالبًا ما يصبح عليها الفن.
“content-text”> من الواضح أن جوجل لا تفهم كيف المطورون يصنعون الألعاب أيضًا. هناك قصد وراء كل قرار، سواء كان ذلك يتعلق بتصميم عالم مفتوح لخدمة السرعة أو الميكانيكا، أو دمج سردك في نسيج البيئة. هذه ليست عناصر يمكنك ببساطة استحضارها إلى الوجود باستخدام سلسلة نصية أو صورة تم إنشاؤها بواسطة الذكاء الاصطناعي.
“content-text”>Genie 2 هي أداة حادة تفتقر إلى الدقة أو الهدف. لقد أنفقت Google وقتًا وموارد في إنشاء أداة يمكنها نادرًا إعادة إنتاج الأمثلة الأكثر ابتذالًا لألعاب الفيديو. مدينة النيون ضبابية. رجل الخيال على الحصان. الآن، يجب أن تقنعنا بأن القشور المتفتتة التي أنتجتها Genie 2 تستحق وقتنا واهتمامنا. لنكن واضحين: إنهم ليسوا كذلك.
“content-text”> في الوقت الحالي، هم بالكاد قابلون للحياة. اعترفت Google نفسها بأن النموذج قادر فقط على الحفاظ على عوالم متسقة لمدة أقل من دقيقة. إنه مثل مشاهدة ذكرى ذكرى تحوم في البالوعة الكونية. ليس هناك سوى التدهور والانهيار“_blank” href=”https://www.theguardian.com/technology/article/2024/jul/02/google-ai-emissions”> ويفترض بتكلفة كبيرة في العالم الحقيقي (“_blank” href=”https://www.theguardian.com/technology/article/2024/jul/02/google-ai-emissions”> عبر الجارديان).
“content-text”> لمن كل هذا؟ واستنادًا إلى ما عرضته Google هنا، فإن اللاعبين الذين يحلمون بتحويل ألعابهم الخاصة في نهاية المطاف إلى واقع بمساعدة أدوات الذكاء الاصطناعي سوف يدركون بسرعة أن “إبداعاتهم” خالية من الأسلوب والمضمون. جانبان من ألعاب الفيديو هما إنسانيان بشكل لا لبس فيه.
“content-text”>في هذه الأثناء، أظهر المطورون بالفعل كيف يمكن استخدام التقنيات الحالية مثل التوليد الإجرائي لجعل المجرات بأكملها مادية. توجد مخازن أصول قوية لأولئك الذين يحتاجون إلى وحدات بناء مسبقة الصنع للمساعدة في النماذج الأولية السريعة أو الإنتاج الكامل. تستمر محركات مثل Unity وUnreal وGodot وGameMaker في تلبية احتياجات المطورين على جميع المستويات، بينما قد يختار البعض إنشاء محركات خاصة بهم من الألف إلى الياء.
“content-text”>إذا كانت أدوات الذكاء الاصطناعي مثل Genie 2 هي الحل، فما هي المشكلة؟
“content-text”>في عصر تسريح العمال وإغلاق الاستوديوهات والاضطرابات المالية والتكتل الجماعي، يتمثل التحدي الأكبر الذي يواجه المطورين في العثور على الموارد اللازمة لإطلاق العنان لقدراتهم الإبداعية بطريقة تشعر بالاستدامة. في صناعة أصبحت تتجنب المخاطرة بشكل متزايد وتنعزل على المستوى الأعلى، يحتاج المطورون إلى أولئك الذين لديهم محافظ عميقة للبدء في استغلال الأفكار الجديدة بدلاً من المحاولة (والفشل في كثير من الأحيان) لتكرار نجاحات منافسيهم.
“content-text”> انسَ أمر إنتاج محتوى معقول. امنح المطورين ما يحتاجون إليه لتحويل أفكارهم الأكثر تجريدًا وطموحًا إلى واقع ملموس. إذا كنت تريد الابتكار حقًا، فاستثمر في الأشخاص.
عن المؤلف
محرر الأخبار، GameDeveloper.com
“content-text”>محرر أخبار مطور الألعاب كريس كير هو صحفي ومراسل حائز على جوائز ويتمتع بخبرة تزيد عن عشر سنوات في صناعة الألعاب. وقد ظهر خطه الثانوي في منشورات مطبوعة ورقمية بارزة بما في ذلك Edge وStuff وWireframe وInternational Business Times و“_blank” href=”http://pocketgamer.biz/”>PocketGamer.biz. طوال حياته المهنية، قام كريس بتغطية الأحداث الصناعية الكبرى بما في ذلك GDC، وPAX Australia، وGamescom، وParis Games Week، وDevelop Brighton. لقد ظهر في لجنة التحكيم في The Develop Star Awards في مناسبات متعددة وظهر على راديو بي بي سي 5 لايف لمناقشة الأخبار العاجلة.