تحتفل TechSpot بالذكرى السنوية الخامسة والعشرين لتأسيسها. TechSpot يعني التحليل الفني والمشورة يمكنك الوثوق.
لماذا يهم: تحتاج الصناعة الإبداعية إلى تدفق مستمر للمحتوى لإبقاء المعجبين سعداء، ويجب إنشاء هذا المحتوى بطريقة ما. عندما يتعلق الأمر بالنماذج ثلاثية الأبعاد، يمكن لخوارزميات الذكاء الاصطناعي تقديم مساعدة كبيرة من خلال تقليل مقدار وقت الإنتاج.
باستخدام مجموعة بيانات كبيرة لتدريب خوارزمية التعلم الآلي، ابتكر باحثون من Adobe والجامعة الوطنية الأسترالية تقنية يمكنها أن تفعل المعجزات لإنشاء نماذج ثلاثية الأبعاد. ابتكر الباحثون ما يعتبرونه أول نموذج إعادة بناء كبير (LRM) قادر على التنبؤ بشكل نموذج ثلاثي الأبعاد من صورة واحدة ثنائية الأبعاد، ويمكنه القيام بذلك في غضون 5 ثوانٍ فقط.
وأوضح الباحثون أن نماذج الجيل الثلاثي الأبعاد السابقة تم تدريبها على مجموعات بيانات صغيرة الحجم تركز على فئة صورة واحدة ورقتهم. على العكس من ذلك، يتمتع نموذج LRM الخاص بهم ببنية قابلة للتطوير بدرجة كبيرة وتعتمد على المحولات مع 500 مليون معلمة قابلة للتعلم، وقد تم تدريبها على حوالي مليون كائن ثلاثي الأبعاد متاح في أوبجافيرس و MVImgNet مجموعات البيانات.
هذا المزيج من النماذج عالية السعة وبيانات التدريب واسعة النطاق يوفر لخوارزمية LRM قدرة على إنشاء محتوى “قابلة للتعميم للغاية”، كما يقول الباحثون. يشرح. وتقول الصحيفة إن النموذج كان قادرًا على إنتاج عمليات إعادة بناء ثلاثية الأبعاد “عالية الجودة” من صور اختبار مختلفة بما في ذلك صور العالم الحقيقي. علاوة على ذلك، يمكن لـ LRM التقاط كل من الصور “العادية” والترقيعات المرئية الناتجة عن خدمات الذكاء الاصطناعي مثل DALL-E وStable Diffusion كنموذج إدخال ثنائي الأبعاد.
وفقًا للمؤلف الرئيسي للدراسة، Yicong Hong، فإن LRM يعد إنجازًا كبيرًا في إعادة البناء ثلاثي الأبعاد للصورة الواحدة. يمكن لخوارزمية الذكاء الاصطناعي إنتاج هندسة تفصيلية من مقطع فيديو أو صورة شكلية، مع الحفاظ على الأنسجة المعقدة مثل حبيبات الخشب.
يقول الباحثون إن LRM تتمتع بقدرات “تحويلية” محتملة، حيث يمكن استخدامها في مجموعة واسعة من الصناعات بما في ذلك التصميم والترفيه والألعاب. يمكن للمصممين أو الفنانين ثلاثي الأبعاد تبسيط عملية النمذجة ثلاثية الأبعاد، مما يقلل بشكل كبير من الوقت اللازم لإنشاء أصول لألعاب الفيديو أو الرسوم المتحركة. أصبح إنشاء المحتوى ثلاثي الأبعاد في صناعة سريعة التطور يمثل تحديًا، وتسارع شركات الذكاء الاصطناعي إلى تقديم حلول محتملة مثل خدمة Stable 3D تم تقديمه مؤخرًا بواسطة Stability AI.
يمكن لـ LRM أيضًا إضفاء الطابع الديمقراطي على النمذجة ثلاثية الأبعاد، حيث يمكن للمستخدمين “العاديين” تطوير نماذج مفصلة للغاية من الصور الملتقطة بهاتف ذكي. على الرغم من أن LRM لا يزال يواجه تحديات، مثل الأنسجة غير الواضحة للأجزاء المخفية من الصورة، إلا أنه يفتح عالمًا من الفرص الإبداعية والتجارية. وقد قدم الباحثون صفحة من خلال عروض الفيديو التوضيحية والشبكات ثلاثية الأبعاد التفاعلية لإظهار ما يمكن لـ LRM فعله الآن.