من فضلك تسجيل الدخول أو تسجيل لتفعل ذلك.
“text”>

حققت قدرات الذكاء الاصطناعي تقدمًا في عام 2024 ولكن كان هناك تباطؤ مؤقت في توسيع نطاق الحوسبة الهائلة لتدريب الذكاء الاصطناعي أو حساب وقت الاختبار. سيشهد عام 2025 توسعًا هائلاً في تدريب الذكاء الاصطناعي.

د. آلان طومسون هو قائد فكري موثوق به في مجال الذكاء الاصطناعي، وكثيرًا ما تستشهد به مؤسسات مثل Microsoft وشركة RAND وجامعة أكسفورد. ينشر نشرة Memo الإخبارية لتحديث شركات Fortune 500 وقادة الأعمال والحكومات حول الذكاء الاصطناعي. إنه يتتبع تقدم الذكاء الاصطناعي نحو الذكاء الاصطناعي العام وما بعده.

قرر آلان أننا قطعنا 84% من الطريق نحو الذكاء الاصطناعي العام (AGI) بعد إصدار Google Genie 2 مع النماذج العالمية والإصدارات الأخرى التي تعمل على تطوير قدرات الوكيل.

“async” العرض البديل=”1024″ الارتفاع=”917″ بيانات-eio=”l” البيانات-القديم-src=”data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAABAAAAAOVAQAAAADfaq9QAAAAAnRSTlMAAHaTzTgAAACJSURBVHja7cExAQAAAMKg9U9tDB+gAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA4GzOJAAByi8HoQAAAABJRU5ErkJggg==” سرك=”https://nextbigfuture.s3.amazonaws.com/uploads/2024/12/Screenshot-2024-12-20-at-8.09.46-AM-1024×917.jpg” srcset=”https://nextbigfuture.s3.amazonaws.com/uploads/2024/12/Screenshot-2024-12-20-at-8.09.46-AM-1024×917.jpg 1024w, https://nextbigfuture.s3.amazonaws.com/uploads/2024/12/Screenshot-2024-12-20-at-8.09.46-AM-300×269.jpg 300w, https://nextbigfuture.s3.amazonaws.com/uploads/2024/12/Screenshot-2024-12-20-at-8.09.46-AM-768×688.jpg 768w, https://nextbigfuture.s3.amazonaws.com/uploads/2024/12/Screenshot-2024-12-20-at-8.09.46-AM.jpg 1416w”>

لقد اقتصرت النماذج العالمية إلى حد كبير على النمذجة المجالات الضيقة. في Genie 1، قدمت Google أسلوبًا لإنشاء مجموعة متنوعة من العوالم ثنائية الأبعاد. قدمت Google Deep Mind لعبة Genie 2، والتي تمثل قفزة كبيرة للأمام بشكل عام. يمكن لـ Genie 2 إنشاء مجموعة كبيرة ومتنوعة من العوالم ثلاثية الأبعاد الغنية.

Genie 2 هو نموذج عالمي، أي أنه يستطيع محاكاة عوالم افتراضية، بما في ذلك عواقب اتخاذ أي إجراء (مثل القفز والسباحة وما إلى ذلك). تم تدريبه على مجموعة بيانات فيديو واسعة النطاق، ومثل النماذج التوليدية الأخرى، يُظهر العديد من القدرات الناشئة على نطاق واسع، مثل التفاعلات مع الكائنات، والرسوم المتحركة المعقدة للشخصيات، والفيزياء، والقدرة على النمذجة وبالتالي التنبؤ بسلوك العوامل الأخرى.

فيما يلي أمثلة لمقاطع فيديو لأشخاص يتفاعلون مع Genie 2. لكل مثال، تتم مطالبة النموذج بصورة واحدة تم إنشاؤها بواسطة Imagen 3، وهو نموذج تحويل النص إلى صورة المتطور من GDM. هذا يعني أنه يمكن لأي شخص وصف العالم الذي يريده في النص، واختيار العرض المفضل لديه لتلك الفكرة، ثم الدخول إلى هذا العالم الذي تم إنشاؤه حديثًا والتفاعل معه (أو تدريب وكيل الذكاء الاصطناعي أو تقييمه فيه). في كل خطوة، يقوم شخص أو وكيل بإجراء إجراء باستخدام لوحة المفاتيح والماوس، ويحاكي Genie 2 الملاحظة التالية. يمكن لـ Genie 2 إنشاء عوالم متسقة لمدة تصل إلى دقيقة، مع استمرار عرض غالبية الأمثلة لمدة تتراوح بين 10 إلى 20 ثانية.

يتحكم العمل في النموذج العالمي

يستجيب Genie 2 بذكاء للإجراءات التي يتم اتخاذها عن طريق الضغط على المفاتيح الموجودة على لوحة المفاتيح، وتحديد الشخصية وتحريكها بشكل صحيح. على سبيل المثال، يجب أن يكتشف نموذجنا أن مفاتيح الأسهم يجب أن تحرك الروبوت، وليس الأشجار أو السحب.

اقرأ المزيد

Google Versus xAI قياس الحوسبة
يستخدم Google Chrome الذكاء الاصطناعي لتحليل الصفحات في ميزة الكشف عن الاحتيال الجديدة

Reactions

0
0
0
0
0
0
بالفعل كان رد فعل لهذا المنصب.

ردود الفعل