أعلنت جوجل نموذجها الجديد ‘Gemini Omni’ ضمن فعاليات مؤتمر المطورين Google I/O 2026، وتصفه الشركة بأنه نموذج قادر على ‘إنشاء أي شيء انطلاقًا من أي نوع من المدخلات’، مع تركيز أولي على توليد مقاطع الفيديو بالاعتماد على النصوص والصور والصوت وحتى المقاطع المصورة.
مواصفات Gemini Omni
وتطرح الشركة الإصدار الأول ‘Gemini Omni Flash’ ابتداءً من اليوم داخل تطبيق Gemini، بالإضافة إلى منصتَي Flow ويوتيوب Shorts لمشتركي باقات Google AI Plus و Pro و Ultra حول العالم.
وتقدّم جوجل النموذج الجديد بوصفه خطوة متقدمة مقارنةً بأدواتها السابقة مثل Nano Banana ونموذج توليد الفيديو Veo 3.1؛ إذ يتيح للمستخدم إدماج النصوص والصور والصوت والفيديو في طلب واحد لإنتاج مقاطع فيديو عالية الجودة تستند إلى معرفة Gemini بالعالم الحقيقي.
مزايا Gemini Omni
- يدعم نطاقًا أوسع من المدخلات مع إمكان تعديل المقاطع عبر محادثة طبيعية متواصلة.
- يفهم بصورة أفضل العوامل الفيزيائية مثل الجاذبية والطاقة الحركية وديناميكيات السوائل.
- يمنح مقاطع الفيديو مظهرًا أكثر واقعية مقارنةً بنماذج توليد الفيديو الحالية.
ومن جهة أخرى، يتيح Gemini Omni إنشاء شخصية رقمية تحاكي المستخدم بصوته وشكله اعتمادًا على عينات صوتية وصور شخصية، وهي ميزة قد تثير مخاوف تتعلق بالخصوصية والتزييف العميق.
وتقول جوجل إنها تعتمد ‘سياسات واضحة’ للحد من إساءة استخدام أدوات الذكاء الاصطناعي، كما تختبر حاليًا أدوات تعديل الصوت والكلام قبل طرحها بصورة أوسع.