من فضلك تسجيل الدخول أو تسجيل لتفعل ذلك.

تم الآن تغيير العلامة التجارية لبرنامج الدردشة التوليدي Bard الذي يعمل بالذكاء الاصطناعي من Google ليصبح Gemini، أعلن عملاق التكنولوجيا يوم الخميس.

سيتم تسمية الإصدار المحدث من Bard باسم Gemini Advanced، والذي يمكنك الوصول إليه باستخدام تطبيقات الهاتف المحمول على كل من Android وiOS.

تمت إعادة بناء برنامج الدردشة الآلي، مما يوفر للمستهلكين والمؤسسات أول منصة ذكاء اصطناعي توليدية متعددة الوسائط في الصناعة والتي لا تعتمد فقط على النص لتوليد استجابات شبيهة بالاستجابات البشرية.

ومن المقرر أيضًا أن تطلق Google Gemini Ultra، وهو المستوى المتقدم لنموذج لغة الذكاء الاصطناعي الأساسي الذي يعمل على تشغيل برنامج الدردشة الآلية.

يقول الخبراء إن Google Now يقود سباق GenAI

ووصف جارتنر، نائب الرئيس المحلل شيراج ديكاتي تَوأَم باعتبارها “صفقة كبيرة حقًا”، مشيرًا إلى أنه حاليًا النموذج الأصلي الوحيد للذكاء الاصطناعي متعدد الوسائط المتوفر.

عند دعمه بنموذج متعدد الوسائط، يكون محرك الذكاء الاصطناعي التوليدي الواحد قادرًا على أداء المهام الفردية بدقة محسنة. وذلك لأنه يسمح للمحرك بالتعلم من المزيد من الموارد، وهو الأمر الذي وضع Google الآن في مقدمة منافسيها في سباق genAI.

تلقت جهود Google لأخذ زمام المبادرة في سباق الذكاء الاصطناعي التوليدي دفعة كبيرة في ديسمبر 2024، عندما كشف عملاق التكنولوجيا عن نموذج Gemini AI لأول مرة.

بعد إطلاق OpenAI ChatGPT، سارعت جوجل إلى إطلاق بارد كثقل موازن في فبراير من العام الماضي. ومع ذلك، ظل OpenAI متقدمًا على Google لفترة طويلة، مع استمرار ChatGPT في إثبات أنه أكثر قوة.

يعد برنامج Copilot AI من Microsoft، والذي يعتمد على نفس نموذج اللغة الكبير (LLM) مثل ChatGPT، أحد أقوى منافسي Bard. ومع ذلك، يعتقد ديكاتي أن “جوجل لم تعد تلعب دور اللحاق بالركب. والآن أصبح الأمر على العكس من ذلك”.

وشددت جوجل على قدرات النموذج المتعددة الوسائط، والتي تمكنه من تجميع أنواع مختلفة من المعلومات، مثل النص والتعليمات البرمجية والصور والصوت والفيديو للمدخلات والمخرجات.

محركات الذكاء الاصطناعي الرئيسية الأخرى مثل PaLM 2 من Google، وGPT من OpenAI، و اللاما 2 من ميتا هم LLM فقط، مما يعني أنه لا يمكن تدريبهم إلا على النص.

قارن Dekate تعدد الوسائط بمشاهدة فيلم، والذي يتضمن مشاهدة الفيديو والاستماع إلى الصوت وقراءة النص من الترجمة في نفس الوقت. وأوضح أنه من ناحية أخرى، فإن عارضي LLM فقط يشبهون تجربة فيلم من خلال قراءة السيناريو فقط.

من المحتمل أن تخلق الوسائط المتعددة لـ Gemini AI تجربة غامرة وشخصية. وأضاف ديكاتي أن جوجل تمتلك القدرة على تغيير السوق إذا كان بإمكانها السماح للمؤسسات والمستهلكين بتجربته.

في حين أن LLMs جيدة بما يكفي لمهام تحويل النص إلى نص البسيطة، إلا أن المهام الأكثر تنوعًا وتعقيدًا تتطلب نماذج متعددة الوسائط.

على سبيل المثال، يمكن لشركة رعاية صحية استخدام محرك genAI متعدد الوسائط لإنشاء روبوت دردشة يمكنه أخذ مدخلات من عمليات فحص فيديو التصوير بالرنين المغناطيسي والصور الإشعاعية والمقتطفات الصوتية للطبيب. وهذا من شأنه أن يزيد بشكل كبير من دقة التشخيص ونتائج العلاج.

شهد عام 2023 ظهور نماذج الذكاء الاصطناعي الخاصة بمهمة محددة، مثل تحويل النص إلى نص، وتحويل النص إلى صورة، وتحويل النص إلى فيديو، وتحويل الصورة إلى نص، والمزيد.

دينيس هاسابيس، الرئيس التنفيذي لشركة جوجل ديب مايند، سلط الضوء على تعدد استخدامات Gemini وكيف كان أداءه ممتازًا في التطبيقات المختلفة.

في الوقت الذي كان فيه تدريب Gemini AI على وشك الانتهاء، اكتشف فريق Deepmind الذي يعمل عليه أنه تجاوز بالفعل جميع نماذج الذكاء الاصطناعي الأخرى في العديد من المعايير الرئيسية.

اقرأ أكثر

HSBC وGoogle Cloud يتعاونان لدفع نمو الشركات الناشئة في مجال تكنولوجيا المناخ
خبير العقارات بيتر بي ماسون يخطو خطواته نحو عام 2024 بفوزه بجائزة ThreeBestRated® لمساهمته في الصناعة

Reactions

0
0
0
0
0
0
بالفعل كان رد فعل لهذا المنصب.

ردود الفعل