تطلق OpenAI وGoogle مساعدين ذكاء اصطناعي فائق الشحن. وإليك كيف يمكنك تجربتها.

أعلنت كل من Google وOpenAI هذا الأسبوع عن تصميم مساعدين ذكاء اصطناعي فائق الشحن: أدوات يمكنها التحدث معك في الوقت الفعلي والتعافي عندما تقاطعهم، وتحليل محيطك عبر الفيديو المباشر، وترجمة المحادثات بسرعة.

حققت شركة OpenAI أول نجاح لها يوم الإثنين، عندما أطلقت نموذجها الرائد الجديد GPT-4o. أظهر العرض المباشر أنه يقرأ قصصًا قبل النوم ويساعد في حل مسائل الرياضيات، كل ذلك بصوت يبدو مخيفًا مثل صديقة خواكين فينيكس التي تعمل بالذكاء الاصطناعي في الفيلم. ها (سمة غير ضائع على الرئيس التنفيذي سام التمان).

أعلنت جوجل يوم الثلاثاء عن أدواتها الجديدة، بما في ذلك مساعد المحادثة المسمى Gemini Live، والذي يمكنه القيام بالعديد من الأشياء نفسها. وكشفت أيضًا أنها تقوم ببناء نوع من وكيل الذكاء الاصطناعي “يقوم بكل شيء”، وهو قيد التطوير حاليًا ولكن لن يتم إصداره حتى وقت لاحق من هذا العام.

ستتمكن قريبًا من الاستكشاف بنفسك لقياس ما إذا كنت ستلجأ إلى هذه الأدوات في روتينك اليومي بالقدر الذي يأمله صانعوها، أو ما إذا كانت أشبه بخدعة حفلة خيال علمي تفقد سحرها في النهاية. إليك ما يجب أن تعرفه حول كيفية الوصول إلى هذه الأدوات الجديدة، وما قد تستخدمها من أجله، وكم ستكلف ذلك.

OpenAI GPT-4o

ما هو قادر على: يمكن للنموذج التحدث معك في الوقت الفعلي، مع تأخير استجابة يبلغ حوالي 320 مللي ثانية، وهو ما تقول OpenAI إنه يتساوى مع المحادثة البشرية الطبيعية. يمكنك أن تطلب من النموذج تفسير أي شيء توجه إليه كاميرا هاتفك الذكي، ويمكنه تقديم المساعدة في مهام مثل البرمجة أو ترجمة النص. يمكنه أيضًا تلخيص المعلومات وإنشاء الصور والخطوط والعروض ثلاثية الأبعاد.

كيفية الوصول إليه: تقول OpenAI إنها ستبدأ في طرح ميزات النص والرؤية الخاصة بـ GPT-4o في واجهة ويب بالإضافة إلى تطبيق GPT، لكن لم يتم تحديد موعد. وتقول الشركة إنها ستضيف الوظائف الصوتية في الأسابيع المقبلة، على الرغم من أنها لم تحدد موعدًا محددًا لذلك أيضًا. يمكن للمطورين الوصول إلى ميزات النص والرؤية في واجهة برمجة التطبيقات (API) الآن، ولكن سيتم تشغيل الوضع الصوتي فقط “لمجموعة صغيرة” من المطورين في البداية.

كم تكلف: سيكون استخدام GPT-4o مجانيًا، لكن OpenAI ستضع حدودًا قصوى لمدى استخدام النموذج قبل أن تحتاج إلى الترقية إلى خطة مدفوعة. أولئك الذين ينضمون إلى إحدى خطط OpenAI المدفوعة، والتي تبدأ بسعر 20 دولارًا شهريًا، سيكون لديهم سعة أكبر بخمس مرات على GPT-4o.

جوجل الجوزاء لايف

ما هو الجوزاء لايف؟ هذا هو منتج Google الأكثر مقارنة بمنتج GPT-4o، وهو إصدار من نموذج الذكاء الاصطناعي الخاص بالشركة والذي يمكنك التحدث معه في الوقت الفعلي. تقول Google أنك ستتمكن أيضًا من استخدام الأداة للتواصل عبر الفيديو المباشر “في وقت لاحق من هذا العام”. تعد الشركة بأنه سيكون بمثابة مساعد محادثة مفيد لأشياء مثل التحضير لمقابلة عمل أو التدرب على إلقاء خطاب.

كيفية الوصول إليه: سيتم إطلاق Gemini Live في “الأشهر المقبلة” عبر خطة Google المتميزة للذكاء الاصطناعي، Gemini Advanced.

كم تكلف: تقدم Gemini Advanced فترة تجريبية مجانية مدتها شهرين وتتكلف 20 دولارًا شهريًا بعد ذلك.

لكن مهلا، ما هو مشروع أسترا؟ Astra هو مشروع لبناء وكيل الذكاء الاصطناعي للقيام بكل شيء، والذي كان تجريبي في مؤتمر Google I/O ولكن لن يتم إصداره إلا في وقت لاحق من هذا العام.

وقال أوريول فينيالس، نائب رئيس الأبحاث في Google DeepMind، إن الناس سيكونون قادرين على استخدام Astra من خلال هواتفهم الذكية وربما أجهزة الكمبيوتر المكتبية، لكن الشركة تستكشف خيارات أخرى أيضًا، مثل دمجها في النظارات الذكية أو الأجهزة الأخرى. مراجعة تكنولوجيا معهد ماساتشوستس للتكنولوجيا.

ايهما افضل؟

من الصعب معرفة ذلك دون الحصول على الإصدارات الكاملة من هذه النماذج بأنفسنا. عرضت Google مشروع Astra من خلال مقطع فيديو مصقول، في حين اختارت OpenAI إطلاق GPT-4o لأول مرة من خلال عرض حي يبدو أكثر واقعية، ولكن في كلتا الحالتين، طُلب من النماذج القيام بأشياء من المحتمل أن المصممين مارسوها بالفعل. سيأتي الاختبار الحقيقي عندما يتم طرحها لأول مرة لملايين المستخدمين ذوي المتطلبات الفريدة.

ومع ذلك، إذا قارنت OpenAI المنشورة أشرطة فيديو مع Google، تبدو الأداتان الرائدتان متشابهتين جدًا، على الأقل من حيث سهولة الاستخدام. للتعميم، يبدو أن GPT-4o متقدم قليلاً في الصوت، حيث يُظهر أصواتًا واقعية، وتدفقًا للمحادثة، وحتى الغناء، في حين يُظهر Project Astra قدرات بصرية أكثر تقدمًا، مثل القدرة على “تذكر” المكان الذي تركت فيه نظارتك. قد يعني قرار OpenAI بطرح الميزات الجديدة بسرعة أكبر أن منتجها سيحصل على استخدام أكبر في البداية من منتج Google، والذي لن يكون متاحًا بالكامل حتى وقت لاحق من هذا العام. من السابق لأوانه معرفة النموذج الذي “يهلوس” بالمعلومات الكاذبة بشكل أقل أو يخلق استجابات أكثر فائدة.

هل هم آمنون؟

يقول كل من OpenAI وGoogle إن نماذجهما تم اختبارها جيدًا: تقول OpenAI إن GPT-4o تم تقييمه من قبل أكثر من 70 خبيرًا في مجالات مثل المعلومات الخاطئة وعلم النفس الاجتماعي، وقالت Google إن Gemini “لديه تقييمات السلامة الأكثر شمولاً لأي نموذج من نماذج Google للذكاء الاصطناعي”. التاريخ، بما في ذلك التحيز والسمية.”

لكن هذه الشركات تعمل على بناء مستقبل حيث تقوم نماذج الذكاء الاصطناعي بالبحث عن معلومات العالم وفحصها وتقييمها حتى نتمكن من تقديم إجابة موجزة لأسئلتنا. وحتى أكثر من ذلك مع برامج الدردشة الأبسط، فمن الحكمة أن تظل متشككًا بشأن ما يقولونه لك.

تقارير إضافية من ميليسا هيكيلا.

اقرأ أكثر

تطلق OpenAI وGoogle مساعدين ذكاء اصطناعي فائق الشحن. وإليك كيف يمكنك تجربتها.

OpenAI GPT-4o

جوجل الجوزاء لايف

ايهما افضل؟

هل هم آمنون؟

Reactions

ردود الفعل