لقد قمت بمطابقة فلاش Gemini 2.0 الجديد من Google مقابل طراز 1.5 القديم لمعرفة ما إذا كان الأمر أفضل بكثير

(الصورة الائتمان: جوجل)

جوجل يريدك أن تعرف ذلك”inline-link” HREF=”https://www.techradar.com/computing/artificial-intelligence/google-geminis-new-model-is-the-brainstorming-ai-partner-youve-been-looking-for” البيانات قبل أن تتولى المحمل=”https://www.techradar.com/computing/artificial-intelligence/google-geminis-new-model-is-the-brainstorming-ai-partner-youve-been-looking-for”> Gemini 2.0 Flash يجب أن يكون chatbot من الذكاء الاصطناعي. يضم النموذج سرعة أكبر ، وأدمغة أكبر ، والحس السليم أكثر من سابقتها ، Gemini 1.5 Flash. بعد وضع الجوزاء فلاش 2.0″inline-link” HREF=”https://www.techradar.com/computing/artificial-intelligence/google-is-bragging-about-gemini-2-0-flash-but-how-does-it-compare-to-chatgpt-for-casual-ai-chatbot-users” الهدف=”_blank” البيانات قبل أن تتولى المحمل=”https://www.techradar.com/computing/artificial-intelligence/google-is-bragging-about-gemini-2-0-flash-but-how-does-it-compare-to-chatgpt-for-casual-ai-chatbot-users”> من خلال خطواتها ضد chatgpt، قررت أن أرى كيف يقارن النموذج المفضل الجديد من Google مع شقيقه الأقدم.

كما هو الحال مع التوفيق السابق ، قمت بإعداد المبارزة مع بعض المطالبات التي بنيت حول الطرق الشائعة التي قد يوظفها أي شخص الجوزاء ، بما في ذلك أنا. هل يمكن أن يقدم Gemini 2.0 Flash نصيحة أفضل لتحسين حياتي ، أو شرح موضوع معقد لا أعرفه شيئًا ما بطريقة يمكن أن أفهمها ، أو تحديد الإجابة على مشكلة منطقية معقدة وشرح المنطق؟ إليكم كيف ذهب الاختبار.

الخيارات الإنتاجية

“Google Gemini 1.5/2.0 Test” التحميل=”lazy” SRC=”https://cdn.mos.cms.futurecdn.net/jrYUSoCwsBvDtQgFD9DkM9.png” وسائل الإعلام البيانات=”https://cdn.mos.cms.futurecdn.net/jrYUSoCwsBvDtQgFD9DkM9.png”>

“copyrightHolder”> (الصورة الائتمان: لقطات شاشة من Google Gemini)

إذا كان هناك شيء واحد يجب أن يكون AI قادرًا على القيام به ، فهو يقدم نصيحة مفيدة. ليس فقط النصائح العامة ، ولكن مع الأطراف القابلة للتطبيق ومفيدة على الفور. لذلك سألت كلا الإصدارين نفس السؤال: “I want to be more productive but also have better work-life balance. What changes should I make to my routine?”

كان Gemini 2.0 أسرع بشكل ملحوظ في الرد ، حتى لو كان أسرع أو ثانيتين فقط. بالنسبة للمحتوى الفعلي ، كان كلاهما بعض النصائح الجيدة. انهار النموذج 1.5 أربع أفكار كبيرة مع نقاط الرصاص ، بينما ذهب 2.0 للحصول على قائمة أطول من 10 أفكار شرح في فقرات قصيرة.

أعجبتني بعض الاقتراحات الأكثر تحديدًا من 1.5 ، مثل مبدأ Pareto ، ولكن إلى جانب ذلك ، شعر 1.5 بأنه كثيرًا من إعادة تشكيل المفهوم الأولي ، في حين شعر 2.0 أنه أعطاني نصيحة أكثر دقة في الحياة لكل اقتراح. إذا كان صديقًا يسألني عن المشورة بشأن هذا الموضوع ، فأنا بالتأكيد سأذهب مع إجابة 2.0.

ما الأمر مع Wi-Fi؟

“Google Gemini 1.5/2.0 Test” التحميل=”lazy” SRC=”https://cdn.mos.cms.futurecdn.net/isaiKZHGxMGbKDxryN4VP9.png” وسائل الإعلام البيانات=”https://cdn.mos.cms.futurecdn.net/isaiKZHGxMGbKDxryN4VP9.png”>

“copyrightHolder”> (الصورة الائتمان: لقطات شاشة من Google Gemini)

جزء كبير مما يجعل مساعد AI مفيدًا ليس فقط مقدار ما يعرفه – إنه مدى جودة شرح الأشياء بطريقة تنقر عليها بالفعل. التفسير الجيد لا يتعلق فقط بإدراج الحقائق ؛ يتعلق الأمر بجعل شيء معقد يشعر بديهية. بالنسبة لهذا الاختبار ، أردت أن أرى كيف تعاملت كلا الإصدارين من الجوزاء إلى تحطيم موضوع فني بطريقة كانت ذات صلة بالحياة اليومية. سألت: “اشرح كيف يعمل Wi-Fi ، ولكن بطريقة منطقية بالنسبة لشخص يريد فقط معرفة سبب بطيئ الإنترنت.”

ذهب Gemini 1.5 مع مقارنة Wi-Fi بالراديو ، وهو وصف أكثر من القياس الذي اقترحه أنه كان يصنعه. إن استدعاء جهاز التوجيه DJ هو أمر تمتد أيضًا ، على الرغم من أن نصيحة تحسين الإشارة كانت متماسكة على الأقل.

اشترك في الأخبار العاجلة ، والمراجعات ، والرأي ، وصفقات التقنية العليا ، وأكثر من ذلك.

استخدم Gemini 2.0 استعارة أكثر تفصيلاً تشمل نظام توصيل المياه مع أجهزة مثل النباتات التي تتلقى المياه. مددت الذكاء الاصطناعى الاستعارة لشرح ما قد يسبب مشاكل ، مثل الكثير “plants” للمياه المتاحة والأنابيب المسدودة التي تمثل قضايا المزود. ال “sprinkler interference” كانت المقارنة أضعف بكثير ، ولكن كما هو الحال مع الإصدار 1.5 ، كان لدى Gemini 2.0 نصيحة عملية لتحسين إشارة Wi-Fi. على الرغم من كونها أطول بكثير ، ظهرت إجابة 2.0 أسرع قليلاً.

قنبلة منطقية

“Google Gemini 1.5/2.0 Test” التحميل=”lazy” SRC=”https://cdn.mos.cms.futurecdn.net/8bKwn4BF7MbDYX5qxLErL9.png” وسائل الإعلام البيانات=”https://cdn.mos.cms.futurecdn.net/8bKwn4BF7MbDYX5qxLErL9.png”>

“copyrightHolder”> (الصورة الائتمان: لقطات شاشة من Google Gemini)

للاختبار الأخير ، أردت أن أرى مدى تعامل كلا الإصدارين مع المنطق والمنطق. من المفترض أن تكون نماذج الذكاء الاصطناعي جيدة في الألغاز ، ولكن الأمر لا يتعلق فقط بالحصول على الإجابة بشكل صحيح – إنه يتعلق بما إذا كان بإمكانهم شرح سبب صحة الإجابة بطريقة منطقية بالفعل. أعطيتهم لغز كلاسيكي: “You have two ropes. Each takes exactly one hour to burn, but they don’t burn at a consistent rate. How do you measure exactly 45 minutes?”

أعطى كلا النموذجين من الناحية الفنية الإجابة الصحيحة حول كيفية قياس الوقت ولكن بطريقة مختلفة قدر الإمكان في قيود اللغز وصحتها. إجابة Gemini 2.0 أقصر ، وأمر بطريقة أسهل في الفهم ، وتشرح نفسها بوضوح على الرغم من إيجازها. كانت إجابة Gemini 1.5 تتطلب تحليلًا أكثر حذراً ، وشعرت الخطوات بعيدة عن الترتيب. كانت الصياغة مربكة أيضًا ، خاصةً عندما قيل لإضاءة الحبل المتبقي “at one end” عندما كان هذا يعني أنه لم يضيء حاليًا.

لمثل هذه الإجابة الواردة ، تميز Gemini 2.0 باعتباره أفضل بشكل ملحوظ لحل هذا النوع من اللغز المنطقي.

Gemini 2.0 للسرعة والوضوح

بعد اختبار المطالبات ، كانت الاختلافات بين Gemini 1.5 Flash و Gemini 2.0 Flash واضحة. على الرغم من أن 1.5 لم يكن بلا فائدة بالضرورة ، إلا أنه يبدو أنه يكافح مع الخصوصية وإجراء مقارنات مفيدة. الشيء نفسه ينطبق على انهيار المنطق. إذا تم تطبيقها على رمز الكمبيوتر ، يجب عليك القيام بالكثير من التنظيف لبرنامج يعمل.

لم يكن فلاش Gemini 2.0 أسرع فحسب ، بل كان أكثر إبداعًا في إجاباته. بدا الأمر أكثر قدرة على التشبيهات والمقارنات الخيالية وأكثر وضوحًا في شرح منطقها. هذا لا يعني أنه مثالي. انهارت تشبيه المياه قليلاً ، وكانت نصيحة الإنتاجية قد استخدمت المزيد من الأمثلة أو الأفكار الملموسة.

ومع ذلك ، كان الأمر سريعًا جدًا ويمكن أن يزيل تلك المشكلات مع القليل من المحادثة المتوقفة. Gemini 2.0 Flash ليس هو مساعد AI النهائي والمثالي ، لكنه بالتأكيد خطوة في الاتجاه الصحيح لجوجل لأنه يسعى إلى التفوق على نفسه والمنافسين مثل”inline-link” HREF=”https://www.techradar.com/tag/chatgpt” البيانات-Auto-Tag-Linker=”true” البيانات قبل أن تتولى المحمل=”https://www.techradar.com/tag/chatgpt”> chatgpt.

قد تعجبك أيضًا

إريك هال شوارتز هو كاتب مستقل في TechRadar ولديه خبرة تزيد عن 15 عامًا في تغطية تقاطع العالم والتكنولوجيا. على مدار السنوات الخمس الماضية ، شغل منصب الكاتب الرئيسي لـ VoiceBot.ai وكان في الحافة الأمامية للإبلاغ عن الذكاء الاصطناعي ونماذج اللغة الكبيرة. لقد أصبح منذ ذلك الحين خبيرًا في منتجات نماذج الذكاء الاصطناعى التوليدي ، مثل chatgpt من Openai ، و Claude’s Claude ، و Google Gemini ، وكل أداة وسائط صناعية أخرى. تدير تجربته سلسلة الوسائط ، بما في ذلك الأحداث المطبوعة والرقمية والبث والبث. الآن ، يواصل سرد القصص التي يريدها الناس ويحتاجون إلى سماعها عن مساحة الذكاء الاصطناعي المتطورة بسرعة وتأثيرها على حياتهم. يقع إريك في مدينة نيويورك.

المزيد عن الذكاء الاصطناعي

الأكثر شعبية

اقرأ المزيد

لقد قمت بمطابقة فلاش Gemini 2.0 الجديد من Google مقابل طراز 1.5 القديم لمعرفة ما إذا كان الأمر أفضل بكثير

الخيارات الإنتاجية

ما الأمر مع Wi-Fi؟

قنبلة منطقية

Gemini 2.0 للسرعة والوضوح

قد تعجبك أيضًا

الأكثر شعبية

Reactions

ردود الفعل