- أعطانا مؤتمر Google I/O السنوي للمطورين في كاليفورنيا لمحة عن كل ما قامت به الشركة مؤخرًا – ومن غير المستغرب أن معظمه يدور حول الذكاء الاصطناعي.
- حصل برنامج Chatbot Gemini الأصلي من Google أيضًا على بعض التحديثات المثيرة للاهتمام مثل التكامل مع خرائط Google وGmail. كما تم الإعلان عن أحدث إصدار 1.5 من برنامج chatbot.
- وتخطط الشركة أيضًا لإطلاق Gemini Nano، وهو أصغر نموذج للذكاء الاصطناعي على الإطلاق.
في يوم الثلاثاء (14 مايو)، في مؤتمر مطوري Google I/O السنوي في كاليفورنيا، أعلنت شركة Google عن مجموعة من التحديثات. خلال العرض الذي استمر لمدة ساعتين، شارك الرئيس التنفيذي ساندر بيتشاي الخطط المستقبلية للشركة، والتي يتضمن معظمها الانخراط في الذكاء الاصطناعي.
ومن الجدير بالذكر أن هذه السلسلة من الإعلانات تتبع جوجل كلاود نيكست 2024 المؤتمر الذي عقد الشهر الماضي في لاس فيغاس. هنا، أعلنت Google عن تحديثات الذكاء الاصطناعي لتطبيقات Google Workspace الأساسية بما في ذلك Gmail وGoogle Docs وGoogle Sheets. كما أعلنت أيضًا عن إصدار Gemini الجديد، بالإضافة إلى بعض المنصات مفتوحة المصدر لتعزيز مشاريع الذكاء الاصطناعي وبنيتها التحتية.
هناك الكثير من الأحاديث حول تحديثات Google I/O على الإنترنت، ولكن إذا كنت تبحث عن دليل شامل لاكتشاف كل التفاصيل الكبيرة والصغيرة في الكلمة الرئيسية، فهذا هو المكان المناسب لك. واصل القراءة.
نظرًا لأننا وصلنا إلى عام 2024 الآن، فمن المفهوم أن كل تحديث من شركة تقنية كبرى سيأتي مع مجموعة من التغييرات المتعلقة بالذكاء الاصطناعي. في الواقع، في الـ 110 دقيقة التي استغرقها خطاب جوجل الرئيسي، تم استخدام كلمة “AI” 121 مرة.
إليك ما تفعله Google باستخدام الذكاء الاصطناعي الآن:
جيما 2
بالنسبة لأولئك الذين لا يعرفون، Google Gemma عبارة عن قاعدة بيانات لنماذج الذكاء الاصطناعي التوليدية خفيفة الوزن ومفتوحة المصدر للباحثين والمطورين.
على الرغم من أنه يأتي بأحجام متعددة، إلا أن المطورين كانوا يطلبون منذ فترة طويلة نموذجًا أكبر، وهو موجود بيننا الآن. مرحبًا بجيما 2، مع نموذج جديد ذو 27 مليار معلمة. ومن المتوقع إطلاقه في شهر يونيو الجاري.
دائرة للبحث
هذه هي بسهولة واحدة من الميزات الأكثر إثارة للاهتمام. بدلاً من تبديل التطبيقات للبحث عن شيء ما، يتيح لك ذلك ضع دائرة حول استفسارك ومن ثم يقدم لك إجابة على الفور تقريبا.
لا يهم إذا كان نصًا أو صورة؛ فقط ضع دائرة حولها وستحصل على إجابة دقيقة لاستفسارك.
وقد تم بالفعل توسيع هذه الميزة إلى أكثر من 100 مليون سامسونج وأجهزة جوجل ومن المرجح أن يتضاعف العدد بنهاية العام.
فايربيس جينكيت
وستكون هذه أداة أخرى مفيدة للغاية للمطورين. تمت إضافته إلى منصة Firebase، وسيساعد المطورين بشكل أساسي على إنشاء تطبيقات مدعومة بالذكاء الاصطناعي في JavaScript/TypeScript، مع دعم Go في خطوط الأنابيب ومن المتوقع أن يأتي قريبًا أيضًا.
وأيضًا، نظرًا لأنه مفتوح المصدر ويستخدم ترخيص Apache 2.0، سيتمكن المطورون من إنشاء هذه التطبيقات بشكل أسرع بكثير. كما أنه سيدعم عددًا من أدوات الطرف الثالث. على سبيل المثال، بالإضافة إلى استخدام Gemini، يمكن لمستخدمي Firebase أيضًا العمل مع نماذج أخرى مفتوحة المصدر مثل Ollama.
فيو
من أجل التنافس معها OpenAI سورا، أطلقت Google أداة الذكاء الاصطناعي الخاصة بها والتي يمكنها ذلك أنشئ مقاطع فيديو بدقة 1080 بكسل من مجرد رسالة نصية بسيطة.
على الرغم من أن مدة الفيديو محددة بدقيقة واحدة في الوقت الحالي، إلا أنها تعوض المدة القصيرة من خلال السماح لك بذلك إضافة أنماط سينمائية متعددة مثل المناظر الطبيعية والفواصل الزمنية.
علاوة على ذلك، بمجرد أن يصبح الفيديو جاهزًا، يمكنك أيضًا تعديله وفقًا لاحتياجاتك وتفضيلاتك.
الصورة 3
Imagen هو المولد الأصلي لتحويل النص إلى صورة من Google، وقد حصل للتو على أحدث إصدار له، والذي من المتوقع أن يكون كذلك أكثر دقة في تفسير المطالبات.
سيتم أيضًا استخدام الصور التي تم إنشاؤها بواسطة Imagen 3 أكثر واقعية وموجهة نحو التفاصيل، وبالمقارنة مع Imagen 2، سيكون بها عدد أقل من التشتيتات والأخطاء.
وفي حديثه عن التحديث، قال ديميس هاسابيس، الرئيس التنفيذي لشركة DeepMind: “هذا أيضًا هو أفضل نموذج لدينا حتى الآن لعرض النص، وهو ما يمثل تحديًا لنماذج توليد الصور.”
الذكاء الاصطناعي في البحث
يبدو أن جوجل قررت دمج الذكاء الاصطناعي في كل ما تفعله. والآن، أصبح محرك البحث الشهير الخاص بها يخضع أيضًا لعملية تحول تعتمد على الذكاء الاصطناعي. بالنسبة للمبتدئين، سيتمكن المستخدمون أخيرًا من الوصول إلى AI Overview، وهو في الأساس مقتطف ملخص لأي موضوع تبحث عنه.
جوجل تخطط أيضا لاستخدام الذكاء الاصطناعي لتنظيم نتائج البحث، تحديد الصفحة التي يجب تصنيفها ومكانها.
أخيرًا وليس آخرًا، هناك أيضًا خطة معينة لدمج Gemini (برنامج الدردشة الآلي التابع لشركة Google) مع بحث Google. سيقوم الجوزاء بعد ذلك بدور وكيلك ويساعدك في التخطيط لوجباتك ورحلاتك.
على سبيل المثال، يمكنك كتابة شيء مثل “التخطيط لوجبة عشاء لعيد الأم” وسيزودك بروابط الوصفات ذات الصلة. مثير!
اسأل الصور
من المقرر أن يتم طرح هذه الميزة في وقت لاحق من هذا الصيف وستسمح لك بذلك البحث عبر صور Google باستخدام الأوامر الصوتية.
تجدر الإشارة إلى أن صور Google تسمح لك بالفعل بتبسيط بحثك باستخدام الكلمات الرئيسية. على سبيل المثال، إذا كنت تريد التحقق من جميع الصور المتعلقة بالجبال في مجموعتك، فيمكنك فقط كتابة تلك الكلمة الرئيسية في مربع البحث.
ومع ذلك، فإن تطبيق Ask Photos سيجعل العملية أسهل. يمكنك أن تسألها “أفضل صورة من رحلتي إلى برج إيفل” وسوف تقوم باستعراض جميع الصور ذات الصلة واختيار أفضلها بعد تحليل الإضاءة وجودة الصور.
تطبيقات جوجل
في حين سيطرت الأخبار المتعلقة بالذكاء الاصطناعي على الإعلانات هذا العام، كان لدى عمالقة التكنولوجيا بعض الإعلانات المثيرة للاهتمام لـ Google Play أيضًا.
سيستفيد المطورون من ميزة جديدة تسمى Engage SDK والتي ستسمح لهم بذلك عرض تطبيقاتهم في وضع ملء الشاشة للمستخدمين المحتملين، وبالتالي خلق تجربة غامرة وشخصية.
سيقدم متجر Play أيضًا قوائم متجر مخصصة، والتي بموجبها يمكن للمطورين تحسين قوائمهم لمجموعات الجمهور المختلفة.
تشمل التغييرات المهمة الأخرى في متجر Google Play ما يلي:
- ميزة اكتشاف التطبيق الجديدة
- التحديث إلى Play Integrity API
- تكامل Gemini الذي يمكن استخدامه لكتابة أوصاف التطبيقات المخصصة
وحدات معالجة الموتر من الجيل السادس، شرائح الذكاء الاصطناعي
ومن المقرر أيضًا أن تطلق جوجل الجيل السادس من رقائق TPU AI، الملقبة بـ Trillium، في وقت لاحق من هذا العام. بالمقارنة مع الجيل الخامس، يقدم الإصدار الأحدث أ تعزيز الأداء الحسابي لكل شريحة بمقدار 4.7 أضعاف.
ما يجعل هذه الرقائق أكثر تميزًا هو أنها موفرة للطاقة، وربما أكثر كفاءة في استخدام الطاقة من أي شيء ابتكرته Google من قبل. في الوقت الذي يتزايد فيه الطلب على رقائق الذكاء الاصطناعي تواجه صناعة الذكاء الاصطناعي نقصًا في الرقائق القوية، من الجيد أن نرى Google تركز على المنتجات المستدامة التي يمكن تلبية احتياجاتها من الطاقة على المدى الطويل.
علاوة على ذلك، تم تجهيز هذه الرقائق بالجيل الثالث من SparseCore، والذي يعد، على حد تعبير Google، “مسرعًا متخصصًا لمعالجة عمليات التضمين الكبيرة جدًا الشائعة في أعباء عمل التصنيف المتقدم والتوصيات.” ببساطة، سيساعد ذلك الرقائق على تدريب النماذج بشكل أسرع وبزمن وصول أقل.
مشروع آي دي إكس
مشروع IDX متاح رسميًا في الوضع التجريبي. في السابق، كان متاحًا على أساس الدعوة فقط. سيأتي هذا التحديث الجديد أيضًا مع دمج خرائط جوجل في IDE، مما سيساعد في إضافة ميزات تحديد الموقع الجغرافي إلى تطبيقه.
سيتم أيضًا دمج النظام الأساسي مع Chrome Dev Tools وLighthouse لتبسيط تطبيقات تصحيح الأخطاء.
💡ملحوظة: Project IDX عبارة عن مساحة عمل مدعومة بالذكاء الاصطناعي لتطوير تطبيقات متكاملة ومتعددة المنصات في السحابة.
تحديثات الجوزاء
بالحديث عن المكان الذي توجد فيه معظم المتعة، دعونا الآن نلقي نظرة سريعة على كل ما هو موجود تَوأَم تحديثات (برنامج الدردشة الآلي المملوك لشركة Google والمدعوم بالذكاء الاصطناعي):
الجوزاء 1.5 برو
الإعلان الأكثر أهمية هو أنه تم تحديث برنامج Gemini، وسيتمكن الآن من تحليل المستندات الأطول والتسجيلات الصوتية وتسجيلات الفيديو وقواعد التعليمات البرمجية وتحميل المزيد بفضل أطول نافذة سياق في العالم.
لإعطائك فكرة عن مدى تحسن قدرة الإدخال الآن، يمكن لـ Gemini Advanced استيعاب ما يصل إلى مليون رمز في وقت واحد. يمكن لـ Meta’s Claude 3 الحصول على 300 ألف رمز وGPT-4 128 ألف.
مهم: يشير الرمز إلى أصغر وحدة ناشئة للمدخلات. على سبيل المثال، عند معالجة كلمة ما، سيتم تقسيمها إلى مقاطع. سيتم تقسيم كلمة “Fantastic” إلى “fan” و”tas” و”tic” – وهي ثلاثة رموز.
الجوزاء و Gmail
تحاول Google تبسيط الاتصال من خلال دمج Gemini مع Gmail. يمكنك استخدام أداة الذكاء الاصطناعي من داخل Gmail لصياغة رسائل البريد الإلكتروني والبحث فيها وتلخيصها.
سيكون أيضًا قادرًا على التعامل مع المهام الأكثر تعقيدًا. على سبيل المثال، إذا كان عليك إرجاع منتج اشتريته عبر الإنترنت، فيمكن أن يساعدك ذلك في البحث عن الإيصال وملء نموذج الإرجاع إذا لزم الأمر.
الجوزاء وخرائط جوجل
قررت Google إضافة Gemini إلى خرائط Google، بدءًا من واجهة API للأماكن. سيسمح هذا للمطورين بعرض ملخص للأماكن في تطبيقاتهم ومواقعهم الإلكترونية، مما يساعدهم على توفير الوقت الذي قد يتعين عليهم إنفاقه في كتابة أوصاف مخصصة.
الجوزاء على الروبوت
سيتم قريبًا استبدال مساعد Google المحبوب على نظام Android بـ Gemini، والذي سيوفر تجربة أكثر تكاملاً. على سبيل المثال، يمكن سحب الصور التي تم إنشاؤها بواسطة Gemini مباشرة وإسقاطها في Gmail بدلاً من الاضطرار إلى تنزيلها وإرفاقها بشكل منفصل.
وبالمثل، على YouTube، ستتمكن من استخدام ميزة “اسأل هذا الفيديو” للعثور على معلومات محددة داخل مقطع فيديو بدلاً من الاضطرار إلى مشاهدة الفيديو بأكمله.
الجوزاء لايف
إذا كنت ترغب في التواصل بشكل أفضل مع الجوزاء، فإن Gemini Live سوف تنال إعجابك. انها تسمح لك بتنفيذ محادثات صوتية متعمقة مع chatbot. إن التجربة واقعية جدًا وتشبه الإنسان لدرجة أنه يمكنك مقاطعة الأداة أثناء التحدث لطرح سؤال للمتابعة.
علاوة على ذلك، يمكنك أيضًا التقاط صور ومقاطع فيديو للأشياء المحيطة بك ومشاركتها باستخدام الأداة. سيكون قادرًا على تحليلها وإجراء محادثة كاملة بناءً عليها.
الجوزاء نانو
جوجل جاهزة لتقديم أصغر نموذج للذكاء الاصطناعي على الإطلاق. سيتم دمج Gemini Nano مباشرة في إصدار سطح المكتب من Chrome، بدءًا من Chrome 126. وسيكون هذا مفيدًا في الغالب للمطورين، الذين يمكنهم استخدام هذا النموذج لتحسين ميزات الذكاء الاصطناعي المخصصة لديهم.
ومن المتوقع أيضًا أن يعمل Gemini Nano على تشغيل الأدوات الموجودة مثل أداة “ساعدني في الكتابة” من Workspace Lab في Gmail. علاوة على ذلك، سيتم استخدامه قريبًا أيضًا كشف المكالمات المزعجة.
على سبيل المثال، إذا اتصل بك شخص ما وطلب منك بيانات اعتماد تسجيل الدخول أو كلمات المرور الخاصة بك، فسوف يبدأ تشغيلًا، وستتلقى إشعارًا يفيد بأنك قد تقع فريسة لإحدى عمليات الاحتيال. غش.
على الرغم من عدم وجود تاريخ محدد لإصدار هذه الميزة حتى الآن، إلا أننا نعلم أنها ستكون اختيارية — يمكنك اختيار ما إذا كنت تريد استخدامها أم لا.
سيد مسابقة
إذا كنت تستخدم موقع YouTube لمشاهدة مقاطع الفيديو التعليمية، فقد تكون هذه الميزة مفيدة لك. فهو يتيح لك “رفع يدك”، وطرح أسئلة متابعة حول الموضوع، وإجراء اختبار حول هذا الموضوع.
بالإضافة إلى ذلك، بفضل إمكانيات السياق الطويل لنموذج Gemini، فإنه يعمل بشكل جيد مع مقاطع الفيديو الطويلة أيضًا. ومع ذلك، فمن المخيب للآمال أن يتم طرح هذه الميزة فقط لمستخدمي Android محددين في الولايات المتحدة، على الأقل في الوقت الحالي.
الذكاء الاصطناعي التوليدي للتعلم
قدمت جوجل لي جديد أحد نماذج الذكاء الاصطناعي التوليدية التي تسمى LearnLM، والتي ستركز بشكل خاص على التعلم والتعليم. انها في الأساس مدرس محادثة يمكنه إرشادك في مجموعة متنوعة من المواضيع.
وهذا لن يكون مفيدًا للطلاب فحسب؛ ويمكنه أيضًا مساعدة المعلمين على ابتكار المزيد من المحتوى والأنشطة لجعل دروسهم أكثر تشويقًا.
مرشح “الويب” الجديد لنتائج البحث
ال “الويب” يتيح لك فلتر البحث رؤية الروابط النصية فقط بنفس الطريقة التي يمكنك بها اختيار رؤية الصور أو مقاطع الفيديو أو روابط التسوق فقط على Google.
على الأجهزة المحمولة، سيكون مرشح “الويب” بمثابة إضافة افتراضية إلى جانب المرشحات الأخرى. ولكن على سطح المكتب، ستعتمد المرشحات التي تراها على الموضوع الذي بحثت عنه.
للسياق، قررت جوجل إضافة هذه الميزة بعد أن حصلت على مجموعة من التعليقات المباشرة من المستخدمين الذين يريدون في بعض الأحيان فقط رؤية الروابط الكلاسيكية المستندة إلى النص الأزرق.
يعد Open AI و Meta من أكبر المنافسين لـ Google. بينما كانت جوجل مشغولة بإصدار عدد كبير من الإعلانات في مؤتمر I/O، كان كل من منافسيها على استعداد لمشاريع مثيرة للاهتمام أيضًا.
أطلقت OpenAI للتو أحدث طراز للذكاء الاصطناعي GPT-4o. فهو يوفر محادثات سلسة تشبه المحادثات البشرية، حيث يمكنك التحدث إلى الأداة ذهابًا وإيابًا دون انتظار إنهاء بيانها. انتظر دقيقة! هذا هو بالضبط ما يقول تحديث Gemini Live أنه سيفعله. يبدو أن خطوط المعركة قد تم رسمها بعد ذلك!
يتيح لك GPT-4o أيضًا إجراء عمليات بحث على الويب من داخل الأداة. في الأساس، عندما لا يكون لديه إجابة للمطالبة، فإنه يقوم بإنشاء استعلام وإدخاله في محرك بحث باستخدام كلمتك الرئيسية ثم استرداد النتائج الأكثر صلة.
علاوة على ذلك، يمكنك أيضًا استخدامه ل قم بإنشاء إصداراتك الخاصة من ChatGPT. ومن الجدير بالذكر أنه تمت إضافة الكثير من الميزات الجديدة بالإضافة إلى تلك المذكورة أعلاه. لقد قمت بتغطية كل منهم في تغطيتي المتعمقة ل إطلاق GPT-4o.
بالحديث عن ميتا، فقد أصدرت أ مساعد الذكاء الاصطناعي الجديد مدعوم من Llama 3 الشهر الماضي. ويتم دمج هذا عبر جميع منصات Meta الرئيسية، بما في ذلك واتساب، إنستغرام، و فيسبوك.
عملية التحرير لدينا
تقرير التقنية السياسة التحريرية يتمحور حول توفير محتوى مفيد ودقيق يقدم قيمة حقيقية لقرائنا. نحن نعمل فقط مع الكتاب ذوي الخبرة الذين لديهم معرفة محددة في المواضيع التي يغطونها، بما في ذلك أحدث التطورات في التكنولوجيا، والخصوصية عبر الإنترنت، والعملات المشفرة، والبرمجيات، وأكثر من ذلك. تضمن سياستنا التحريرية أن يتم بحث كل موضوع وتنظيمه من قبل المحررين الداخليين لدينا. نحن نحافظ على معايير صحفية صارمة، وكل مقال مكتوب بنسبة 100% المؤلفين الحقيقيين.