الائتمان: VentureBeat مصنوع من Midjourney
انضم إلى النشرات الإخبارية اليومية والأسبوعية للحصول على أحدث التحديثات والمحتوى الحصري على تغطية الذكاء الاصطناعى الرائدة في الصناعة.”https://venturebeat.com/newsletters/?utm_source=VBsite&utm_medium=desktopNav” نوع البيانات=”link” معرف البيانات=”https://venturebeat.com/newsletters/?utm_source=VBsite&utm_medium=desktopNav”> تعرف على المزيد
Google Cloud كشف النقاب عن الجيل السابع”https://blog.google/technology/ai/difference-cpu-gpu-tpu-trillium/”> وحدة معالجة الموتر (TPU) دعا”https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/”> Ironwood يوم الأربعاء ، تسارع مخصص من الذكاء الاصطناعي الذي تزعمه الشركة تقدم أكثر من 24 ضعف قوة الحوسبة لأسرع الحاسبات الفائقة في العالم عند نشرها على نطاق واسع.
الشريحة الجديدة ، تم الإعلان عنها في”https://venturebeat.com/ai/google-cloud-next-25-new-ai-chips-and-agent-ecosystem-challenge-microsoft-and-amazon/”> Google Cloud Next ’25، يمثل محورًا كبيرًا في استراتيجية تطوير رقائق الذكاء الاصطناعى من Google. على الرغم من أن الأجيال السابقة من TPUs تم تصميمها بشكل أساسي لكل من أعباء عمل التدريب والاستدلال ، فإن Ironwood هو أول مصمم خصيصًا للاستدلال-عملية نشر نماذج الذكاء الاصطناعى المدربين لإنشاء تنبؤات أو توليد استجابات.
“تم تصميم Ironwood لدعم هذه المرحلة التالية من الذكاء الاصطناعى ومتطلباتها الحاسوبية والاتصال الهائلة” ، قال أمين فهدات ، نائب رئيس Google والمدير العام لـ ML و Systems و Cloud AI ، في مؤتمر صحفي افتراضي قبل الحدث. “هذا ما نسميه” عمر الاستدلال “حيث سيقوم وكلاء الذكاء الاصطناعي باسترداد وإنشاء بيانات بشكل استباقي لتقديم رؤى وإجابات تعاونية ، وليس فقط البيانات.”
تحطيم الحواجز الحسابية: داخل Ironwood’s 42.5 exaflops من عضلة الذكاء الاصطناعي
المواصفات الفنية ل”https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/”> Ironwood لافت للنظر. عندما يتم تحجيمها إلى 9،216 رقائق لكل جراب ، يقدم Ironwood 42.5 exaflops من قوة الحوسبة – القزم”https://asc.llnl.gov/exascale/el-capitan”> El Capitan1.7 exaflops ، حاليا أسرع الحاسوب الخارق في العالم. توفر كل رقاقة من Ironwood فردية حساب الذروة من 4،614 teraflops.
يتميز Ironwood أيضًا بالذاكرة الكبيرة وعرض النطاق الترددي. كل شريحة تأتي مع 192 جيجابايت من ذاكرة النطاق الترددي العالي (HBM) ، أكثر من ست مرات”https://cloud.google.com/blog/products/compute/introducing-trillium-6th-gen-tpus”> trillium، تم الإعلان عن الجيل السابق من Google TPU العام الماضي. يصل عرض النطاق الترددي للذاكرة إلى 7.2 terabits في الثانية الواحدة لكل شريحة ، وهو تحسن 4.5x على trillium.
ربما الأهم من ذلك في عصر مراكز البيانات المقيدة على الطاقة ،”https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/”> Ironwood يقدم ضعف الأداء لكل واط مقارنة بـ”https://cloud.google.com/blog/products/compute/introducing-trillium-6th-gen-tpus”> trillium، وهو ما يقرب من 30 مرة أكثر كفاءة في الطاقة من أول سحابة من Google من 2018.
“في الوقت الذي تكون فيه الطاقة المتاحة هي واحدة من القيود المفروضة على تقديم قدرات الذكاء الاصطناعي ، نقدم قدرة أكبر بكثير لكل واط لأعباء عمل العملاء” ، أوضح Vahdat.
من بناء النماذج إلى “آلات التفكير”: لماذا يركز تركيز الاستدلال على Google الآن
يمثل التركيز على الاستدلال بدلاً من التدريب نقطة انعطاف كبيرة في الجدول الزمني لمنظمة العفو الدولية. لسنوات ، تم تثبيت الصناعة على بناء نماذج أساسية ضخمة بشكل متزايد ، مع تنافس الشركات بشكل أساسي على حجم المعلمة وقدرات التدريب. يشير محور Google إلى تحسين الاستدلال إلى أننا ندخل مرحلة جديدة حيث تتولى كفاءة النشر وقدرات التفكير مركز الصدارة.
هذا الانتقال منطقي. يحدث التدريب مرة واحدة ، لكن عمليات الاستدلال تحدث مليارات المرات يوميًا حيث يتفاعل المستخدمون مع أنظمة الذكاء الاصطناعي. ترتبط اقتصاديات الذكاء الاصطناعى بشكل متزايد بتكاليف الاستدلال ، خاصة وأن النماذج تنمو أكثر تعقيدًا ومكثفة من الناحية الحسابية.
خلال المؤتمر الصحفي ، كشفت Vahdat أن Google لاحظت زيادة 10x على أساس سنوي في الطلب على حساب الذكاء الاصطناعى على مدى السنوات الثماني الماضية-وهو عامل مذهل يبلغ 100 مليون. لا مبلغ”https://www.investopedia.com/terms/m/mooreslaw.asp#:~:text=Moore’sLawstatesthatthenumberoftransistorsona,becameknownasMoore’sLaw.”> قانون مور يمكن أن يرضي التقدم منحنى النمو هذا دون بنيات متخصصة مثل Ironwood.
ما هو ملحوظ بشكل خاص هو التركيز على “نماذج التفكير” التي تؤدي مهام التفكير المعقدة بدلاً من التعرف على الأنماط البسيطة. يشير هذا إلى أن Google ترى أن مستقبل الذكاء الاصطناعى ليس فقط في النماذج الأكبر ، ولكن في النماذج التي يمكن أن تحطم المشكلات ، والسبب من خلال خطوات متعددة ، ومحاكاة عمليات التفكير التي تشبه الإنسان بشكل أساسي.
محرك تفكير Gemini: كيف تستفيد طرز Google التالية من الأجهزة المتقدمة من Google
تقوم Google بوضع Ironwood كأساس لنماذج الذكاء الاصطناعى الأكثر تقدماً ، بما في ذلك”https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/”> Gemini 2.5، التي تصفها الشركة بأنها “إمكانات التفكير المدمجة أصلاً”.
في المؤتمر ، أعلنت Google أيضًا”https://deepmind.google/technologies/gemini/flash/”> Gemini 2.5 Flash، نسخة أكثر فعالية من حيث التكلفة من نموذجها الرئيسي الذي “يعدل عمق التفكير بناءً على تعقيد موجه”. على الرغم من أن Gemini 2.5 Pro مصمم لحالات الاستخدام المعقدة مثل اكتشاف المخدرات والنمذجة المالية ، إلا أن Gemini 2.5 Flash في وضع للتطبيقات اليومية حيث تكون الاستجابة أمرًا بالغ الأهمية.
كما أظهرت الشركة مجموعة كاملة من نماذج الوسائط التوليفية ، بما في ذلك النص إلى صورة ، ونص من نص إلى الفيديو ، وقدرة نصية إلى MUSIC التي تم الإعلان عنها حديثًا تسمى”https://venturebeat.com/ai/google-deepmind-unveils-lyria-a-powerful-genai-model-for-music-creation/”> ليريا. أظهرت مظاهرة كيف يمكن استخدام هذه الأدوات معًا لإنشاء فيديو ترويجي كامل لحفل موسيقي.
ما وراء السيليكون: تشمل استراتيجية البنية التحتية الشاملة من Google الشبكة والبرامج
Ironwood هو مجرد جزء واحد من استراتيجية البنية التحتية أوسع من الذكاء الاصطناعي من Google. كما أعلنت الشركة”https://siliconangle.com/2025/04/08/google-cloud-opens-global-network-enterprise-wide-area-network-use/”> السحابة وان، خدمة الشبكة الواسعة المدارة تتيح للشركات إمكانية الوصول إلى البنية التحتية لشبكة Google على نطاق الكوكب.
وقال Vahdat: “إن Cloud WAN هو عمود فقيرات شبكات شبكات الشركات المدارة بالكامل ومتطورة وآمنة يوفر أداءً تصل إلى 40 ٪ على الشبكة ، مع تقليل التكلفة الإجمالية للملكية بنسبة 40 ٪ نفسها”.
تقوم Google أيضًا بتوسيع عروض البرامج الخاصة بها لأعباء عمل الذكاء الاصطناعى ، بما في ذلك”https://blog.google/technology/ai/introducing-pathways-next-generation-ai-architecture/”> المسارات، وقت تشغيل التعلم الآلي الذي طورته Google DeepMind. تتيح المسارات على Google Cloud للعملاء توسيع نطاق النموذج الذي يعمل عبر مئات من TPUs.
AI Economics: كيف تخطط أعمال Google البالغة 12 مليار دولار للفوز بحرب الكفاءة
تأتي إعلانات الأجهزة والبرامج هذه في وقت حاسم بالنسبة لـ Google Cloud ، والتي ذكرت”https://abc.xyz/assets/a3/91/6d1950c148fa84c7d699abe05284/2024q4-alphabet-earnings-release.pdf”> 12 مليار دولار في Q4 2024 إيراداتبزيادة 30 ٪ على أساس سنوي ، في أحدث تقرير أرباحها.
أصبحت اقتصاديات نشر الذكاء الاصطناعي عاملاً متزايدًا في الحروب السحابية. تواجه Google منافسة مكثفة من”https://azure.microsoft.com/en-us/”> Microsoft Azure، التي استفادت منه”https://azure.microsoft.com/en-us/products/ai-services/openai-service/?ef_id=_k_CjwKCAjwktO_BhBrEiwAV70jXoLLPQL-JCs8PmxTvWCySHF5mGebzr4EUuurKTRlBszgr5N8tODOuhoCDYEQAvD_BwE_k_&OCID=AIDcmm5edswduu_SEM__k_CjwKCAjwktO_BhBrEiwAV70jXoLLPQL-JCs8PmxTvWCySHF5mGebzr4EUuurKTRlBszgr5N8tODOuhoCDYEQAvD_BwE_k_&gad_source=1&gclid=CjwKCAjwktO_BhBrEiwAV70jXoLLPQL-JCs8PmxTvWCySHF5mGebzr4EUuurKTRlBszgr5N8tODOuhoCDYEQAvD_BwE”> Openai Partnership في موقف السوق الهائل ، و”https://aws.amazon.com/”> Amazon Web Servicesالتي تستمر في توسيعها”https://aws.amazon.com/ai/machine-learning/trainium/”> التدريب و”https://aws.amazon.com/ai/machine-learning/inferentia/”> استدلال عروض رقاقة.
ما يفصل نهج Google هو تكامله الرأسي. في حين أن المنافسين لديهم شراكات مع الشركات المصنعة للرقائق أو الشركات الناشئة المكتسبة ، فإن Google تعمل على تطوير TPUs في المنزل لأكثر من عقد من الزمان. وهذا يمنح الشركة تحكمًا لا مثيل له على مكدس الذكاء الاصطناعي ، من السيليكون إلى البرامج إلى الخدمات.
من خلال جلب هذه التكنولوجيا إلى عملاء المؤسسات ، تراهن Google على أن تجربتها التي تم الحصول عليها بشق الأنفس للبحث عن Search و Gmail و YouTube ستترجم إلى مزايا تنافسية في سوق المؤسسات. الاستراتيجية واضحة: قدم نفس البنية التحتية التي تعمل على تشغيل منظمة العفو الدولية الخاصة بـ Google ، على نطاق واسع ، لأي شخص يرغب في دفع ثمنها.
النظام البيئي متعدد الوكلاء: خطة Google الجريئة لأنظمة الذكاء الاصطناعى التي تعمل معًا
خارج الأجهزة ، حددت Google رؤية لـ AI تتمحور حول أنظمة متعددة الوكلاء. أعلنت الشركة”https://cloud.google.com/products/agent-builder?hl=en”> مجموعة تطوير الوكيل (ADK) يتيح ذلك للمطورين إنشاء أنظمة حيث يمكن لعلماء الذكاء الاصطناعي العديد من العمل معًا.
ولعل الأهم من ذلك ، أعلنت Google عن “بروتوكول قابلية التشغيل البيني للوكيل إلى الوكيل” (A2A) يمكّن وكلاء الذكاء الاصطناعى المدمجون على أطر مختلفة وببائعين مختلفين للتواصل مع بعضهم البعض.
“سيكون عام 2025 سنة انتقالية حيث ينتقل الذكاء الاصطناعي من الإجابة على أسئلة واحدة إلى حل المشكلات المعقدة من خلال الأنظمة المحنطة” ، تنبأ فهد.
تتعاون Google مع أكثر من 50 من قادة الصناعة ، بما في ذلك”https://www.salesforce.com/”> Salesforceو”https://www.servicenow.com/”> servicenow، و”https://www.sap.com/index.html”> SAP، لتعزيز هذا المعيار المتداخل.
التحقق من الواقع للمؤسسة: ما تعني قوة Ironwood وكفاءتها لاستراتيجية الذكاء الاصطناعي الخاص بك
بالنسبة للمؤسسات التي تنشر الذكاء الاصطناعي ، يمكن أن تقلل هذه الإعلانات بشكل كبير من تكلفة وتعقيد نماذج الذكاء الاصطناعى المتطورة. يمكن أن تجعل كفاءة Ironwood المحسنة في تشغيل نماذج التفكير المتقدمة أكثر اقتصادا ، في حين أن بروتوكول قابلية التشغيل البيني للوكيل يمكن أن يساعد الشركات على تجنب قفل البائع.
لا ينبغي التقليل من تأثير العالم الحقيقي لهذه التطورات. كانت العديد من المنظمات مترددة في نشر نماذج AI المتقدمة بسبب تكاليف البنية التحتية الباهظة واستهلاك الطاقة. إذا تمكنت Google من تحقيق وعود أدائها لكل واط ، فيمكننا رؤية موجة جديدة من اعتماد الذكاء الاصطناعي في الصناعات التي ظلت حتى الآن على الهامش.
يعد النهج متعدد الوكلاء مهمًا بنفس القدر بالنسبة للمؤسسات التي تطغى عليها تعقيد نشر الذكاء الاصطناعي عبر أنظمة وبائعي مختلف. من خلال توحيد كيفية تواصل أنظمة الذكاء الاصطناعى ، تحاول Google تحطيم الصوامع التي تحد من تأثير المؤسسة من الذكاء الاصطناعي.
خلال المؤتمر الصحفي ، أكدت Google أنه سيتم مشاركة أكثر من 400 قصة عملاء في المقبل ’25 ، حيث تعرض تأثيرًا حقيقيًا للأعمال من ابتكارات AI.
سباق التسلح السيليكون: هل ستعمل رقائق Google المخصصة والمعايير المفتوحة على إعادة تشكيل مستقبل الذكاء الاصطناعي؟
مع استمرار تقدم الذكاء الاصطناعى ، ستصبح البنية التحتية التي تعمل بها على نحو متزايد. تشير استثمارات Google في أجهزة متخصصة مثل Ironwood ، إلى جانب مبادرات التشغيل المتداخلة لوكيلها ، إلى أن الشركة تحدد نفسها لمستقبل حيث تصبح الذكاء الاصطناعى أكثر توزيعًا وأكثر تعقيدًا وأكثر دمجًا في العمليات التجارية.
“نماذج التفكير الرائدة مثل Gemini 2.5 و ALPHAFOLD الفائزة بجائزة نوبل تدير كلها على TPUS اليوم” ، أشار Vahdat. “مع Ironwood ، لا يمكننا الانتظار لمعرفة ما هي اختراقات منظمة العفو الدولية التي أثارها مطورونا وعملاء Google Cloud عندما يصبح متاحًا في وقت لاحق من هذا العام.”
الآثار الاستراتيجية تتجاوز أعمال Google الخاصة. من خلال الضغط على المعايير المفتوحة في اتصال الوكيل مع الحفاظ على مزايا الملكية في الأجهزة ، تحاول Google قانون موازنة دقيق. تريد الشركة أن يزدهر النظام الإيكولوجي الأوسع (مع البنية التحتية Google تحتها) ، مع الحفاظ على التمايز التنافسي.
مدى سرعة استجابة المنافسين لتطورات الأجهزة من Google وما إذا كانت الصناعة تتجمع حول معايير قابلية التشغيل البيني المقترحة للوكيل المقترح ستكون عوامل رئيسية يجب مشاهدتها في الأشهر المقبلة. إذا كان التاريخ هو أي دليل ، فيمكننا أن نتوقع من Microsoft و Amazon أن تتعامل مع استراتيجيات تحسين الاستدلال الخاصة بهما ، مما يحتمل أن يقوموا بإنشاء سباق ثلاثي الاتجاه لبناء مكدس البنية التحتية الأكثر كفاءة في الذكاء الاصطناعي.
الرؤى اليومية حول حالات استخدام الأعمال مع VB يوميا
إذا كنت ترغب في إقناع رئيسك في العمل ، فقد غطيت VB Daily. نمنحك السبق الصحفي الداخلي على ما تفعله الشركات مع الذكاء الاصطناعي التوليدي ، من التحولات التنظيمية إلى عمليات النشر العملية ، حتى تتمكن من مشاركة رؤى لأقصى عائد على الاستثمار.
اقرأ لدينا”http://venturebeat.com/terms-of-service/”> سياسة الخصوصية
شكرا على الاشتراك. يفحص أكثر”http://venturebeat.com/newsletters/”> النشرات الإخبارية VB هنا.
حدث خطأ.