من فضلك تسجيل الدخول أو تسجيل لتفعل ذلك.

كان معظم التركيز في الذكاء الاصطناعي التوليدي على واجهات مستندة إلى النص المستخدمة لإنشاء النص والصور والمزيد. يبدو أن الموجة التالية هي صوت ، وهي تتدحرج بسرعة. في أحدث التطورات ، أعلنت Google اليوم أنها ستضيف chirp 3-نماذج النص إلى النص إلى النص و HD-إلى منصة تطوير AI الخاصة به التي تبدأ الأسبوع المقبل.

الأسبوع الماضي،”nofollow” HREF=”https://www.linkedin.com/posts/nikitanamjoshi_text-to-speech-release-notes-cloud-text-to-speech-activity-7304939976675205121–ZTq”> Google أعلنت بهدوء سيتم طرح هذا الغرد 3 ثمانية أصوات جديدة مقابل 31 لغة. تشمل حالات الاستخدام للمنصة بناء مساعدين صوتيين ، وإنشاء الكتب الصوتية ، وتطوير وكلاء الدعم وأعداد الصوت لمقاطع الفيديو. تم الإعلان عن الأخبار في حدث في مكاتب DeepMind من Google في لندن.

تأتي جهودها في نفس الوقت الذي يقفز فيه الآخرون إلى الأمام مع عملهم الصوتي. في الأسبوع الماضي ، أعلنت شركة Sesame – بدء التشغيل وراء تطبيقات “Maya Maya” و “Miles” AI فيروسية واقعية للغاية ، عن إطلاق نموذجها للمطورين لبناء تطبيقاتهم وخدماتهم المخصصة علاوة على تقنيتها.

والجدير بالذكر أنه سيكون هناك قيود على الاستخدام حول chirp 3 لمحاولة الحفاظ على سوء الاستخدام. وقال توماس كوريان ، الرئيس التنفيذي لشركة Google Cloud ، في حدث إخباري اليوم: “نحن نعمل فقط من خلال بعض هذه الأشياء مع فريق السلامة لدينا”.

Elevenlabs هي من بين الشركات الناشئة الرئيسية التي رفعت”https://techcrunch.com/2025/01/30/elevenlabs-raises-180-million-in-series-c-funding-at-3-3-billion-valuation/”> مئات الملايين في التمويل لتوسيع عملهم في الخدمات الصوتية الذكاء الاصطناعي.

الأخبار ستجلب chirp 3 إلى نفس الثبات”https://techcrunch.com/2025/02/05/google-launches-new-ai-models-and-brings-thinking-to-gemini/”> أحدث إصدارات من LLM الرائد ، الجوزاء ، التي يتم اختبارها ، وكذلك نموذج عملها”https://techcrunch.com/2024/04/09/google-releases-imagen-2-a-video-clip-generator/”> Imagen وباهظ الثمن”https://techcrunch.com/2025/02/23/googles-new-ai-video-model-veo-2-will-cost-50-cents-per-second/”> VEO 2 أداة توليد الفيديو.

يبقى أن يتم تأكيد ما إذا كانت Google التي يتم إطلاقها مع chirp 3 ستكون “واقعية” مثل بعض الجهود الأخرى التي تبذلها منظمة العفو الدولية لإنشاء أصوات “إنسانية” (يبرز عمل Sesame على وجه الخصوص). ولكن كما أكد ديميس حسيابيس ، الرئيس التنفيذي لشركة DeepMind ، لا يزال هذا ماراثون ، وليس سباقًا.

“في المدى القريب … هذه الفكرة [AI is] رصاصة فضية لكل شيء في العامين المقبلين ، لا أرى ذلك يحدث بعد. أعتقد أننا ما زلنا على بعد بضع سنوات من حدوث شيء مثل Agi “. “سوف يغير الأشياء … خلال العقد المقبل ، وبالتالي فإن المتوسطة إلى الطويلة. إنها واحدة من تلك اللحظات المثيرة للاهتمام في الوقت المناسب. “

أطلقت Google Vertex AI”https://techcrunch.com/2021/05/18/google-cloud-launches-vertex-a-new-managed-machine-learning-platform/”> طريق العودة في عام 2021 كمنصة للمطورين لبناء خدمات التعلم الآلي في السحابة. كان ذلك ، بالطبع ، قبل انفجار الاهتمام في الذكاء الاصطناعي ، وتحديداً من الذكاء الاصطناعي ، الذي جاء مع إطلاق خدمات GPT من Openai.

منذ ذلك الحين ، كانت الشركة تميل إلى قمة الرأس جزئيًا كما هي”https://techcrunch.com/2023/08/29/google-upgrades-vertex-ai-to-keep-pace-with-the-generative-ai-boom/”> يلعب اللحاق بالركب ل”nofollow” HREF=”https://www.techmeme.com/230829/p33#a230829p33″> شركات أخرى مثل Microsoft و Amazon – يقومون أيضًا ببناء أدوات AI التوليدية للمطورين. بالإضافة إلى بناء الذكاء الاصطناعي التوليدي على رأس الجوزاء ، يمكن للمطورين استخدام Vertex AI لتصنيف البيانات ، ونماذج التدريب ، وإعداد نماذج للإنتاج. سيكون من المثير للاهتمام ما إذا كانت تتحرك لتوسيع حديقتها المسورة إلى نماذج تتجاوز تلك التي أنشأتها Google نفسها.

تقوم Google ببناء خدمات صوتية “chirp” لسنوات ، والعودة إلى استخدام الاسم كـ”https://www.informationweek.com/it-leadership/google-chirp-aims-to-silence-amazon-echo-report-says” الهدف=”_blank” rel=”noreferrer noopener nofollow”> اسم الرمز لجهوده المبكرة للتنافس ضد خدمة Amazon’s Alexa.

إنغريد هو كاتب ومحرر لـ TechCrunch ، ينضم إلى فبراير 2012 ، ومقره لندن.

قبل TechCrunch ، عملت Ingrid في paycontent.org ، حيث كانت كاتبة للموظفين ، وكتبت في الماضي أيضًا مستقلًا بانتظام لمنشورات أخرى مثل The Financial Times. يغطي Ingrid الأجهزة المحمولة والوسائط الرقمية والإعلانات والمساحات التي تتقاطع فيها هذه.

عندما يتعلق الأمر بالعمل ، تشعر أنها أكثر راحة في التحدث باللغة الإنجليزية ، لكنها يمكنها أيضًا التحدث باللغة الروسية والإسبانية والفرنسية (بترتيب الكفاءة الهابطة).

عرض السيرة الذاتية”width: 1em;” ملء=”none” ViewBox=”0 0 24 24″>”var(–c-svg, currentColor)” د=”M16.5 12 9 19.5l-1.05-1.05L14.4 12 7.95 5.55 9 4.5z”/>

اقرأ المزيد

هل تقوم Google بتشغيل اللحاق بالبحث مع Openai؟
تقوم Google بزيادة أعمالها في المملكة المتحدة من خلال إقامة بيانات الوكلاء والمزيد

Reactions

0
0
0
0
0
0
بالفعل كان رد فعل لهذا المنصب.

ردود الفعل