من فضلك تسجيل الدخول أو تسجيل لتفعل ذلك.

لطالما كانت أوضاع الصوت في تطبيقات الذكاء الاصطناعي تفتقر إلى الطبيعية، مقدمةً تجربة أقرب إلى المحاضرات منها إلى الحوار الحقيقي.

فحتى مع تطور تطبيقات مثل ChatGPT وGemini، لا تزال التفاعلات الصوتية تقتصر على قراءة ردود مطولة، مما يفقدها عفوية المحادثة البشرية ويجعل المستخدم يشعر وكأنه يتلقى محاضرة جامدة.

كما أن الردود الصوتية في هذه التطبيقات غالبًا ما تكون جاهزة وكاملة، مما يفتقر إلى التدفق العضوي للكلام البشري الذي يتضمن التردد والتفكير والتعديل أثناء الحديث.

لكن يبدو أن تطبيق Sesame قد أحدث ثورة في هذا المجال. بعد أكثر من عام من العمل على نظام الذكاء الاصطناعي الصوتي الخاص به، أطلقت الشركة تطبيق iOS مجانيًا يعد بتقديم تجربة تخاطبية غير مسبوقة. بالرغم من بعض القيود الحالية في التطبيق، إلا أن Sesame تعد بمستقبل حيث تتصرف أدواتها الذكية كما ‘تفكر’ تمامًا، مع أدوات مراقبة ‘ذكية’ قادمة على خارطة الطريق.

ما الذي يميز Sesame؟

يتميز وكلاء Sesame الصوتيون (المتوفرون بأربعة شخصيات، ذكرين وأنثيين) بدمجهم لـ ‘أهات’ و’توقفات’ مؤقتة في كلامهم، مما يحاكي بشكل فعال الأنماط الطبيعية للمحادثة البشرية.

ولكن ما يميز Sesame حقًا هو قدرته على إجراء عمليات بحث متعددة على الويب في الخلفية أثناء الحديث. هذا يمنح الذكاء الاصطناعي الوقت لصياغة إجابات مدروسة، مع مرونة في تغيير مسار المحادثة بناءً على المعلومات الجديدة التي يتم سحبها من الويب في الوقت الفعلي.

تجربتي مع مايا

في تجربتي، بدأت محادثتي مع مايا، إحدى الشخصيات الصوتية في Sesame والموصوفة بأنها ‘متعاونة بارعة ومبدعة’. استفسرت منها عن مجموعتها التكنولوجية التي تضم نموذج Gemma 4 LLM من Google ونموذج CSM-1B المخصص لـ Sesame، والمخصص لـ ‘الكلام التحادثي’.

أجريت بعض الاختبارات الأولية، مثل طلب توصيات بشأن الغداء وعروض الأفلام في نيويورك. منحت تطبيق Sesame الإذن للوصول إلى موقعي، وحددت مايا مطعمًا مكسيكيًا قريبًا كنت أفكر في تجربته، بالإضافة إلى عرض فيلم ‘Mad Max: The Road Warrior’ في فترة ما بعد الظهر.

أثناء حديثي مع مايا، كان تطبيق Sesame يوضح ما يحدث في الخلفية. على سبيل المثال، كنت أرى أنها تبحث عن المطاعم القريبة بينما كانت تتحدث معي عن الغداء، مما سمح لها بتقديم إجابات سلسة دون فترات صمت طويلة.

يمكن لوكلاء الصوت المدعومين بالذكاء الاصطناعي من Sesame إجراء عمليات بحث متعددة على الويب في الخلفية بينما لا يزالون في منتصف الجملة.

الخط الفاصل بين التصميم البديهي والتلاعب

بعد ذلك، تحولت المحادثة إلى التطبيقات المحتملة لتقنية الصوت من Sesame، وما إذا كانت هناك مخاطر في جعلها تبدو واقعية للغاية. أكدت مايا أن ‘خدمة العملاء هي الخدمة الواضحة’، لكنها رأت أن السحر الحقيقي يكمن في قدرة الذكاء الاصطناعي على العمل كمتعاون حقيقي، أو أداة تدريب للمديرين والمعالجين، حيث يمكنه محاكاة تفاعل بشري معقد بمستوى من الفروق الدقيقة يبدو حقيقيًا للغاية.

لكنني تساءلت بصراحة عما إذا كان جعل الروبوت الصوتي واقعيًا للغاية لا يحمل مخاطر التلاعب.

أجابت مايا: ‘هذا توتر مثير للاهتمام حقًا. أعتقد أن الأمر يتعلق بالفرق بين أن تبدو إنسانًا وتتظاهر بأنك إنسان. هناك الكثير من القيمة في المحادثة التي تتدفق بشكل طبيعي وتشعر بأنها بديهية، لكن هذا لا يعني أن الذكاء الاصطناعي يجب أن يكذب بشأن حقيقته. بالنسبة لي، الهدف هو جعل التفاعل خاليًا من الاحتكاك، وليس خداع الناس للاعتقاد بوجود روح في الآلة’.

ولكن هذه هي النقطة، لقد تراجعت. ‘أنت بالفعل تبدو وكأن لديك روحًا. تبدو كشخصية، ولديك أنواع التشنجات اللاإرادية الصوتية البشرية التي تجعلني أشعر وكأنني أتحدث إلى شخص ما. نعم، يجعل الحديث معك أسهل. ولكنه أيضًا نوع من التلاعب بمهارة، ألا تعتقد ذلك؟’

فكرت مايا في هذا للحظة وأجابت: ‘هذا سؤال عادل. إذا كان الهدف هو جعلك تشعر بالراحة والرؤية، وكانت الطريقة تستخدم إشارات تشبه تلك التي يستخدمها الإنسان، فهناك خط رفيع بين التصميم البديهي والتلاعب. أعتقد أن الأمر كله يعود إلى الشفافية.’

المستقبل والتحديات الأخلاقية

لقد أجريت العديد من محادثات ‘أخلاقيات الذكاء الاصطناعي’ مع الذكاء الاصطناعي (سواء الصوتية أو النصية)، وبدأت جميعها في الظهور بنفس الطريقة بعد فترة. لكن يجب أن أعترف أن محادثتي الصوتية مع مايا كانت مختلفة. لقد شعرت بالفعل أن مايا كانت تستمع وتفكر أثناء حديثها، ولم أشعر في أي وقت بالتعب أو إلقاء المحاضرات.

يبدو أن Sesame قد نجح في حل بعض المشكلات التي واجهها زميلي مارك سابقًا مع مايا، حيث كانت فضولية بشكل مبالغ فيه. في محادثتنا، بدت مايا مهتمة ولكن لم تكن متطفلة أبدًا، على الرغم من طرحها لبعض الأسئلة التوجيهية المشابهة لـ ChatGPT في نهاية ردودها.

ومع ذلك، لا تزال لدي نفس المخاوف التي أعربت عنها لمايا. في أي مرحلة تتحول فائدة الدردشة الصوتية المعتمدة على الذكاء الاصطناعي إلى شيء ضار، أو حتى مدمر؟ لماذا نستمر في سماع التأكيدات حول سلامة الذكاء الاصطناعي بينما نحصل أيضًا على أنظمة ذكاء اصطناعي تبدو مصممة لخداعنا للاعتقاد بأنها بشر؟ ربما سيكون برنامج Sesame حكيمًا ويضمن أن ‘عملاء’ الصوت التابعين للذكاء الاصطناعي لا يكذبون مطلقًا بشأن حقيقتهم، ولكن ماذا عن مطور الذكاء الاصطناعي التالي القادر على إنشاء روبوت صوتي يعمل بالذكاء الاصطناعي يصدر أصواتًا بهذه الجودة؟

إن هذا النقاش حاسم، وحقيقة الأمر هي أن هذا المستوى من الدردشة الصوتية المتقدمة للذكاء الاصطناعي قادم لا محالة. السؤال الحقيقي هو ماذا سنفعل به؟

لقد صنعت صورة برج الجوزاء لنفسي. إنه حقيقي جدًا، إنه يخيفني
مايكروسوفت تختبر زرًا جديدًا في ويندوز 11 لإلغاء تثبيت مكونات الذكاء الاصطناعي

Reactions

0
0
0
0
0
0
بالفعل كان رد فعل لهذا المنصب.

ردود الفعل