قبل فترة طويلة الذكاء الاصطناعي كان يستخدم ل إنشاء مقاطع فيديو و برامج الترميزكان يتم استخدامه لفهم اللغة المنطوقة واتخاذ إجراء بشأنها. والذكاء الاصطناعي هو السبب الذي يجعلك قادرًا على الدردشة مع Alexa وSiri وGoogle Assistant وجعل هذه التطبيقات تنفذ أوامرك.
يمكن أن تساعدك نفس الخوارزميات في إنشاء نصوص رقمية من ملفات صوتية تحتوي على كلام، سواء كانت هذه الملفات عبارة عن اجتماعات أو مقابلات أو محاضرات أو مجرد ملاحظات صوتية قمت بتسجيلها لنفسك. تمنحك النصوص سجلاً مكتوبًا لما قيل، ويمكن البحث فيها بسهولة.
خدمات النسخ ذات الأسماء الكبيرة مثل القس و الكاتب السعيد لا تقدم سوى كمية محدودة من النسخ مجانًا، ولكن يمكنك إنجاز المهمة دون دفع أي شيء بفضل Whisper. هذا هو محرك تحويل الكلام إلى نص الذي طورته OpenAI (من شهرة ChatGPT)، ولا توجد حدود لاستخدامه.
لديك خيار استخدام إصدار الويب من التطبيق المستضاف في وجه العناق، وهو أمر مريح ولكنه غالبًا ما يكون مزدحمًا في أوقات الذروة. يمكنك أيضًا اختيار تثبيت البرنامج محليًا على نظام التشغيل Windows، وهذا يعني نسخًا أسرع، ولكنك ستحتاج إلى جهاز كمبيوتر لائق للتعامل مع متطلبات معالجة الذكاء الاصطناعي.
الهمس على شبكة الإنترنت
رئيس لأكثر من همس على وجه العناقويمكنك الحصول على نص صوتي مجاني مباشرة في متصفحك، ولا تحتاج حتى إلى التسجيل للحصول على حساب. لديك خيار تحميل ملف صوتي من جهاز الكمبيوتر الخاص بك، أو يمكنك تسجيل الكلام مباشرة في التطبيق إذا كان لديك ميكروفون متصل. ضع في اعتبارك أن الصوت الخاص بك قد يُستخدم لتدريب نماذج الذكاء الاصطناعي المستقبلية بشكل أكبر، وكما هو الحال غالبًا، فإن سياسات الخصوصية الخاصة بـ OpenAI وHugging Face ليست واضحة بشأن هذا الأمر.
لتحميل ومعالجة ملف صوتي:
- افتح ال ملف صوتي فاتورة غير مدفوعة.
- يختار انقر للتحميل.
- حدد ملف صوتي.
- افحص ال نسخ صندوق.
- انقر يُقدِّم.
بعد بضع لحظات (أو أكثر)، سترى نص الإخراج على يمين الشاشة. تختلف أوقات المعالجة وفقًا لطول ملف الصوت لديك ومدى انشغال خوادم Hugging Face. نظرًا لأن هذه خدمة مجانية مفتوحة للجميع، فهي أيضًا شائعة جدًا، لذا قد تجد نفسك تنتظر لفترة طويلة حتى تمر الملفات عبر قائمة الانتظار.
ستجد داخل الواجهة بعض الأدوات المفيدة. انقر على أيقونة القلم الصغيرة أعلى شريط تشغيل الصوت، على سبيل المثال، ويمكنك قص بداية ونهاية المقطع – وهو أمر مفيد إذا كنت بحاجة إلى قص المقاطع الصامتة أو المقاطع غير المهمة من الصوت.
يمكنك أيضًا التبديل إلى ميكروفون علامة التبويب لتسجيل بعض الصوت مباشرة في واجهة Whisper، أو التبديل إلى موقع YouTube يمكنك الحصول على نصوص مكتوبة من أي مقطع فيديو. ما عليك سوى لصق عنوان URL للفيديو وستكون جاهزًا للبدء. تجدر الإشارة إلى أن YouTube يضيف تلقائيًا نصوصًا مكتوبة إلى بعض مقاطع الفيديو، والتي يمكن العثور عليها في أقسام التعليقات.
الهمس على ويندوز
إذا كنت تواجه الكثير من التأخيرات في تطبيق Whisper على الويب، أو كنت ترغب فقط في الحفاظ على معالجة النسخ الخاصة بك محلية وخاصة، فيمكنك إعداد نموذج الذكاء الاصطناعي على جهاز كمبيوتر يعمل بنظام Windows. تحتاج إلى تثبيت بطاقة رسوميات قادرة على CUDA (انظر هنا للحصول على القائمة)، مع ما لا يقل عن 4 جيجابايت من ذاكرة VRAM، للتعامل مع المعالجة – إذا كان لديك بطاقة Nvidia مثبتة حديثًا إلى حد ما، فمن المحتمل أن تكون مؤهلة.
تتطلب هذه العملية الكثير من الجهد، ولا توفر لك واجهة مستخدم سهلة، لذا فهي ليست مناسبة للجميع. ولكنها تتمتع بالمزايا التي ذكرناها بالفعل، ولن تضطر إلى الانتظار في قائمة انتظار حتى تتم معالجة ملفاتك. كما أنها مشروع صغير رائع إذا كنت تحب العبث بالكود والبرامج.
بافتراض أن جهاز الكمبيوتر الخاص بك يفي بالمواصفات المطلوبة، فأنت بحاجة إلى تثبيت بعض الأجزاء على جهاز الكمبيوتر الخاص بك: بايثون للترميز (تأكد من إضافة python.exe إلى PATH يتم التحقق منها أثناء التثبيت، باي تورش لمكتبات التعلم الآلي، شوكولاتي لإدارة حزم البرامج، و برنامج FFmpeg لمعالجة الصوت. تأتي جميعها مع تعليمات التثبيت على المواقع الإلكترونية ذات الصلة، إذا كنت بحاجة إليها.
ستكون جاهزًا بعد ذلك لتثبيت Whisper نفسه: ابحث عن “cmd” في قائمة “ابدأ” وافتح موجه الأمرثم اكتب “pip install -U openai-whisper” واضغط على يدخل. عند انتهاء التثبيت، يمكنك نسخ الملفات على النحو التالي:
- افتح المجلد الذي يحتوي على ملفات الصوت في مستكشف الملفات.
- انقر على شريط العناوين في الأعلى، واكتب “cmd”، ثم اضغط على يدخل.
- اكتب “whisper”، ثم مسافة، ثم اسم ملف الصوت الخاص بك.
- يضرب يدخل مرة أخرى، وتبدأ المعالجة.
يتم عرض النص على الشاشة، ويتم حفظه كسلسلة من ملفات النصوص في نفس المجلد الذي يحتوي على الصوت. إذا كنت بحاجة إلى تحويل ملفات متعددة في نفس الوقت، فما عليك سوى إدراجها جميعًا بعد أمر “whisper”، مع الفصل بين كل منها بمسافة.
حتى لو لم تكن على دراية بلغة Python أو موجه الأوامر، فلن تواجه الكثير من المتاعب في تشغيل كل شيء. هناك الكثير من الأدلة المتوفرة على الإنترنت والتي يمكنها مساعدتك إذا كنت بحاجة إلى المساعدة. هذا هو واحد من أفضل الدروس التعليمية نحن هنا لمساعدتك في فهم كل مرحلة خطوة بخطوة، ونشرح لك بعض الوظائف المتقدمة المتاحة لك (مثل التبديل إلى نموذج ذكاء اصطناعي مختلف).