كيفية إنشاء صوت بتقنية الذكاء الاصطناعي في عام 2023 (برنامج تعليمي)
نشرت: 2023-09-08منذ أن ظهر ChatGPT في أواخر عام 2022، ظهرت برامج الذكاء الاصطناعي التوليدية الجديدة في كل مكان. أحد أكثر أنواع الذكاء الاصطناعي تميزًا هو صوت الذكاء الاصطناعي، والذي يسمح لك باستخدام المطالبات النصية لإنشاء مقاطع صوتية للتسويق وتدريب الموظفين والمزيد. سنوضح لك في هذه المقالة كيفية إنشاء صوت يعتمد على الذكاء الاصطناعي باستخدام برنامج PlayHT الشهير. دعونا نتعمق.
- 1 ما هو الذكاء الاصطناعي؟
- 2 ما هو توليد الصوت بالذكاء الاصطناعي؟
- 2.1 كيف تعمل مولدات الصوت بالذكاء الاصطناعي؟
- 3 كيفية عمل صوت بالذكاء الاصطناعي
- 3.1 الخطوة 1: إنشاء حساب
- 3.2 الخطوة 2: استكشاف الواجهة
- 3.3 الخطوة 3: إنشاء أول صوت للذكاء الاصطناعي
- 3.4 الخطوة 4: استنساخ الصوت
- 3.5 الخطوة 5: تصدير المشروع
- 4 أفضل الممارسات لمولدات الصوت بالذكاء الاصطناعي
- 5 أفكار نهائية حول إنشاء صوت الذكاء الاصطناعي
ما هو الذكاء الاصطناعي؟
الذكاء الاصطناعي هو تقنية موسعة تسمح لأجهزة الكمبيوتر بأداء مهام واسعة النطاق يقوم بها البشر عادة. ومع ذلك، تستغرق هذه المهام جزءًا صغيرًا من الوقت مع أنظمة الذكاء الاصطناعي. هناك عدة أنواع من الذكاء الاصطناعي، وأكثرها شيوعًا هو الذكاء الاصطناعي الضيق. يُستخدم هذا النوع من الذكاء الاصطناعي لإنشاء الصور والصوت والموسيقى والنص من خلال رسالة نصية بسيطة.
ما هو توليد الصوت بالذكاء الاصطناعي؟
أصوات الذكاء الاصطناعي هي أصوات يتم إنشاؤها بواسطة الكمبيوتر والتي تحاكي أصوات الأصوات البشرية وميزاتها ونغماتها. تبدأ إما كنص أو عن طريق تسجيل صوتك لإنشاء صوت بشري فريد. من خلال قوة تقنية تحويل النص إلى كلام الخاصة بالذكاء الاصطناعي، يمكن للمبدعين تطوير أصوات للبودكاست أو التعليقات الصوتية أو العمل كأدوات مساعدة لضعاف البصر.
كيف تعمل مولدات الصوت بالذكاء الاصطناعي؟
تتطلب مولدات صوت الذكاء الاصطناعي معالجًا مسبقًا للنص، والنسخ الصوتي، والتوليف الصوتي حتى تعمل. الخطوة الأولى، المعالجة المسبقة للنص، تأخذ النص الخام وتجعله أنيقًا ومنظمًا. فهو يقسم الكلمات إلى أجزاء أصغر تسمى الرموز، ويصلح العناصر الغريبة مثل الاختصارات أو الأحرف الخاصة، ويحول الأرقام إلى كلمات فعلية.
ثم، في الخطوة الثانية، يتم تحليل تلك الرموز المميزة وإعطاؤها علامات مثل الأفعال أو الأسماء أو الصفات. وهذا يساعد النظام على فهم كيفية استخدام كل كلمة وما تعنيه في السياق.
الآن، هنا حيث يحدث السحر. يمر النص عبر التحليل الصوتي، مما يعني أنه يتم تحويله إلى نوع خاص من الكتابة يلتقط كيف ينبغي أن تبدو الكلمات عند نطقها. يتضمن ذلك الضغط والنبرة والإيقاع لجعل الكلام يبدو طبيعيًا.
وأخيرا، في الخطوة الأخيرة، كل هذا العمل الشاق يؤتي ثماره. يتم تحويل النسخ الصوتي إلى كلام حقيقي باستخدام الموجات الصوتية. بفضل خوارزميات الذكاء الاصطناعي الحديثة، يبدو الكلام الناتج في الوقت الحاضر أكثر طبيعية ويشبه الإنسان من محركات تحويل النص إلى كلام في الماضي.
كيفية جعل صوت الذكاء الاصطناعي
لقد قطعت المولدات الصوتية شوطًا طويلًا منذ أن أطلقت شركة IBM Shoebox في عام 1962. تتمتع الأنظمة الحديثة، مثل PlayHT، بمجموعة متنوعة من الأصوات الاصطناعية ذات النغمات المختلفة، مما يجعل من الممكن إنشاء الأصوات الأكثر واقعية. ستسمح لك الأدوات الأخرى، مثل MurfAI، بضبط درجة الصوت والنغمة والسرعة. في هذا البرنامج التعليمي، سوف نستخدم PlayHT لإنشاء صوت الذكاء الاصطناعي.
الخطوة 1: إنشاء حساب
الخطوة الأولى في العملية هي إنشاء حساب PlayHT مجاني. ابدأ بالانتقال إلى الصفحة الرئيسية، ثم انقر فوق الزر "تجربة مجانًا" الموجود أعلى يمين الشاشة.
يمكنك التسجيل باستخدام حساب Google أو إدخال اسمك وبريدك الإلكتروني. استخدم الطريقة التي اخترتها، ثم انقر فوق تسجيل للمتابعة.
في الخطوة التالية، اختر ما إذا كنت تخطط لاستخدام PlayHT كفرد أو في بيئة الشركة.
سوف تطرح PlayHT أسئلة حول كيفية استخدامك للبرنامج في الشاشات القليلة التالية.
بمجرد إجراء اختياراتك وإنشاء حسابك، يمكنك البدء في استكشاف الواجهة.
الخطوة 2: استكشاف الواجهة
دعونا نتعرف على الواجهة قبل أن نقوم بإنشاء صوتنا الأول:
- إنشاء ملف جديد: هذا هو المكان الذي ستنشئ فيه مشروعك الأول.
- الملفات الأخيرة: قائمة بأحدث مشاريعك.
- الملفات: حيث توجد جميع ملفاتك.
- استنساخ الصوت: يمكنك تحميل الصوت ثم استنساخه لاستخدامه في البرنامج.
- الوصول إلى واجهة برمجة التطبيقات (API): لدمج PlayHT في التطبيقات الأخرى
- الفواتير: إدارة حسابك.
- محدد اللغة: اللغة الإنجليزية هي الخيار الوحيد في الوقت الحالي، ولكن هناك لغات أخرى قيد التنفيذ.
- عدد الكلمات: يتيح لك معرفة عدد الكلمات المتبقية المتوفرة.
- إنشاء جميع الفقرات: يستخدم لإنشاء صوت الذكاء الاصطناعي.
- استيراد الفيديو: أضف تعليقات صوتية إلى مقطع فيديو تم تحميله.
- موجه النص: إدخال النص لتوليد صوت الذكاء الاصطناعي.
- عناصر التحكم في الصوت: اضبط الجدول الزمني لصوتك، وأعد ترتيب المقاطع.
- تصدير المشروع: احفظ مشروعك حسب الفقرة أو كملف wav واحد.
الخطوة 3: إنشاء أول صوت AI الخاص بك
يعد إنشاء صوت AI باستخدام PlayHT أمرًا بسيطًا. يمكنك إنشاء البرنامج النصي الخاص بك أو استخدام chatbot AI لمساعدتك. في هذا البرنامج التعليمي، سنستخدم ChatGPT لإنشاء النص لصوتنا. ابدأ بالنقر فوق الزر "إنشاء ملف جديد" لإنشاء مشروع جديد لصوتنا.
بعد ذلك، سنختار صوتًا اصطناعيًا للمشروع. للقيام بذلك، انقر فوق أيقونة الصوت مباشرة أعلى المطالبة النصية.
ستظهر نافذة منبثقة جديدة، مما يسمح لك بتجربة صوت واحد من أكثر من 130 صوتًا للذكاء الاصطناعي. لاختيار واحدة، ما عليك سوى النقر عليها (1)، وتحديد سرعة التشغيل (2)، واختيار تطبيق الصوت على جميع الفقرات في مشروعك (3)، ثم تأكيد التغييرات (4).
سنختار هدسون لأنه يبدو الأكثر واقعية ويتمتع بصوت سردي جيد لنصنا.
استخدم ChatGPT لإنشاء برنامج نصي للفيديو
الآن بعد أن قمنا باختيار صوتنا، سنحتاج إلى إنشاء بعض النصوص. سنطلب من ChatGPT إنشاء نص فيديو قصير يقدم حقائق مثيرة للاهتمام حول الكلاب. استخدمنا المطالبة التالية: قم بتقديم نص فيديو مختصر لعرض 5 حقائق غير معروفة عن الكلاب .
بمجرد إنشاء البرنامج النصي، سنحتاج إلى إدخال بعض النص لمشروعنا. سنبدأ بلصق مقدمة البرنامج النصي في PlayHT: مرحبًا يا محبي الكلاب! سنكشف اليوم عن خمس حقائق رائعة وغير معروفة عن أفضل صديق للإنسان، الكلاب! لذا، احصل على مكافأة، واجلس، ودعنا نتعمق!
لإنشاء الصوت، انقر فوق أيقونة التشغيل الموجودة على يسار المطالبة النصية.
سيقوم PlayHT بإنشاء النص باستخدام صوت هدسون. اعتمادًا على حجم النص الذي تستخدمه، قد تستغرق عملية الإنشاء ما يصل إلى بضع دقائق. بمجرد الانتهاء، ستتمكن من معاينة الصوت عن طريق النقر على زر التشغيل (1) الموجود على يمين الشاشة. إذا لم تكن راضيًا عن النتيجة، يمكنك النقر فوق زر إعادة الإنشاء (2) للمحاولة مرة أخرى.
إليك كيف تبدو الفقرة الأولى:
على الرغم من أن هذا يبدو جيدًا جدًا، إلا أنه قد يحتاج إلى القليل من التعديل. الفواصل في الصوت لا تبدو صحيحة تمامًا، لذا سنقوم بإجراء بعض التعديلات.
تجديد الإخراج
يتيح لك PlayHT إجراء تغييرات على إدخال النص، ثم إعادة إنشائه. يعد هذا مفيدًا عندما لا يكون الإخراج وفقًا لمعاييرك. النصيحة الجيدة هي إضافة شرطات بين الجمل لإنشاء توقف طبيعي. مع المولدات الصوتية المعتمدة على الذكاء الاصطناعي، هناك ميل إلى التعجيل في النص، مما يؤدي إلى إنشاء جمل غير طبيعية. لذا، لتصحيح هذا، سنقوم بتغيير موجهنا الأصلي إلى: مرحبًا يا عشاق الكلاب! – سنكشف اليوم عن خمس حقائق رائعة وأقل شهرة عن أفضل صديق للإنسان – الكلاب! - لذا، احصل على مكافأة، واجلس، ودعنا نتعمق!
وهنا النتائج:
الخطوة 4: استنساخ الصوت
ميزة أخرى رائعة في PlayHT هي القدرة على إنشاء أصوات الذكاء الاصطناعي الخاصة بك. إنه يعمل عن طريق تحميل مقطع مدته 30 ثانية، ثم تحويله إلى صوت ذكاء اصطناعي قابل للاستخدام لمشاريعك. للبدء، انقر فوق علامة التبويب استنساخ الصوت في واجهة PlayHT.
بعد ذلك، انقر فوق زر إنشاء نسخة جديدة .
نظرًا لأننا نستخدم الترخيص المجاني، فإن خيارنا الوحيد هو اختيار الخيار الفوري ، الذي ينشئ صوت الذكاء الاصطناعي من مقطع صوتي مدته 30 ثانية.
بعد ذلك، قم بتسمية صوتك (1)، واختر الجنس (2)، وقم بتحميل ملف صوتي (3)، وأكد أن لديك حقوق استخدام المقطع (4)، ثم انقر فوق إنشاء (5).
بمجرد إنشاء الاستنساخ، سيظهر أسفل زر إنشاء استنساخ جديد (1). ومن هناك، يمكنك استخدامه (2)، أو مشاركته (3)، أو حذفه (4).
لمعرفة كيف يبدو الأمر، قم بإضافة مطالبة نصية لمعاينته. بصراحة عجبتنا النتائج:
الخطوة 5: تصدير المشروع
الخطوة الأخيرة في عملية الإنشاء هي تصدير ملفات الصوت الخاصة بك. يمكنك القيام بذلك بإحدى طريقتين: تصدير فقرة واحدة في المرة الواحدة أو تصدير كل الفقرات في ملف واحد. بالنسبة لمعظم منشئي المحتوى، من المنطقي تصدير الملفات بشكل منفصل. بهذه الطريقة، يمكنك إضافة مشاهد مقطوعة وتأثيرات أخرى بين كل منها. لتصدير ملفاتك، انقر فوق زر التصدير في الجزء العلوي الأيسر من الشاشة.
ستظهر قائمة منسدلة تحتوي على خيارين: كل فقرة على حدة أو كملف صوتي واحد .
يتم تصدير كافة الملفات كملفات صوتية wav، والتي يمكن استيرادها باستخدام أي برنامج صوتي.
أفضل الممارسات لمولدات الصوت بالذكاء الاصطناعي
من المهم فهم بعض أفضل الممارسات عند إنشاء المقاطع لتحقيق أقصى استفادة من المولدات الصوتية المعتمدة على الذكاء الاصطناعي. أولاً، افصل الجمل بإضافة شرطة (-). يتيح ذلك للخوارزمية معرفة أنه يجب أن يكون هناك توقف مؤقت، وعادةً ما يؤدي ذلك إلى إزالة الجمل التي يتم تشغيلها. وبالمثل، يمكن أن تضيف الفواصل والفواصل المنقوطة فترة توقف طبيعية بين الكلمات. ومن ناحية أخرى، تجنب الواصلات بين الكلمات في الجملة. على سبيل المثال، يمكنك استخدام النطاق غير الساحلي بدلاً من النطاق غير الساحلي .
يجب عليك أيضًا إضافة مسافات بين الاختصارات لمساعدة الذكاء الاصطناعي على فهم أنه يجب أن تكون هناك أحرف منطوقة فردية بدلاً من الكلمات. على سبيل المثال، بدلاً من استخدام الذكاء الاصطناعي (AI) ، استخدم الذكاء الاصطناعي (AI) . يمكنك أيضًا إضافة فترة بين الحروف بالاختصارات. لتجنب تكرار الكلمات، أعد صياغة النص ليتضمن علامات الترقيم، مثل الفواصل أو الفواصل المنقوطة أو الواصلات. هناك طريقة أخرى لمعالجة التكرار وهي تقسيم الجمل إلى جمل أصغر. وهذا يمنع الذكاء الاصطناعي من الارتباك، والذي عادة ما ينتهي بنتائج غير مرغوب فيها.
الأفكار النهائية حول إنشاء صوت الذكاء الاصطناعي
تعمل مولدات الصوت التي تعمل بتقنية الذكاء الاصطناعي على تغيير الطريقة التي يصنع بها المبدعون الصوت. من خلال برامج الذكاء الاصطناعي مثل PlayHT، يمكنك إنشاء أصوات للبودكاست ومقاطع فيديو YouTube ومقاطع الفيديو التسويقية والمواد التدريبية والمزيد. مع تقدم تكنولوجيا الذكاء الاصطناعي، يحمل مستقبل توليد الصوت إمكانات هائلة، مما يفتح الأبواب أمام تجارب أكثر غامرة.
بالنسبة لأولئك المهتمين باستكشاف تطبيقات الذكاء الاصطناعي الأخرى، تحتوي مدونتنا على الكثير من المنشورات لمساعدتك في أن تصبح نجمًا بارزًا في الذكاء الاصطناعي في وقت قصير.
- كيفية إنشاء فن الذكاء الاصطناعي في عام 2023 (برنامج تعليمي مفصل)
- 31 طريقة يمكنك من خلالها استخدام الذكاء الاصطناعي اليوم (دليل 2023)
- كيفية استخدام Photoshop AI Geneative fill في 2023 (برنامج تعليمي تفصيلي)
- كيفية استخدام Midjourney لإنشاء فنون الذكاء الاصطناعي في عام 2023 (برنامج تعليمي مفصل)
صورة مميزة عبر Pro_Vector / Shutterstock.com