วิธีสร้างเสียง AI ในปี 2023 (บทช่วยสอน)

เผยแพร่แล้ว: 2023-09-08

นับตั้งแต่ ChatGPT เข้ามามีบทบาทในช่วงปลายปี 2022 โปรแกรม AI (ปัญญาประดิษฐ์) เจนเนอเรชั่นใหม่ก็ได้ปรากฏขึ้นทุกที่ ปัญญาประดิษฐ์ประเภทหนึ่งที่มีเอกลักษณ์เฉพาะคือเสียง AI ซึ่งช่วยให้คุณสามารถใช้ข้อความแจ้งเตือนเพื่อสร้างคลิปเสียงสำหรับการตลาด การฝึกอบรมพนักงาน และอื่นๆ ในโพสต์นี้ เราจะแสดงวิธีสร้างเสียง AI โดยใช้โปรแกรมยอดนิยมอย่าง PlayHT มาดำดิ่งกัน

สารบัญ
  • 1 เอไอคืออะไร?
  • 2 การสร้างเสียง AI คืออะไร?
    • 2.1 เครื่องกำเนิดเสียง AI ทำงานอย่างไร
  • 3 วิธีสร้างเสียง AI
    • 3.1 ขั้นตอนที่ 1: การสร้างบัญชี
    • 3.2 ขั้นตอนที่ 2: สำรวจอินเทอร์เฟซ
    • 3.3 ขั้นตอนที่ 3: การสร้างเสียง AI แรกของคุณ
    • 3.4 ขั้นตอนที่ 4: การโคลนเสียง
    • 3.5 ขั้นตอนที่ 5: การส่งออกโครงการ
  • 4 แนวทางปฏิบัติที่ดีที่สุดสำหรับเครื่องกำเนิดเสียง AI
  • 5 ความคิดสุดท้ายเกี่ยวกับการสร้างเสียง AI

เอไอคืออะไร?

AI คืออะไร

ภาพที่สร้างด้วย Midjourney

ปัญญาประดิษฐ์เป็นเทคโนโลยีที่กว้างขวางซึ่งช่วยให้คอมพิวเตอร์สามารถทำงานได้อย่างกว้างขวางอย่างที่มนุษย์ปกติจะทำ อย่างไรก็ตาม งานเหล่านั้นใช้เวลาเพียงเล็กน้อยกับระบบ AI AI มีหลายประเภท โดยประเภทที่พบบ่อยที่สุดคือ AI แบบแคบ AI ประเภทนี้ใช้เพื่อสร้างรูปภาพ เสียง เพลง และข้อความจากข้อความแจ้งแบบธรรมดา

การสร้างเสียง AI คืออะไร?

เครื่องกำเนิดเสียง AI

ภาพที่สร้างด้วย Midjourney | โฟโต้ชอปเอไอ

เสียง AI คือเสียงที่สร้างจากคอมพิวเตอร์ซึ่งเลียนแบบเสียง คุณสมบัติ และน้ำเสียงของมนุษย์ พวกเขาอาจเริ่มต้นด้วยข้อความหรือโดยการบันทึกเสียงของคุณเองเพื่อสร้างเสียงที่ฟังดูเป็นเอกลักษณ์ของมนุษย์ ด้วยพลังของเทคโนโลยีการอ่านออกเสียงข้อความของ AI ผู้สร้างสามารถพัฒนาเสียงสำหรับพอดแคสต์ การพากย์เสียง หรือทำหน้าที่เป็นเครื่องมือช่วยเหลือสำหรับผู้พิการทางสายตา

เครื่องกำเนิดเสียง AI ทำงานอย่างไร

เครื่องกำเนิดเสียงทำงานอย่างไร

ภาพที่สร้างด้วย Leonardo | โฟโต้ชอปเอไอ

เครื่องกำเนิดเสียง AI ต้องใช้ตัวประมวลผลข้อความล่วงหน้า การถอดเสียง และการสังเคราะห์เสียงจึงจะทำงานได้ ขั้นตอนแรก การประมวลผลข้อความล่วงหน้า จะนำข้อความดิบมาทำให้ทุกอย่างเป็นระเบียบและเป็นระเบียบ โดยแบ่งคำออกเป็นส่วนเล็กๆ ที่เรียกว่าโทเค็น แก้ไขสิ่งแปลกปลอม เช่น การย่อหรืออักขระพิเศษ และเปลี่ยนตัวเลขให้เป็นคำจริง

จากนั้นในขั้นตอนที่สอง โทเค็นเหล่านั้นจะถูกวิเคราะห์และติดแท็ก เช่น คำกริยา คำนาม หรือคำคุณศัพท์ ซึ่งจะช่วยให้ระบบเข้าใจว่าแต่ละคำควรใช้อย่างไรและมีความหมายอย่างไรในบริบท

ทีนี้มาถึงจุดที่ความมหัศจรรย์เกิดขึ้น ข้อความต้องผ่านการวิเคราะห์การออกเสียง ซึ่งหมายความว่าข้อความจะถูกแปลงเป็นงานเขียนแบบพิเศษที่รวบรวมว่าคำต่างๆ ควรออกเสียงอย่างไรเมื่อพูด ซึ่งรวมถึงความเครียด น้ำเสียง และจังหวะเพื่อทำให้คำพูดฟังดูเป็นธรรมชาติ

ในที่สุด ในขั้นตอนสุดท้าย การทำงานหนักทั้งหมดนั้นก็คุ้มค่า การถอดเสียงจากการออกเสียงจะกลายเป็นคำพูดจริงโดยใช้คลื่นเสียง ด้วยอัลกอริธึม AI ที่ทันสมัย ​​เสียงพูดที่เกิดขึ้นในปัจจุบันจึงฟังดูเป็นธรรมชาติและเหมือนมนุษย์มากกว่าเครื่องมือแปลงข้อความเป็นคำพูดในอดีต

วิธีสร้างเสียง AI

เล่นเสียง HT AI

เครื่องกำเนิดเสียงพัฒนาไปไกลนับตั้งแต่ IBM เปิดตัว Shoebox ในปี 1962 ระบบสมัยใหม่ เช่น PlayHT มีเสียงสังเคราะห์ที่หลากหลายพร้อมโทนเสียงที่แตกต่างกัน ทำให้สามารถสร้างเสียงที่สมจริงที่สุดได้ เครื่องมืออื่นๆ เช่น MurfAI จะช่วยให้คุณปรับระดับเสียง โทน และความเร็วได้ ในบทช่วยสอนนี้ เราจะใช้ PlayHT เพื่อสร้างเสียง AI

ขั้นตอนที่ 1: การสร้างบัญชี

ขั้นตอนแรกในกระบวนการคือการสร้างบัญชี PlayHT ฟรี เริ่มต้นด้วยการนำทางไปยังหน้าแรก จากนั้นคลิกปุ่ม ลองฟรี ที่มุมขวาบนของหน้าจอ

สร้างบัญชี

คุณสามารถลงทะเบียนโดยใช้บัญชี Google หรือป้อนชื่อและอีเมลของคุณ ใช้วิธีการที่คุณเลือก จากนั้นคลิก สมัคร เพื่อดำเนินการต่อ

ลงทะเบียน Play.HT

ในขั้นตอนถัดไป เลือกว่าคุณวางแผนที่จะใช้ PlayHT เป็นรายบุคคลหรือในบริษัท

ขั้นตอนการตั้งค่า

PlayHT จะถามคำถามเกี่ยวกับวิธีการใช้งานซอฟต์แวร์ของคุณในหน้าจอถัดไป

ตั้งค่าเสียง PlayHT AI

เมื่อคุณทำการเลือกและสร้างบัญชีของคุณแล้ว คุณสามารถเริ่มสำรวจอินเทอร์เฟซได้

ขั้นตอนที่ 2: สำรวจอินเทอร์เฟซ

มาทำความคุ้นเคยกับอินเทอร์เฟซก่อนที่เราจะสร้างเสียงแรก:

  1. สร้างไฟล์ใหม่: นี่คือที่ที่คุณจะสร้างโปรเจ็กต์แรกของคุณ
  2. ไฟล์ล่าสุด: รายการโครงการล่าสุดของคุณ
  3. ไฟล์: ตำแหน่งของไฟล์ทั้งหมดของคุณ
  4. การโคลนเสียง: คุณสามารถอัปโหลดเสียง จากนั้นจึงโคลนเพื่อใช้ในซอฟต์แวร์
  5. การเข้าถึง API: สำหรับการรวม PlayHT เข้ากับแอปพลิเคชันอื่น
  6. การเรียกเก็บเงิน: จัดการบัญชีของคุณ
  7. ตัวเลือกภาษา: ภาษาอังกฤษเป็นเพียงตัวเลือกเดียวในขณะนี้ แต่ภาษาอื่นๆ อยู่ระหว่างการพัฒนา
  8. จำนวนคำ: ช่วยให้คุณเห็นจำนวนคำที่เหลืออยู่
  9. สร้างย่อหน้าทั้งหมด: ใช้เพื่อสร้างเสียง AI
  10. นำเข้าวิดีโอ: เพิ่มเสียงบรรยายให้กับวิดีโอที่อัปโหลด
  11. ข้อความแจ้ง: การป้อนข้อความสำหรับการสร้างเสียง AI
  12. การควบคุมเสียง: ปรับไทม์ไลน์ของเสียงของคุณและจัดเรียงคลิปใหม่
  13. ส่งออกโครงการ: บันทึกโครงการของคุณตามย่อหน้าหรือเป็นไฟล์ wav ไฟล์เดียว

อินเตอร์เฟซ PlayHT

ขั้นตอนที่ 3: สร้างเสียง AI แรกของคุณ

การสร้างเสียง AI ด้วย PlayHT นั้นง่ายมาก คุณสามารถสร้างสคริปต์ของคุณเองหรือใช้แชทบอท AI เพื่อช่วยเหลือคุณได้ ในบทช่วยสอนนี้ เราจะใช้ ChatGPT เพื่อสร้างข้อความสำหรับเสียงของเรา เริ่มต้นด้วยการคลิกปุ่ม สร้างไฟล์ใหม่ เพื่อสร้างโครงการใหม่สำหรับเสียงของเรา

สร้างไฟล์ใหม่

ต่อไป เราจะเลือกเสียงสังเคราะห์สำหรับโปรเจ็กต์ โดยคลิก ไอคอนเสียง เหนือข้อความแจ้ง

เลือกเสียง AI

หน้าต่างป๊อปอัปใหม่จะปรากฏขึ้น ให้คุณสุ่มตัวอย่างเสียง AI หนึ่งเสียงจากกว่า 130 เสียง หากต้องการเลือกหนึ่งรายการ เพียงคลิกที่มัน (1) เลือกความเร็วในการเล่น (2) เลือกใช้เสียงกับทุกย่อหน้าในโครงการของคุณ (3) จากนั้นยืนยันการเปลี่ยนแปลง (4)

สลับเสียง AI

เราจะเลือก ฮัดสัน เพราะเขาฟังดูสมจริงที่สุดและมีเสียงบรรยายที่ดีสำหรับบทของเรา

ใช้ ChatGPT เพื่อสร้างสคริปต์วิดีโอ

ตอนนี้เราได้เลือกเสียงของเราแล้ว เราจะต้องสร้างข้อความบางส่วน เราจะขอให้ ChatGPT สร้างสคริปต์วิดีโอสั้นๆ ที่ให้ข้อเท็จจริงที่น่าสนใจเกี่ยวกับสุนัข เราใช้ข้อความต่อไปนี้: จัดทำสคริปต์วิดีโอสั้นๆ เพื่อแสดงข้อเท็จจริงที่ไม่ทราบเกี่ยวกับสุนัข 5 ประการ

สคริปต์วิดีโอ ChatGPT

เมื่อสร้างสคริปต์แล้ว เราจะต้องป้อนข้อความสำหรับโครงการของเรา เราจะเริ่มต้นด้วยการวางคำนำของสคริปต์ของเราลงใน PlayHT: สวัสดี คนรักสุนัข! วันนี้เราจะมาเปิดเผยข้อเท็จจริงที่น่าสนใจและไม่ค่อยมีใครรู้จัก 5 ประการเกี่ยวกับสุนัขเพื่อนที่ดีที่สุดของมนุษย์! คว้าขนม นั่งลงแล้วดำดิ่งลงไปได้เลย!

ย่อหน้าเสียง AI แรก

หากต้องการสร้างเสียง ให้คลิก ไอคอนเล่น ทางด้านซ้ายของข้อความแจ้ง

สร้างเสียง AI

PlayHT จะสร้างข้อความโดยใช้เสียงของฮัดสัน กระบวนการสร้างอาจใช้เวลาสักครู่ ทั้งนี้ขึ้นอยู่กับจำนวนข้อความที่คุณใช้ เมื่อเสร็จแล้ว คุณจะสามารถดูตัวอย่างเสียงได้โดยคลิก ปุ่มเล่น (1) ทางด้านขวาของหน้าจอ หากคุณไม่พอใจกับผลลัพธ์ คุณสามารถคลิก ปุ่มสร้างใหม่ (2) เพื่อลองอีกครั้ง

สร้างเอาต์พุตใหม่

ย่อหน้าแรกมีเสียงดังนี้:

แม้ว่าสิ่งนี้จะฟังดูค่อนข้างดี แต่ก็อาจต้องใช้การปรับเปลี่ยนเล็กน้อย การเว้นช่วงของเสียงฟังดูไม่ถูกต้องนัก ดังนั้นเราจะทำการปรับเปลี่ยนสองสามอย่าง

กำลังสร้างเอาต์พุตใหม่

PlayHT ช่วยให้คุณสามารถเปลี่ยนแปลงการป้อนข้อความ จากนั้นสร้างใหม่ได้ สิ่งนี้มีประโยชน์เมื่อผลลัพธ์ไม่เป็นไปตามมาตรฐานของคุณ เคล็ดลับที่ดีคือเพิ่มเครื่องหมายขีดกลางระหว่างประโยคเพื่อสร้างการหยุดชั่วคราวที่เป็นธรรมชาติ ด้วยเครื่องกำเนิดเสียงของ AI มีแนวโน้มที่จะเร่งข้อความ ทำให้เกิดประโยคที่ต่อเนื่องไม่เป็นธรรมชาติ ดังนั้น เพื่อแก้ไขปัญหานี้ เราจะเปลี่ยนข้อความเตือนเดิมเป็น: สวัสดีคนรักสุนัข! – วันนี้เราจะมาเปิดเผยข้อเท็จจริงที่น่าสนใจและไม่ค่อยมีใครรู้จัก 5 ประการเกี่ยวกับสุนัขเพื่อนที่ดีที่สุดของมนุษย์! – เอาล่ะ หยิบขนม นั่งลง แล้วดำดิ่งลงไปได้เลย!

นี่คือผลลัพธ์:

ขั้นตอนที่ 4: การโคลนเสียง

คุณสมบัติที่ยอดเยี่ยมอีกประการหนึ่งของ PlayHT คือความสามารถในการสร้างเสียง AI ของคุณเอง ทำงานโดยการอัปโหลดคลิป 30 วินาที จากนั้นแปลงเป็นเสียง AI ที่ใช้งานได้สำหรับโปรเจ็กต์ของคุณ ในการเริ่มต้น คลิกแท็บการโคลนเสียงในอินเทอร์เฟซ PlayHT

การโคลนเสียง AI

จากนั้นคลิกปุ่ม สร้างโคลนใหม่

สร้างโคลนใหม่

เนื่องจากเราใช้ใบอนุญาตฟรี ทางเลือกเดียวของเราคือเลือก ตัวเลือกทันที ซึ่งสร้างเสียง AI จากคลิปเสียงความยาว 30 วินาที

การโคลนนิ่งทันที

จากนั้น ตั้งชื่อเสียงของคุณ (1) เลือกเพศ (2) อัปโหลดไฟล์เสียง (3) ยืนยันว่าคุณมีสิทธิ์ใช้คลิป (4) และคลิก สร้าง (5)

การตั้งค่าโคลนเสียง AI

เมื่อสร้างโคลนแล้ว มันจะปรากฏใต้ปุ่มสร้างโคลนใหม่ (1) จากนั้นคุณสามารถใช้มัน (2) แบ่งปัน (3) หรือลบมัน (4)

ใช้โคลนเสียง AI

หากต้องการดูว่าเสียงเป็นอย่างไร ให้เพิ่มข้อความเพื่อดูตัวอย่าง พูดตามตรง เราค่อนข้างประทับใจกับผลลัพธ์:

ขั้นตอนที่ 5: การส่งออกโครงการ

ขั้นตอนสุดท้ายในกระบวนการสร้างคือการส่งออกไฟล์เสียงของคุณ คุณสามารถทำเช่นนี้ได้สองวิธี: ส่งออกทีละย่อหน้าหรือย่อหน้าทั้งหมดในไฟล์เดียว สำหรับผู้สร้างส่วนใหญ่ การส่งออกไฟล์แยกกันเป็นเรื่องที่เหมาะสม ด้วยวิธีนี้ คุณสามารถเพิ่มฉากคัตซีนและเอฟเฟกต์อื่น ๆ ระหว่างฉากแต่ละฉากได้ หากต้องการส่งออกไฟล์ของคุณ ให้คลิก ปุ่มส่งออก ที่ด้านซ้ายบนของหน้าจอ

ส่งออกเสียง AI

เมนูแบบเลื่อนลงจะปรากฏขึ้นพร้อมสองตัวเลือก: แต่ละย่อหน้าแยกกัน และ เป็นไฟล์เสียงไฟล์เดียว

ส่งออกไฟล์

ไฟล์ทั้งหมดจะถูกส่งออกเป็นไฟล์เสียง wav ซึ่งสามารถนำเข้าได้โดยใช้ซอฟต์แวร์เสียงใดก็ได้

แนวทางปฏิบัติที่ดีที่สุดสำหรับเครื่องกำเนิดเสียง AI

การทำความเข้าใจแนวทางปฏิบัติที่ดีที่สุดบางประการเมื่อสร้างคลิปเพื่อใช้ประโยชน์สูงสุดจากโปรแกรมสร้างเสียง AI ถือเป็นสิ่งสำคัญ ขั้นแรก แยกประโยคโดยเติมเครื่องหมายขีดกลาง (-) ซึ่งจะทำให้อัลกอริทึมรู้ว่าควรมีการหยุดชั่วคราว และโดยทั่วไปจะกำจัดประโยคที่เรียกใช้ ในทำนองเดียวกัน จุลภาคและอัฒภาคสามารถเพิ่มการหยุดชั่วคราวระหว่างคำได้อย่างเป็นธรรมชาติ ในทางกลับกัน หลีกเลี่ยงการใช้ยัติภังค์ระหว่างคำในประโยค ตัวอย่างเช่น คุณจะใช้ ไม่มีทางออกสู่ทะเล มากกว่า ไม่มีทางออกสู่ทะเล

คุณควรเพิ่มช่องว่างระหว่างคำย่อเพื่อช่วยให้ AI เข้าใจว่าควรมีตัวอักษรที่พูดเป็นรายบุคคลมากกว่าคำพูด ตัวอย่างเช่น แทนที่จะใช้ AI ให้ใช้ AI คุณยังสามารถเพิ่มจุดระหว่างตัวอักษรในตัวย่อได้ เพื่อหลีกเลี่ยงการใช้คำซ้ำ ให้ใช้ถ้อยคำในข้อความใหม่โดยใส่เครื่องหมายวรรคตอน เช่น เครื่องหมายจุลภาค อัฒภาค หรือขีดกลาง อีกวิธีหนึ่งในการแก้ไขการกล่าวซ้ำคือการแบ่งประโยคออกเป็นประโยคเล็กๆ วิธีนี้จะป้องกันไม่ให้ AI เกิดความสับสน ซึ่งมักจะจบลงด้วยผลลัพธ์ที่ไม่พึงประสงค์

ความคิดสุดท้ายเกี่ยวกับการสร้างเสียง AI

เครื่องกำเนิดเสียง AI กำลังเปลี่ยนแปลงวิธีที่ผู้สร้างสร้างเสียง ด้วยซอฟต์แวร์ปัญญาประดิษฐ์ เช่น PlayHT คุณสามารถสร้างเสียงสำหรับพอดแคสต์ วิดีโอ YouTube วิดีโอการตลาด สื่อการฝึกอบรม และอื่นๆ อีกมากมาย ในขณะที่เทคโนโลยี AI ก้าวหน้าไป อนาคตของการสร้างเสียงก็มีศักยภาพมหาศาล โดยเปิดประตูสู่ประสบการณ์ที่ดื่มด่ำยิ่งขึ้น

สำหรับผู้ที่สนใจสำรวจแอปพลิเคชัน AI อื่นๆ บล็อกของเรามีโพสต์มากมายที่จะช่วยให้คุณกลายเป็นซูเปอร์สตาร์ AI ในเวลาอันรวดเร็ว

  • วิธีสร้างงานศิลปะด้วย AI ในปี 2023 (บทช่วยสอนโดยละเอียด)
  • 31 วิธีที่คุณสามารถใช้ AI ได้แล้ววันนี้ (คู่มือปี 2023)
  • วิธีใช้ Photoshop AI Generative Fill ในปี 2023 (บทช่วยสอนโดยละเอียด)
  • วิธีใช้ Midjourney เพื่อสร้างงานศิลปะ AI ในปี 2023 (บทช่วยสอนโดยละเอียด)

ภาพเด่นผ่าน Pro_Vector / Shutterstock.com