2023 年如何制作人工智能语音(教程)

已发表: 2023-09-08

自 ChatGPT 于 2022 年底问世以来,新的生成式 AI(人工智能)程序已随处涌现。 人工智能中比较独特的类型之一是AI语音,它允许您使用文本提示来创建用于营销、员工培训等的语音剪辑。 在这篇文章中,我们将向您展示如何使用流行的程序 PlayHT 制作人工智能语音。 让我们深入了解一下。

目录
  • 1什么是人工智能?
  • 2什么是人工智能语音生成?
    • 2.1 AI语音发生器如何工作?
  • 3如何制作人工智能语音
    • 3.1第 1 步:创建帐户
    • 3.2第 2 步:探索界面
    • 3.3第三步:生成你的第一个人工智能语音
    • 3.4第四步:语音克隆
    • 3.5步骤 5:导出项目
  • AI 语音生成器的4 个最佳实践
  • 关于创建 AI 语音的5 个最终想法

什么是人工智能?

什么是人工智能

使用 Midjourney 创建的图像

人工智能是一项广泛的技术,它允许计算机执行人类通常会执行的广泛任务。 然而,这些任务只需要人工智能系统的一小部分时间。 人工智能有多种类型,最常见的是狭义人工智能。 这种类型的人工智能用于根据简单的文本提示创建图像、语音、音乐和文本。

什么是人工智能语音生成?

人工智能语音发生器

使用 Midjourney 创建的图像 | 图像处理软件

人工智能语音是计算机生成的语音,模仿人类声音的声音、特征和语气。 它们要么以文本形式开始,要么通过录制您自己的声音来创建独特的人类声音。 借助人工智能文本转语音技术的力量,创作者可以为播客、画外音开发声音,或作为视障人士的辅助工具。

人工智能语音发生器如何工作?

语音发生器的工作原理

使用 Leonardo 创建的图像 | 图像处理软件

人工智能语音生成器需要文本预处理器、语音转录和语音合成才能工作。 第一步是文本预处理,获取原始文本并使其整齐有序。 它将单词分解为更小的部分(称为标记),修复奇怪的工件(例如缩写或特殊字符),并将数字转换为实际单词。

然后,在第二步中,分析这些标记并给出动词、名词或形容词等标签。 这有助于系统理解每个单词应该如何使用以及它在上下文中的含义。

现在,这就是奇迹发生的地方。 文本经过语音分析,这意味着它被转换成一种特殊的文字,可以捕捉单词在说话时的发音。 这包括重音、语气和节奏,使演讲听起来自然。

终于,在最后一步,所有的努力都得到了回报。 使用声波将语音转录转化为真实的语音。 得益于现代人工智能算法,现在生成的语音比过去的文本转语音引擎听起来更自然、更接近人类。

如何制作人工智能语音

Play.HT人工智能语音

自从 IBM 于 1962 年发布 Shoebox 以来,语音生成器已经取得了长足的进步。现代系统,例如 PlayHT,具有各种不同音调的合成声音,使得创建最真实的声音成为可能。 其他工具,例如 MurfAI,将允许您调整音调、音调和速度。 在本教程中,我们将使用 PlayHT 创建 AI 语音。

第 1 步:创建帐户

该过程的第一步是创建一个免费的 PlayHT 帐户。 首先导航到主页,然后单击屏幕右上角的免费试用按钮。

创建账户

您可以使用 Google 帐户注册或输入您的姓名和电子邮件。 使用您选择的方法,然后单击“注册”继续。

注册 Play.HT

在下一步中,选择您计划以个人身份还是在公司环境中使用 PlayHT。

设置步骤

PlayHT 将在接下来的几个屏幕中询问有关如何使用该软件的问题。

设置 PlayHT AI 语音

做出选择并创建帐户后,您就可以开始探索该界面。

第 2 步:探索界面

在生成第一个声音之前,让我们先熟悉一下界面:

  1. 创建新文件:您将在此处创建第一个项目。
  2. 最近的文件:您最近的项目的列表。
  3. 文件:所有文件所在的位置。
  4. 语音克隆:您可以上传语音音频,然后将其克隆以在软件中使用。
  5. API 访问:用于将 PlayHT 集成到其他应用程序中
  6. 计费:管理您的帐户。
  7. 语言选择器:英语是目前唯一的选择,但其他语言正在开发中。
  8. 字数统计:允许您查看剩余的可用字数。
  9. 生成所有段落:用于生成AI语音。
  10. 导入视频:为上传的视频添加画外音。
  11. 文字提示:文字输入,AI语音生成。
  12. 音频控制:调整声音的时间线,并重新排列剪辑。
  13. 导出项目:将项目逐段保存或保存为一个 wav 文件。

PlayHT接口

第 3 步:生成您的第一个人工智能语音

使用 PlayHT 生成 AI 语音非常简单。 您可以创建自己的脚本或使用人工智能聊天机器人来帮助您。 在本教程中,我们将使用 ChatGPT 生成语音文本。 首先单击“创建新文件”按钮为我们的声音创建一个新项目。

创建新文件

接下来,我们将为该项目选择合成声音。 为此,请单击文本提示正上方的语音图标

选择AI语音

将出现一个新的弹出窗口,允许您从 130 多种 AI 声音中选择一种进行采样。 要选择一个,只需单击它 (1),选择播放速度 (2),选择将语音应用到项目中的所有段落 (3),然后确认更改 (4)。

切换AI语音

我们会选择哈德森,因为他听起来最现实,并且对我们的剧本有很好的叙事声音。

使用 ChatGPT 生成视频脚本

现在我们已经选择了声音,我们需要生成一些文本。 我们将要求 ChatGPT 创建一个简短的视频脚本,提供有关狗的有趣事实。 我们使用了以下提示:提供一个简短的视频脚本来展示关于狗的 5 个未知事实

ChatGPT 视频脚本

生成脚本后,我们需要为项目输入一些文本。 我们首先将脚本的介绍粘贴到 PlayHT 中:您好,爱狗人士! 今天,我们将揭开关于人类最好的朋友狗的五个有趣且鲜为人知的事实! 所以,吃点东西,坐下来,让我们开始吧!

第一段AI语音

要生成语音,请单击文本提示左侧的播放图标

生成AI语音

PlayHT 将使用 Hudson 的声音生成文本。 根据您使用的文本量,生成过程可能需要长达几分钟的时间。 完成后,您可以通过单击屏幕右侧的播放按钮(1) 来预览语音。 如果您对结果不满意,可以单击“重新生成”按钮(2) 重试。

再生输出

第一段听起来是这样的:

虽然这听起来不错,但还需要进行一些调整。 声音的停顿听起来不太正确,所以我们将进行一些调整。

再生输出

PlayHT 允许您更改文本输入,然后重新生成它。 当输出不符合您的标准时,这很有帮助。 一个好的技巧是在句子之间添加破折号以创建自然的停顿。 使用人工智能语音生成器时,往往会出现匆忙文本的情况,从而创建不自然的连续句子。 因此,为了纠正这个问题,我们将原来的提示更改为:爱狗人士您好! – 今天,我们将揭开关于人类最好的朋友——狗的五个有趣且鲜为人知的事实! – 所以,吃点东西,坐下来,让我们开始吧!

结果如下:

第四步:语音克隆

PlayHT 的另一个很酷的功能是能够创建您自己的 AI 声音。 它的工作原理是上传一个 30 秒的剪辑,然后将其转换为您的项目可用的人工智能语音。 首先,单击 PlayHT 界面中的语音克隆选项卡。

AI语音克隆

接下来,单击创建新克隆按钮。

创建新克隆

由于我们使用的是免费许可证,因此我们唯一的选择是选择即时选项,该选项会根据 30 秒的声音剪辑创建 AI 语音。

即时克隆

接下来,为您的声音命名 (1),选择性别 (2),上传音频文件 (3),确认您有权使用该剪辑 (4),然后单击“创建” (5)。

AI语音克隆设置

创建克隆后,它将出现在创建新克隆按钮 (1) 的下方。 从那里,您可以使用它 (2)、共享它 (3) 或删除它 (4)。

使用AI语音克隆

要查看听起来如何,请添加文本提示来预览它。 说实话,我们对结果印象深刻:

第 5 步:导出项目

创建过程的最后一步是导出声音文件。 您可以通过以下两种方式之一执行此操作:一次导出一个段落或一个文件中的所有段落。 对于大多数创作者来说,单独导出文件是有意义的。 这样,您就可以在每个场景之间添加过场动画和其他效果。 要导出文件,请单击屏幕左上角的导出按钮

导出AI语音

将出现一个下拉菜单,其中有两个选项:每个段落单独作为单个音频文件

导出文件

所有文件均导出为 wav 音频文件,可以使用任何音频软件导入。

AI语音生成器的最佳实践

在创建剪辑时了解一些最佳实践以充分利用人工智能语音生成器非常重要。 首先,通过添加破折号 (-) 来分隔句子。 这让算法知道应该有一个暂停,并且通常会消除连续的句子。 同样,逗号和分号可以在单词之间添加自然停顿。 另一方面,避免在句子中的单词之间使用连字符。 例如,您可以使用landlocked而不是land-locked

您还应该在首字母缩略词之间添加空格,以帮助人工智能理解应该有单独的口头字母而不是单词。 例如,不要使用AI ,而是使用AI 。 您还可以在首字母缩略词中的字母之间添加句点。 为了避免单词重复,请重新措辞文本以包含标点符号,例如逗号、分号或连字符。 纠正重复的另一种方法是将句子分成更小的句子。 这可以防止人工智能变得混乱,而这通常会导致不良结果。

关于创建人工智能语音的最终想法

人工智能语音生成器正在改变创作者制作音频的方式。 通过 PlayHT 等人工智能软件,您可以为播客、YouTube 视频、营销视频、培训材料等创建声音。 随着人工智能技术的进步,语音生成的未来拥有巨大的潜力,为更身临其境的体验打开了大门。

对于那些有兴趣探索其他人工智能应用程序的人,我们的博客有大量帖子可以帮助您立即成为人工智能超级明星。

  • 2023年如何制作AI艺术(详细教程)
  • 当今使用 AI 的 31 种方式(2023 年指南)
  • 2023年如何使用Photoshop AI生成填充(详细教程)
  • 2023年如何利用中途创作AI艺术(详细教程)

精选图片来自 Pro_Vector / Shutterstock.com