2023 年の AI 音声の作り方 (チュートリアル)

公開: 2023-09-08

2022 年後半に ChatGPT が登場して以来、新しい生成 AI (人工知能) プログラムがあらゆる場所で登場しています。 よりユニークなタイプの人工知能の 1 つは AI 音声です。AI 音声を使用すると、テキスト プロンプトを使用して、マーケティングや従業員トレーニングなどのための音声クリップを作成できます。 この記事では、人気のプログラム PlayHT を使用して AI 音声を作成する方法を紹介します。 飛び込んでみましょう。

目次
  • 1 AIとは何ですか?
  • 2 AI音声生成とは?
    • 2.1 AI 音声ジェネレーターはどのように機能するのですか?
  • 3 AI音声の作り方
    • 3.1ステップ 1: アカウントの作成
    • 3.2ステップ 2: インターフェイスの探索
    • 3.3ステップ 3: 最初の AI 音声の生成
    • 3.4ステップ 4: 音声のクローン作成
    • 3.5ステップ 5: プロジェクトのエクスポート
  • AI 音声ジェネレーターの4 つのベスト プラクティス
  • AI 音声作成に関する5 つの最終的な考え

AIとは何ですか?

AIとは何ですか

Midjourney で作成された画像

人工知能は、人間が通常行う広範なタスクをコンピューターに実行できるようにする拡張的なテクノロジーです。 ただし、AI システムを使用すると、これらのタスクにかかる時間はほんのわずかです。 AI にはいくつかの種類があり、最も一般的なのはナロー AI です。 このタイプの AI は、単純なテキスト プロンプトから画像、音声、音楽、テキストを作成するために使用されます。

AI音声生成とは何ですか?

AI音声ジェネレーター

Midjourneyで作成された画像 | Photoshop AI

AI 音声は、人間の声の音、特徴、トーンを模倣してコンピューターで生成された音声です。 テキストとして開始するか、自分の声を録音して人間のような独特の音声を作成します。 AI のテキスト読み上げテクノロジーの力を利用して、クリエイターはポッドキャストやナレーション用の音声を開発したり、視覚障害者向けの支援ツールとして機能したりできます。

AI音声ジェネレーターはどのように機能するのでしょうか?

音声ジェネレーターの仕組み

Leonardo で作成されたイメージ | Photoshop AI

AI 音声ジェネレーターが機能するには、テキスト プリプロセッサ、音声転写、および音声合成が必要です。 最初のステップであるテキストの前処理では、生のテキストを取得して、すべてをきちんと整理します。 単語をトークンと呼ばれる小さな部分に分解し、短縮形や特殊文字などの奇妙なアーティファクトを修正し、数字を実際の単語に変換します。

次に、第 2 ステップで、それらのトークンが分析され、動詞、名詞、形容詞などのタグが付けられます。 これは、システムが各単語がどのように使用されるべきか、文脈の中でそれが何を意味するかを理解するのに役立ちます。

ここで魔法が起こります。 テキストは音声分析を受けます。これは、話されたときに単語がどのように聞こえるべきかをキャプチャする特別な種類の文章に変換されることを意味します。 これには、スピーチを自然に聞こえるようにするための強弱、口調、リズムが含まれます。

最後のステップでは、これまでの苦労がすべて報われます。 音声転写は、音波を使用して実際の音声に変換されます。 最新の AI アルゴリズムのおかげで、現在生成される音声は、過去のテキスト読み上げエンジンよりもはるかに自然で人間らしく聞こえます。

AIの声を作る方法

Play.HT AI音声

IBM が 1962 年に Shoebox をリリースして以来、音声ジェネレータは大きな進歩を遂げてきました。PlayHT などの最新のシステムには、さまざまなトーンのさまざまな合成音声があり、最もリアルな音声を作成することが可能です。 MurfAI などの他のツールを使用すると、ピッチ、トーン、スピードを調整できます。 このチュートリアルでは、PlayHT を使用して AI 音声を作成します。

ステップ 1: アカウントの作成

プロセスの最初のステップは、無料の PlayHT アカウントを作成することです。 まずホームページに移動し、画面右上の「無料で試す」ボタンをクリックします。

アカウントを作成する

Google アカウントを使用してサインアップすることも、名前とメールアドレスを入力することもできます。 選択した方法を使用し、 「サインアップ」をクリックして続行します。

Play.HT にサインアップする

次のステップでは、PlayHT を個人として使用する予定があるか、会社設定で使用する予定があるかを選択します。

セットアップ手順

PlayHT は、次のいくつかの画面でソフトウェアの使用方法について質問します。

PlayHT AI音声のセットアップ

選択が完了し、アカウントが作成されたら、インターフェイスの探索を開始できます。

ステップ 2: インターフェースを調べる

最初の音声を生成する前に、インターフェースに慣れましょう。

  1. 新しいファイルの作成:ここで最初のプロジェクトを作成します。
  2. 最近のファイル:最新のプロジェクトのリスト。
  3. ファイル:すべてのファイルが置かれている場所。
  4. 音声のクローン作成:音声のオーディオをアップロードし、ソフトウェアで使用するためにクローンを作成できます。
  5. API アクセス: PlayHT を他のアプリケーションに統合するため
  6. 請求:アカウントを管理します。
  7. 言語セレクター:現時点では英語が唯一のオプションですが、他の言語も準備中です。
  8. 単語数:残りの単語数を確認できます。
  9. すべての段落を生成: AI 音声を生成するために使用されます。
  10. ビデオのインポート:アップロードされたビデオにナレーションを追加します。
  11. テキストプロンプト: AI音声生成のためのテキスト入力。
  12. オーディオ コントロール:音声のタイムラインを調整し、クリップを並べ替えます。
  13. プロジェクトのエクスポート:プロジェクトを段落ごとに、または 1 つの wav ファイルとして保存します。

PlayHTインターフェース

ステップ 3: 初めての AI 音声を生成する

PlayHT を使用した AI 音声の生成は簡単です。 独自のスクリプトを作成することも、AI チャットボットを使用して支援することもできます。 このチュートリアルでは、ChatGPT を使用して音声のテキストを生成します。 まず、 [新しいファイルの作成]ボタンをクリックして、音声用の新しいプロジェクトを作成します。

新しいファイルを作成する

次に、プロジェクト用の合成音声を選択します。 これを行うには、テキスト プロンプトのすぐ上にある音声アイコンをクリックします。

AI音声を選択

新しいポップアップ ウィンドウが表示され、130 を超える AI 音声の 1 つをサンプリングできます。 選択するには、単にそれをクリックし (1)、再生速度を選択し (2)、プロジェクト内のすべての段落に音声を適用することを選択し (3)、変更を確認します (4)。

AI音声を切り替える

ハドソンを選択するのは、ハドソンが最も現実的であり、スクリプトに適した語り口を持っているためです。

ChatGPT を使用してビデオ スクリプトを生成する

音声を選択したので、テキストを生成する必要があります。 ChatGPT に、犬に関する興味深い事実を提供する短いビデオ スクリプトの作成を依頼します。 次のプロンプトを使用しました:犬に関する 5 つの知られざる事実を紹介する短いビデオ スクリプトを提供してください

ChatGPTビデオスクリプト

スクリプトが生成されたら、プロジェクトにテキストを入力する必要があります。 まず、スクリプトのイントロを PlayHT に貼り付けます。こんにちは、犬愛好家の皆さん! 今日は、人間の親友である犬に関する、あまり知られていない魅力的な 5 つの事実を明らかにします。 さあ、おやつを買って、座って、飛び込みましょう!

最初の AI 音声段落

音声を生成するには、テキスト プロンプトの左側にある再生アイコンをクリックします。

AI音声を生成する

PlayHT はハドソンの音声を使用してテキストを生成します。 使用するテキストの量によっては、生成プロセスに最大で数分かかる場合があります。 完了したら、画面の右側にある再生ボタン(1) をクリックして音声をプレビューできるようになります。 結果に満足できない場合は、再生成ボタン(2) をクリックして再試行できます。

出力を再生成する

最初の段落は次のようになります。

これはかなり良い音ですが、少し調整が必要になる可能性があります。 音声の途切れが適切に聞こえないため、いくつか調整します。

出力を再生する

PlayHT を使用すると、テキスト入力に変更を加えて再生成できます。 これは、出力が基準を満たしていない場合に役立ちます。 良いヒントは、文の間にダッシュを追加して自然なポーズを作成することです。 AI 音声ジェネレーターを使用すると、テキストを急ぎすぎて、不自然な連続文が作成される傾向があります。 したがって、これを修正するために、元のプロンプトを次のように変更します。愛犬家の皆さん、こんにちは! – 今日は、人類の親友である犬に関する、あまり知られていない魅力的な 5 つの事実を明らかにします。 – それでは、おやつを買って、座って、飛び込んでみましょう!

結果は次のとおりです。

ステップ 4: 音声クローン作成

PlayHT のもう 1 つの優れた機能は、独自の AI 音声を作成できることです。 これは、30 秒のクリップをアップロードし、プロジェクトで使用できる AI 音声に変換することで機能します。 開始するには、PlayHT インターフェイスの [音声クローン作成] タブをクリックします。

AI音声クローン作成

次に、 「新しいクローンの作成」ボタンをクリックします。

新しいクローンを作成する

無料ライセンスを使用しているため、唯一のオプションは、30 秒のサウンド クリップから AI 音声を作成するインスタント オプションを選択することです。

インスタントクローン作成

次に、声に名前を付け (1)、性別を選択し (2)、音声ファイルをアップロードし (3)、クリップを使用する権利があることを確認し (4)、 「作成」をクリックします (5)。

AI音声クローン設定

クローンが作成されると、[新しいクローンの作成] ボタン (1) の下に表示されます。 そこから、使用 (2)、共有 (3)、削除 (4) を行うことができます。

AI音声クローンを使用

どのように聞こえるかを確認するには、テキスト プロンプトを追加してプレビューします。 正直に言うと、私たちはその結果に非常に感銘を受けました。

ステップ 5: プロジェクトのエクスポート

作成プロセスの最後のステップは、サウンド ファイルをエクスポートすることです。 これは、一度に 1 つの段落をエクスポートするか、1 つのファイル内のすべての段落をエクスポートする 2 つの方法のいずれかで行うことができます。 ほとんどのクリエイターにとって、ファイルを個別にエクスポートすることは理にかなっています。 こうすることで、各シーンの間にカット シーンやその他のエフェクトを追加できます。 ファイルをエクスポートするには、画面の左上にあるエクスポート ボタンをクリックします。

AI音声をエクスポートする

ドロップダウン メニューには 2 つのオプションが表示されます。各段落を個別に表示する方法と、単一の音声ファイルとして表示する方法です。

エクスポートファイル

すべてのファイルは wav オーディオ ファイルとしてエクスポートされ、任意のオーディオ ソフトウェアを使用してインポートできます。

AI 音声ジェネレーターのベスト プラクティス

AI 音声ジェネレーターを最大限に活用するには、クリップを作成する際のいくつかのベスト プラクティスを理解することが重要です。 まず、ダッシュ (-) を追加して文を区切ります。 これにより、アルゴリズムは一時停止が必要であることを認識し、通常は連続した文が削除されます。 同様に、コンマとセミコロンを使用すると、単語の間に自然な休止を追加できます。 一方、文中の単語の間にハイフンを使用することは避けてください。 たとえば、 land-lockedではなくlandlockedを使用します。

また、単語ではなく個々の音声文字が必要であることを AI が理解できるように、頭字語の間にスペースを追加する必要があります。 たとえば、 AI を使用する代わりにAIを使用します。 頭字語の文字の間にピリオドを追加することもできます。 単語の繰り返しを避けるには、カンマ、セミコロン、ハイフンなどの句読点を含めてテキストを言い換えます。 繰り返しを改善するもう 1 つの方法は、文を小さな文に分割することです。 これにより、通常は望ましくない結果に終わる AI の混乱を防ぎます。

AI 音声の作成に関する最終的な考え

AI 音声ジェネレーターは、クリエイターのオーディオ作成方法を変えています。 PlayHT のような人工知能ソフトウェアを使用して、ポッドキャスト、YouTube ビデオ、マーケティング ビデオ、トレーニング資料などの音声を作成できます。 AI テクノロジーが進歩するにつれて、音声生成の将来には大きな可能性が秘められており、より没入型のエクスペリエンスへの扉が開かれます。

他の AI アプリケーションの探索に興味がある方のために、私たちのブログには、すぐに AI スーパースターになるのに役立つ記事がたくさんあります。

  • 2023 年の AI アートの作り方 (詳細チュートリアル)
  • 今すぐ AI を活用できる 31 の方法 (2023 年ガイド)
  • 2023 年に Photoshop AI Generative Fill を使用する方法 (詳細なチュートリアル)
  • Midjourney を使用して 2023 年に AI アートを作成する方法 (詳細なチュートリアル)

Pro_Vector / Shutterstock.com 経由の注目の画像