2023 年の AI ライティングを検出する方法
公開: 2023-07-292022 年後半に ChatGPT がリリースされて以来、人工知能 (AI) は爆発的に普及しました。 アート、音声、ビデオ、文章などを作成するための AI プログラムがあります。 AI は、生産性を向上させ、創造性を刺激する優れたパートナーとなり得ます。 ただし、他の新しいテクノロジーと同様に、非倫理的な方法でそれを利用する人もいます。 この投稿では、AI の世界を探索し、AI の書き込みを検出する方法に関するヒントをいくつか紹介します。
始めましょう。
- 1 AIライティングとは何ですか?
- 2 AIライターはどのように働くのですか?
- AI ライティングの3 つの課題
- 4 AIの書き込みを検出する方法
- 4.1トーンとスタイル
- 4.2精度
- 4.3個人的なタッチの欠如
- 4.4反復的な言語
- 4.5 AI コンテンツ検出ツール
- 5 Originality.ai を使用して AI 書き込みを検出する
- 5.1 Originality.ai にサインアップする
- 5.2最初のスキャンの実行
- 6 GPTZero を使用して AI 書き込みを検出する
- AI 書き込みの検出に関する7 つの最終的な考え
AIライティングとは何ですか?
AI ライティングとは、人工知能を使用して、ChatGPT などの言語モデルを通じてオリジナルのコンテンツを作成することです。 必要なコンテンツの種類を説明するテキスト プロンプトを入力するだけで、AI が数秒でそのコンテンツを提供します。 AI 支援によるライティングは数年前から存在していましたが、ここ 1 年で爆発的に普及しました。 利用可能な AI ライティング ソフトウェア プログラムは数多くあり、それぞれに独自の分野があります。 ブログの概要、目を引く見出し、完全なブログ投稿などを作成できます。 テクノロジーが進化し続けるにつれて、AI の書き込みを検出することはさらに難しくなるでしょう。 しかし、ここ数カ月で、人工的に生成されたコンテンツの発見に役立つ AI コンテンツ検出器がいくつかリリースされました。
AIライターはどのように働くのか?
ほとんどの AI ライターは、大規模言語モデル (LLC) アルゴリズムを使用する OpenAI による生成事前トレーニング済みトランスフォーマー 3 (GPT3) に基づいています。 LLM は、トレーニングされたデータセットを使用して、コンテキストを維持しながらどの単語が隣り合う可能性が高いかを予測することで文をつなぎ合わせます。 ほとんどの場合、AI が正しく判断します。 ただし、幻覚や虚偽が現れる場合もあります。 一般に、これは約 20% の確率で発生します。
生成 AI を使用してコンテンツを作成する場合、留意すべき点がいくつかあります。 ChatGPT の場合、そのデータセットは、2021 年 9 月までにインターネットから収集された約 570 GB の情報に基づいています。これには、ブログ、書籍、検索結果、その他の関連情報が含まれます。 したがって、2021 年以降について質問すると、通常は誤った出力が生成されます。 だからこそ、生成されるものすべてをファクトチェックするだけでなく、本質的にはそれが提供するものを一字一句コピーしないことが非常に重要です。
AI ライティングの課題
AI ライティング ツールは、生産性と創造性を向上させ、ライティング スキルがほとんどまたはまったくない人がより優れたコンテンツ クリエーターになるのに役立ちます。 ただし、課題もあります。 AI テキスト ジェネレーターの改良により、人間が作成したコンテンツとコンピューターが作成したコンテンツの違いを見分けることがますます困難になるでしょう。 AI によって作成されたコンテンツは、感情がなく、創造的な入力が欠けているように見え、トレーニング対象のデータセットに限定されているように見えます。 OpenAI は、生成されたコンテンツがオリジナルであると述べていますが、単語の関連付けを使用し、インターネット上のデータから情報を引き出します。 そのため、盗作や虚偽の情報、著作権侵害などの懸念があります。
抑制と均衡がなければ、一部の人々が AI を無責任に使用することになり、企業は従業員が責任を持って倫理的に AI を使用することを保証するために追加の措置を講じることが求められます。 ありがたいことに、AI の書き込みを検出する際に注意すべきことがいくつかあります。
AI の書き込みを検出する方法
優れた AI 検出ツールを使用したとしても、AI が生成したコンテンツをすべて検出できるという 100% の確実性はありません。 したがって、他の方法でそれを識別することが重要です。
トーンとスタイル
AI コンテンツの最大の問題の 1 つは、トーンとスタイルに一貫性がないことです。 AI モデルはここ 1 年で驚くべき進歩を遂げましたが、依然として人間のようなコンテンツを作成するのに苦労しています。 これは主に、GPT3 モデルがトレーニングされたデータに起因すると考えられます。 前述したように、LLM はコンテンツを作成するときに、連想を使用して単語の配置の確率を決定します。 したがって、出力は多くの場合、つなぎ言葉や変化するトーンが不足し、ほとんどロボットのようになります。 例として ChatGPT を使用してみましょう。
私たちは、「海洋動物について 1 つの段落を書いてください」というプロンプトを提供しました。
ChatGPT はこれを生成しました:
この方法を使用して AI によって生成されたコンテンツを判断するのは難しいですが、覚えておくべきことが 1 つあります。 人間が文章を書く場合、通常はテキスト全体にさまざまなトーンやスタイルが存在しますが、コンピューターにはそれがありません。 人間の思考パターンには変化があり、その結果、口調が変わります。 コンピューターを使用すると、データセットに含まれるコンテンツが出力されるため、より均一な結果が得られます。
正確さ
もう 1 つの危険信号は、精度の欠如です。 この投稿の前半でこれについて触れましたが、さらに詳しく説明することが重要です。 前述したように、ChatGPT は 2021 年までの膨大な量のデータに基づいてトレーニングされました。したがって、その日以降の現在の出来事や情報について尋ねられた場合、結果は間違いなく歪められます。 したがって、インターネット上のコンテンツを読むときは、すべてを事実確認することが不可欠です。 ChatGPT の最近の更新には、現在の出来事に関する質問をするときに、回答が 2021 年 9 月時点で関連していることを示す文言が含まれています。 ただし、この更新は役に立ちますが、不正確な出力が得られる可能性があることに注意してください。
ChatGPT を使用して、次のプロンプトを入力しました。キャラクター AI が何であるかを説明する 1 つの段落を入力してください。
これが出力でした:
私たちは、キャラクター AI について質問することで、誤った情報を提供させようとしていました。 ChatGPT は、このプラットフォームが 1 年後まで一般公開されていなかったことを考慮して、Character AI についてどう考えているかを私たちに知らせるために最善を尽くしました。
個人的なタッチの欠如
コンピューターで作成されたコンテンツを見分ける優れた方法は、個人的な意見や感情の欠如に注目することです。 人間のライターのほとんどは、文章全体にスラングを取り入れたり、個人的な意見を述べたりします。 あるいは、コンピュータはより事実に基づいたものであり、答えを提示するだけです。 通常、感情や信念は見つかりません。
たとえば、ChatGPT に Synthesia の AI アバターに関する 1 つの段落を提供するよう依頼しました。
これがその出力です:
同社がAIアバターを使って何をしているのかについてはうまく説明していましたが、非常に単調で、感情や深みが欠けているように思えます。
反復的な言語
AI によって生成されたコンテンツを特定するもう 1 つの方法は、反復的な言語を使用することです。 記事内に大量のキーワードが詰め込まれていることに気付いた場合、それは人工知能によって作成された可能性があります。 プロンプトを使用して AI 出力を生成するため、プロンプトにキーワードが含まれることがよくあります。 これにより、通常、その単語がテキスト全体で何度も繰り返されることになります。
例えばChatGPTさんにAIの解説をお願いしました。 結果はこうなりました。
AIという単語が16回繰り返され、約250の単語が生成されました。 人気の SEO プラグインである Yoast SEO によると、その量のテキスト内にそのキーワードが含まれるのは 8 回のみであるはずです。
AI コンテンツ検出ツール
最後に、AI コンテンツ検出ツールを使用して、コンピューターで生成されたコンテンツを識別できます。 彼らはコンテキストを使用してテキストを分析し、単語が一緒に出現する可能性を理解します。 パターンが予測可能であればあるほど、AI によって生成された可能性が高くなります。 人間とは異なり、AI は通常、より創造的な文章を書くことはなく、より予測可能であり、意見を提示しません。
テキストと画像の両方に対応する AI コンテンツ検出ツールがいくつかありますが、最も人気のあるツールとしては Originality AI と GPTZero があります。 次のセクションでは、それぞれの仕組みと使用方法の概要を説明します。
Originality.ai を使用して AI 書き込みを検出する
Originality.ai は、マーケティング担当者が AI コンテンツを検出するために使用する主要なツールの 1 つです。 主に ChatGPT、GPT-4、および Bard を通じて生成されたコンテンツを識別するために作成され、自然言語処理を使用して AI を識別します。 無料のサービスではありませんが、100 単語チェックするごとに 0.01¢ という手頃な価格です。 50 クレジットが付与される Chrome 拡張機能を試すこともできます。
Originality.ai にサインアップする
最初のステップはサインアップです。 Web サイトにアクセスし、画面右上の[サインアップ]ボタンをクリックして開始します。
次に、名前、電子メールを入力し、パスワードを作成し、利用規約に同意します。 次に、 「続行」をクリックします。
次のステップでは、クレジット カード情報を入力し、20 ドル相当のクレジットを購入することに同意し、約 20,000 ワードの AI 検出を購入します。
最初のスキャンの実行
ログインすると、ダッシュボードは直感的に操作できます。 URL を入力するか、ファイルをアップロードするか、テキストを貼り付けることで、コンテンツをスキャンできます。 最初のスキャンを実行するには、 [コンテンツ スキャナー]タブをクリックし、 [新しいスキャンの開始]を選択します。
Google から取得したニュース記事のいくつかの段落をスキャナーに入力して、機能をテストします。 スキャンを開始するには、テキストをエディタに貼り付けます (1)。 次に、 「今すぐスキャン」をクリックします (2)。 タイトルを入力することも、Originality.ai にタイトルを作成させることもできます (3)。
スキャンが完了すると、Originality.ai はコンテンツを評価し、人間によるものなのか、部分的な AI なのか、完全な AI なのかを判断します。 この例では、Originality のスキャナーは 100% のオリジナル スコアを記録しました。
ChatGPT で完全に生成された段落を使用した別の例を試してみましょう。
ご覧のとおり、結果はかなり正確です。 ただし、最良の結果を得るには、訓練された目で AI を検出し、 AI 検出ツールを使用することが重要です。
GPTZero を使用して AI 書き込みを検出する
もう 1 つの人気のある AI コンテンツ検出器である GPTZero を使用してみましょう。 これにより、最大 5000 文字を無料で検出できます。 アカウントにサインアップすると、追加のキャラクターを購入できます。 GPTZero を使用すると、テキストのスキャンが簡単になります。 スキャンするテキスト (1) を貼り付けるか、ファイルをアップロード (2)、利用規約に同意し (3)、結果を取得ボタン (4) をクリックします。
GPTZero は、Divi ページの最初の段落を使用して、テキストが完全に人間によって書かれている可能性が高いことを示します。
最後に、ChatGPT を使用して生成したテキストを使用してみましょう。
コンテンツが完全に AI を使用して生成されたものであるかどうかは特定できませんでしたが、使用された可能性があることは検出できました。
AI 書き込みの検出に関する最終的な考え
AI ライティングは ChatGPT のリリース以来急速に進化し、コンテンツの作成方法に不可欠な部分になりました。 使用するメリットはありますが、AI コンテンツを認識できることが重要です。 テクノロジーが急速に進歩しているため、AI の書き込みを検出することは今後も困難になります。 一貫性のない口調やスタイル、感情の欠如、繰り返しの言葉などの不一致を認識することで、AI が使用されている場所を正確に指摘する目を訓練できます。 さらに、Originality.ai や GPTZero などの AI 検出ツールを組み込んで識別しやすくすることもできます。
AI についてもっと学ぶことに興味がありますか? 最近の投稿をいくつかご覧ください。
- 今すぐ AI を活用できる 31 の方法 (2023 年ガイド)
- 2023 年に生産性を高めるベスト AI アシスタント 16 選
- Writesonic レビュー 2023: 最高の AI ライティング ソフトウェア?
- Copy.ai とは何か、その使用方法 (10 のプロのヒント)
BestForBest /shutterstock.com 経由の注目の画像