2023년 AI 쓰기 감지 방법
게시 됨: 2023-07-292022년 말 ChatGPT가 출시된 이후 인공 지능(AI)이 폭발적으로 증가했습니다. 예술, 음성, 비디오, 글쓰기 등을 만드는 AI 프로그램이 있습니다. AI는 생산성을 높이고 창의성을 촉발하는 훌륭한 동반자가 될 수 있습니다. 그러나 모든 신기술과 마찬가지로 일부 사람들은 비윤리적인 방법으로 이를 이용할 것입니다. 이 게시물에서는 AI의 세계를 탐구하고 AI 쓰기를 감지하는 방법에 대한 몇 가지 팁을 제공합니다.
시작하자.
- 1 AI 글쓰기란?
- 2 AI 작성자는 어떻게 작동합니까?
- AI 쓰기의 3 가지 과제
- 4 AI 쓰기를 감지하는 방법
- 4.1 톤과 스타일
- 4.2 정확도
- 4.3 개인적인 접촉의 부족
- 4.4 반복되는 언어
- 4.5 AI 콘텐츠 탐지 도구
- 5 Originality.ai를 사용하여 AI 쓰기 감지
- 5.1 Originality.ai에 가입하기
- 5.2 첫 번째 스캔 수행
- 6 GPTZero를 사용하여 AI 쓰기 감지
- AI 쓰기 감지에 대한 7가지 최종 생각
AI 글쓰기란?
AI 글쓰기는 ChatGPT와 같은 언어 모델을 통해 인공 지능을 사용하여 독창적인 콘텐츠를 만드는 것입니다. 원하는 콘텐츠 유형을 설명하는 텍스트 프롬프트를 입력하기만 하면 AI가 해당 콘텐츠를 몇 초 안에 제공합니다. AI 지원 글쓰기는 몇 년 동안 있었지만 작년에 폭발적으로 증가했습니다. 수십 개의 AI 작성 소프트웨어 프로그램이 있으며 각각 고유한 틈새 시장이 있습니다. 블로그 개요, 눈길을 끄는 헤드라인, 완전한 블로그 게시물 등을 만들 수 있습니다. 기술이 계속 발전함에 따라 AI 쓰기를 감지하는 것이 더 어려워질 것입니다. 그러나 최근 몇 달 동안 인위적으로 생성된 콘텐츠를 찾는 데 도움이 되는 여러 AI 콘텐츠 탐지기가 출시되었습니다.
AI 작성자는 어떻게 작동합니까?
대부분의 AI 작성기는 OpenAI의 GPT3(Generative Pre-trained Transformer 3)를 기반으로 하며, 이는 대규모 언어 모델(LLC) 알고리즘을 사용합니다. LLM은 컨텍스트를 유지하면서 서로 옆에 배치될 가능성이 있는 단어를 예측하여 문장을 연결하도록 훈련된 데이터 세트를 사용하여 작동합니다. 대부분의 경우 AI가 제대로 처리합니다. 그러나 환각이나 허위가 발생할 때가 있습니다. 일반적으로 이것은 약 20%의 시간에 발생합니다.
생성 AI를 사용하여 콘텐츠를 작성할 때 염두에 두어야 할 몇 가지 사항이 있습니다. ChatGPT의 경우 데이터 세트는 2021년 9월까지 인터넷에서 스크랩한 약 570GB의 정보를 기반으로 합니다. 여기에는 블로그, 책, 검색 결과 및 기타 관련 정보가 포함됩니다. 따라서 2021년 이후에 대해 질문하면 일반적으로 잘못된 결과가 생성됩니다. 그렇기 때문에 그것이 생성하는 모든 것을 사실 확인하는 것뿐만 아니라 본질적으로 그것이 당신에게 제공하는 것을 절대 복사 하지 않는 것이 매우 중요합니다.
AI 쓰기의 과제
AI 쓰기 도구는 생산성과 창의성을 높이고 쓰기 기술이 거의 또는 전혀 없는 사람들이 더 나은 콘텐츠 제작자가 되도록 도울 수 있습니다. 그러나 그들은 도전 과제를 제시합니다. AI 텍스트 생성기의 개선으로 사람과 컴퓨터로 작성된 콘텐츠의 차이를 구분하는 것이 점점 더 어려워질 것입니다. AI로 작성된 콘텐츠는 감정이 없고 창의적인 입력이 부족하며 훈련된 데이터 세트로 제한될 수 있습니다. OpenAI는 생성된 콘텐츠가 원본이라고 말하지만 단어 연관을 사용하고 인터넷을 통해 데이터에서 정보를 가져옵니다. 그렇기 때문에 표절, 허위사실, 저작권 침해 등의 우려가 있습니다.
견제와 균형이 없다면 일부 사람들은 AI를 무책임하게 사용할 것이며 기업은 직원들이 책임감 있고 윤리적으로 AI를 사용할 수 있도록 추가 조치를 취해야 합니다. 고맙게도 AI 쓰기를 감지할 때 주의해야 할 몇 가지 사항이 있습니다.
AI 쓰기를 감지하는 방법
우수한 AI 감지 도구를 사용하더라도 AI 생성 콘텐츠를 모두 포착할 것이라는 100% 확신은 없습니다. 따라서 다른 방법으로 식별하는 것이 중요합니다.
톤과 스타일
AI 콘텐츠의 가장 큰 문제 중 하나는 어조와 스타일이 얼마나 일관성이 없을 수 있는지입니다. AI 모델은 지난 한 해 동안 놀라운 발전을 이루었지만 여전히 인간과 유사한 콘텐츠를 제작하는 데 어려움을 겪고 있습니다. 대부분 이것은 GPT3 모델이 훈련된 데이터 때문일 수 있습니다. 앞서 언급했듯이 LLM은 콘텐츠를 만들 때 연관을 사용하여 단어 배치 확률을 결정합니다. 따라서 출력은 종종 함께 연결되어 전환 단어나 다양한 톤이 부족하여 거의 로봇처럼 만듭니다. ChatGPT를 예로 들어 보겠습니다.
우리는 다음과 같은 프롬프트를 제공했습니다. 해양 동물에 대한 한 단락 쓰기 .
ChatGPT는 다음을 생성했습니다.
이 방법을 사용하여 AI 생성 콘텐츠를 결정하는 것은 까다롭지만 한 가지 기억해야 할 사항이 있습니다. 사람들이 글을 쓸 때 일반적으로 텍스트 전체에 걸쳐 다양한 톤과 스타일이 있지만 컴퓨터는 그렇지 않습니다. 인간의 사고 패턴에는 종종 변화가 있어 어조의 변화를 가져옵니다. 컴퓨터를 사용하면 데이터 세트에 포함된 콘텐츠를 출력하여 보다 균일한 결과를 얻을 수 있습니다.
정확성
또 다른 위험 신호는 정확도 부족입니다. 이 게시물의 앞부분에서 이에 대해 다루었지만 이를 확장하는 것이 중요합니다. 앞서 언급했듯이 ChatGPT는 2021년까지 엄청난 양의 데이터에 대해 교육을 받았습니다. 따라서 그 날짜 이후 현재 이벤트나 정보에 대해 질문하면 결과가 왜곡될 것입니다. 따라서 인터넷에서 콘텐츠를 읽을 때 모든 것을 사실 확인하는 것이 필수적입니다. ChatGPT의 최근 업데이트에는 현재 이벤트에 대해 질문할 때 답변이 2021년 9월 현재 관련이 있음을 나타내는 문구가 포함되어 있습니다. 그러나 이 업데이트가 유용하더라도 여전히 정확하지 않은 출력을 얻을 수 있다는 점을 명심하십시오.
ChatGPT를 사용하여 다음 프롬프트를 입력했습니다. 캐릭터 AI가 무엇인지 설명하는 한 단락을 제공하십시오.
결과는 다음과 같습니다.
우리는 Character AI에 대해 질문하여 잘못된 정보를 제공하도록 속이려고 했습니다. ChatGPT는 플랫폼이 1년 후까지 공개적으로 사용할 수 없다는 점을 고려하여 캐릭터 AI가 무엇이라고 생각하는지 알려주기 위해 최선을 다했습니다.
개인적인 접촉의 부족
컴퓨터로 만든 콘텐츠를 식별하는 가장 좋은 방법은 개인적인 의견이나 감정이 부족하다는 점을 지적하는 것입니다. 대부분의 인간 작가는 글 전체에 속어를 포함하거나 개인적인 의견을 제공합니다. 또는 컴퓨터가 보다 사실적이며 답변만 제공합니다. 일반적으로 감정이나 신념을 찾지 못할 것입니다.
예를 들어 ChatGPT에 Synthesia의 AI 아바타에 대한 한 단락을 제공하도록 요청했습니다.
이것은 그 결과였습니다.
회사가 AI 아바타로 무엇을 하는지 잘 설명했지만 감정이나 깊이가 부족한 매우 단조로워 보입니다.
반복되는 언어
AI가 생성한 콘텐츠를 식별하는 또 다른 방법은 반복적인 언어를 사용하는 것입니다. 기사에서 많은 키워드 채우기를 발견하면 인공 지능에 의해 작성되었을 가능성이 있습니다. 사람들은 프롬프트를 사용하여 AI 출력을 생성하기 때문에 종종 프롬프트에 키워드를 포함합니다. 이것은 일반적으로 해당 단어가 텍스트 전체에서 반복되는 경우를 초래합니다.
예를 들어 ChatGPT에 AI에 대한 설명을 요청했습니다. 결과는 다음과 같습니다.
AI 라는 단어가 16번 반복되는 약 250개의 단어를 생성했습니다. 인기 있는 SEO 플러그인인 Yoast SEO에 따르면 해당 텍스트 양에 해당 키워드의 인스턴스가 8개만 있어야 합니다.
AI 콘텐츠 탐지 도구
마지막으로 AI 콘텐츠 탐지 도구를 사용하여 컴퓨터 생성 콘텐츠를 식별할 수 있습니다. 문맥을 사용하여 텍스트를 분석하여 단어가 함께 나타날 가능성을 이해합니다. 패턴이 예측 가능할수록 AI가 생성할 가능성이 높아집니다. 인간과 달리 AI는 일반적으로 더 창의적인 문장을 쓰지 않고 더 예측 가능하며 의견을 제공하지 않습니다.
텍스트와 이미지 모두에 대한 여러 AI 콘텐츠 감지 도구가 있으며 그중 일부는 Originality AI 및 GPTZero입니다. 다음 섹션에서는 각각의 작동 방식과 사용 방법에 대한 간략한 개요를 제공합니다.
Originality.ai를 사용하여 AI 쓰기 감지
Originality.ai는 마케팅 담당자가 AI 콘텐츠를 감지하는 데 사용하는 주요 도구 중 하나입니다. 주로 ChatGPT, GPT-4, Bard를 통해 생성된 콘텐츠를 식별하기 위해 생성되었으며 자연어 처리를 사용하여 AI를 식별합니다. 무료 서비스는 아니지만 100단어를 확인할 때마다 0.01¢의 합리적인 가격입니다. 50크레딧을 제공하는 Chrome 확장 프로그램도 사용해 볼 수 있습니다.
Originality.ai에 가입하세요
첫 번째 단계는 가입하는 것입니다. 웹사이트로 이동하여 화면 오른쪽 상단에 있는 가입 버튼을 클릭하여 시작하세요.
다음으로 이름, 이메일을 입력하고 비밀번호를 만들고 이용 약관에 동의합니다. 그런 다음 계속을 클릭합니다.
다음 단계에서는 신용 카드 정보를 입력하고 $20 상당의 크레딧 구매에 동의하여 약 20,000단어의 AI 감지를 구매합니다.
첫 번째 스캔 수행
로그인하면 대시보드가 직관적입니다. URL을 입력하거나 파일을 업로드하거나 텍스트를 붙여넣어 콘텐츠를 스캔할 수 있습니다. 첫 번째 스캔을 수행하려면 콘텐츠 스캐너 탭을 클릭한 다음 새 스캔 시작 을 선택합니다.
기능을 테스트하기 위해 Google에서 가져온 뉴스 기사의 몇 단락을 스캐너에 입력합니다. 스캔을 시작하려면 텍스트를 편집기(1)에 붙여넣습니다. 그런 다음 지금 검색 (2)을 클릭합니다. 제목을 입력하거나 Originality.ai가 자동으로 제목을 생성하도록 할 수 있습니다(3).
스캔이 완료되면 Originality.ai는 콘텐츠의 등급을 매기고 콘텐츠가 인간인지, 부분인지 또는 완전한 AI인지 결정합니다. 이 예에서 Originality의 스캐너는 100% 원본 점수를 기록했습니다.
ChatGPT로 완전히 생성된 단락으로 또 다른 예를 시도해 봅시다.
보시다시피 결과는 꽤 정확합니다. 그러나 훈련된 눈으로 AI를 감지 하고 AI 감지 도구를 사용하여 최상의 결과를 얻는 것이 중요합니다.
GPTZero를 사용하여 AI 쓰기 감지
또 다른 인기 있는 AI 콘텐츠 탐지기인 GPTZero를 사용해 봅시다. 이를 통해 최대 5000자를 무료로 감지할 수 있습니다. 계정에 가입하면 추가 캐릭터를 구입할 수 있습니다. GPTZero를 사용하면 텍스트 스캔이 쉽습니다. 스캔하려는 텍스트(1)를 붙여넣거나 파일을 업로드하고(2) 서비스 약관에 동의한 다음(3) 결과 얻기 버튼을 클릭합니다(4).
Divi 페이지의 첫 번째 단락을 사용하여 GPTZero는 텍스트가 완전히 사람에 의해 작성될 가능성이 있음을 알려줍니다.
마지막으로 ChatGPT를 사용하여 생성한 텍스트를 사용해 보겠습니다.
콘텐츠가 완전히 AI를 사용해 생성된 것인지는 확인할 수 없었지만, 사용했을 가능성이 있다는 점은 포착했다.
AI 쓰기 감지에 대한 최종 생각
AI 쓰기는 ChatGPT 출시 이후 빠르게 발전하여 콘텐츠 제작 방식의 필수적인 부분이 되었습니다. 사용에 대한 이점이 있지만 AI 콘텐츠를 인식할 수 있는 것이 중요합니다. 기술이 빠른 속도로 발전함에 따라 AI 쓰기를 감지하는 것은 계속해서 어려울 것입니다. 일관되지 않은 어조와 스타일, 감정 부족, 반복적인 언어와 같은 불일치를 인식함으로써 AI가 사용되는 위치를 정확히 파악하도록 눈을 훈련할 수 있습니다. 또한 Originality.ai 또는 GPTZero와 같은 AI 감지 도구를 통합하여 식별할 수 있습니다.
AI에 대해 더 자세히 알고 싶습니까? 최근 게시물을 확인하세요.
- 오늘날 AI를 사용할 수 있는 31가지 방법(2023 가이드)
- 2023년에 생산성을 높일 수 있는 16가지 최고의 AI 비서
- Writesonic Review 2023: 최고의 AI 쓰기 소프트웨어?
- Copy.ai의 정의 및 사용 방법(프로 팁 10개)
BestForBest / shutterstock.com을 통한 주요 이미지