AI 및 기계 학습을 사용하여 SEO 콘텐츠 성능을 30% 향상시키는 방법

게시 됨: 2021-07-13

지난 9개월 동안 나와 이야기를 나눈 사람이라면 누구나 내가 AI의 토끼굴 깊숙이 빠져 있다는 것을 알게 될 것입니다. 저는 AI가 작동하는 방식에 완전히 몰두했고 Ellipsis에서는 이를 신속하게 프로세스에 채택했습니다.

가장 큰 수혜자는 일상 업무의 대부분을 차지하는 SEO 콘텐츠 작업이었습니다. 이제 WordPress 비즈니스용 콘텐츠 제작을 위해 특별히 최적화된 내부 도구 세트가 있습니다. 이 도구 세트는 상업적으로 사용 가능한 어떤 것보다 훨씬 우수하며 콘텐츠가 순위 및 전환을 얻도록 하는 데 도움이 됩니다.

우리는 시스템을 FALCON이라고 부르며 이를 통해 SEO 콘텐츠 결과를 약 30% 개선했습니다. 이것이 모두 작동하는 방식입니다.

이 게시물은 시간의 스냅 샷으로 흥미 롭습니다! 그러나 지금은 구식입니다. FALCON AI는 이제 우리가 여기에서 추적한 것보다 훨씬 더 강력하고 더 나은 결과를 얻습니다. 최신 정보는 이 전용 페이지에서 찾을 수 있습니다: https://getellipsis.com/falcon-ai/

개요: AI는 무엇을 할 수 있습니까?

우리는 여기에서 네 가지 유형의 AI에 관심이 있습니다.

  • 텍스트 분류(텍스트는 어떤 카테고리에 속합니까?)
  • 텍스트 생성(대부분 독창적인 응답 생성)
  • 예측(과거 데이터를 기반으로 다음에 어떤 일이 일어날까요?)
  • 자연어 이해(텍스트는 무엇을 의미합니까?)

2021년의 AI는 이러한 사용 사례에 매우 적합합니다. 이러한 각 유형에는 출력을 생성하는 데 사용되는 "모델"이 필요합니다. 자가 훈련과 사전 훈련의 두 가지 유형이 있습니다.

자체 학습은 사용 사례에 대한 자체 데이터를 기반으로 구축된 사용자 지정 모델입니다. 이것은 기계 학습(ML)에 의해 구동되므로 여기에서 ML이 상호 교환적으로 사용되는 것을 종종 볼 수 있습니다. 사전 훈련된 모델은 다른 사람의 데이터로 훈련됩니다. 이것들은 훨씬 더 일반적인 경향이 있지만 좋은 일반 모델은 매우 강력합니다.

새 문의 양식 문의가 영업 이메일인지 고객 지원 요청인지 알고 싶다면 사전 훈련된 모델을 사용하는 것이 좋습니다. 특정 지원 메시지를 전달해야 하는 팀을 알고 싶다면 자체 학습된 사용자 지정 모델이 필요할 것입니다.

작년 정도의 큰 돌파구는 사전 훈련된 모델이 훨씬 더 좋아졌다는 것입니다. 텍스트 생성을 매우 잘하는 Open AI의 GPT-3과 같은 것은 더 많은 가능성을 열어주었습니다. 이것은 훨씬 더 쉽게 접근할 수 있는 훈련 사용자 정의 모델과 결합되었습니다(Ellipsis 클라이언트 Akkio에게 외침). 이전에는 이를 수행하기 위해 데이터 과학자가 필요했습니다.

이것은 AI가 할 수 있는 것과 우리가 그것을 사용할 수 있는 방법에 대한 컨텍스트입니다. 이제 Ellipsis가 SEO 콘텐츠 프로세스에서 각각에 대해 가지고 있는 특정 사용 사례를 살펴보겠습니다.

키워드 및 제목 조합의 성공률을 높이는 머신 러닝

SEO 콘텐츠 제작 프로세스의 첫 번째 단계 중 하나는 키워드 선택입니다. 우리는 클라이언트의 콘텐츠가 어떤 주제 클러스터에 들어맞는지 식별한 다음 게시물에 대한 좋은 대상 키워드를 찾습니다. 잘못된 키워드를 선택하면 콘텐츠 제작으로 할 수 있는 일은 게시물을 제대로 만들 수 없습니다.

FALCON과 함께 우리는 이전 포스트 성공에 대한 내부 데이터를 기반으로 키워드와 제목 조합의 실적을 예측하기 위해 맞춤형 기계 학습 모델을 사용하고 있습니다. 이 사용자 정의 모델만으로도 SEO 콘텐츠 성능이 30% 향상되는 가장 큰 몫을 차지합니다.

이를 확인하기 위해 4가지 버전이 있습니다.

  1. 기존 키워드
  2. 관련 키워드
  3. 롱테일 키워드
  4. 이미 게시된 콘텐츠의 키워드

첫 번째는 귀하가 제공한 키워드에 대한 간단한 확인을 수행하며 한 번에 최대 100개의 키워드를 확인할 수 있습니다. 두 번째는 관련 키워드를 조회하고 대규모 예측(한 번에 최대 100개)을 실행하여 작동할 관련 키워드를 표시합니다. 이것은 차례로 한 번에 100개의 기본 키워드를 처리할 수 있으므로 몇 분 안에 1000개의 키워드를 확인합니다. 세 번째는 비슷하지만 롱테일 키워드에 대해 자세히 설명합니다. 최종 버전은 기존 게시물의 다른 대상 키워드가 더 나은 실적을 낼 수 있는지 확인합니다.

FALCON의 사용을 통해 우리는 게시물의 순위에 대한 높은 확신을 갖고 있기 때문에 우리가 생산하는 콘텐츠의 성능이 향상되고 AI가 키워드를 더 쉽게 표시할 수 있으므로 찾을 수 있는 키워드의 개선을 모두 보고 있습니다.

BERT를 사용하여 검색 의도 분류

Google은 검색자에게 최상의 사용자 경험을 제공하는 데 관심이 있습니다. 이것은 그들이 찾던 모든 것에 대한 완전한 답변을 신속하게 제공한다는 것을 의미합니다. 이를 수행하기 위해 Google은 검색자가 무엇을 찾고 있는지 이해해야 하며 표시되는 결과가 이에 대한 답변을 제공하는지 이해해야 합니다. 우리는 이것을 검색 의도라고 부릅니다.

Google이 표시하는 결과를 보면 검색자가 무엇을 찾고 있는지 이해합니다.

BERT는 2018년 Google에서 공개한 자연어 이해(NLU) 방법론입니다. BERT는 Google에서 문맥에서 검색 의도를 이해하는 데 사용합니다. "Queen albums"를 검색하면 이 문맥에서 Queen이 밴드를 의미한다는 것을 이해할 것입니다. 여왕님이 아닙니다.

Google은 검색자가 무엇을 찾고 있는지 이해하기 위해 방법론을 사용하고 있습니다. 결과를 보고 검색 의도를 분류하는 데 사용하여 FALCON과 동일한 작업을 수행하는 데 사용하고 있습니다. 이를 위해 사전 훈련된 BERT 모델을 사용하고 있습니다.

이것은 우리의 키워드 연구 프로세스에 들어갑니다. 수동으로 수행할 수 있지만 수동으로 검색 결과가 아니라 검색 쿼리에서 수행되는 경향이 있습니다. "WordPress 테마 구매"는 구매 의도 키워드인 매우 직관적입니다. 그러나 Google은 실제 사용자에게 응답하기 때문에 예상치 못한 결과를 점점 더 많이 던지고 있으므로 BERT를 사용하면 상위 10개 결과를 보고 모든 결과를 기반으로 분류할 수 있습니다. 약 0.5초 안에 완료됩니다.

주제 식별을 위한 자연어 처리

Google은 검색자가 무엇을 찾고 있는지 이해하기를 원합니다. 콘텐츠의 순위를 매길 위치를 결정하려면 페이지에 있는 내용을 이해하여 결과가 검색자의 요구와 어느 정도 일치하는지 이해할 수 있어야 합니다.

Google은 이를 위해 자연어 처리(NLP)를 사용합니다. NLP를 사용하면 Google에서 URL을 가져와 페이지에 포함된 항목과 주제를 이해할 수 있습니다. 페이지에 무엇이 있는지 알게 되면 순위를 매길 위치를 이해할 수 있습니다.

NLP는 오랫동안 SEO의 최첨단 영역이었고 지난 3년 동안 콘텐츠 프로세스의 핵심 부분이었습니다. Clearscope, MarketMuse 및 Frase와 같은 상용 도구는 방법론을 대중화했습니다. 대상 키워드에 대한 처음 10-30개의 결과를 살펴본 다음 해당 결과 내에서 주제를 집계합니다. 그러면 게시물에서 다룰 30-50개의 주제 목록이 제공되며, 이를 포함하면 검색자가 갖게 될 모든 질문에 대한 답변을 잘 했는지 확인할 수 있습니다.

이것은 검증된 과정이며 우리는 수년 동안 이것으로부터 좋은 결과를 얻었습니다.

NLP 기반 주제 범위의 예. 우리는 수년 동안 Clearscope와 같은 도구를 사용해 왔지만 이제 사용자 지정 NLP로 그 이상을 사용할 수 있습니다.

그러나 상용 도구에는 몇 가지 제한 사항이 있습니다. 첫 번째는 AI입니다. NLP는 좋지만 한계가 있습니다. 도구는 사용하는 NLP의 좋은 결과에 의존합니다. 예를 들어 Google은 페이지에 있는 주제의 약 18%만 식별할 수 있으며 종종 주제를 잘못 식별합니다.

상용 도구에서도 마찬가지입니다. 하나의 NLP 공급자를 사용하는 것이 일반적이므로 게시물에서 다루어야 하는 주제와 엔터티를 놓치게 됩니다. 불완전한 주제 목록을 기반으로 콘텐츠를 만들면 놓치고 있는 것입니다.

이 예에서 볼 수 있듯이 "최고의 WordPress 호스팅"에 대한 최고 순위 게시물에서 Google의 NLP 데모를 실행했습니다.

분류는 대부분 효과가 있었지만 구글은 Hostinger가 회사가 아닌 사람이라고 생각합니다.

이로 인해 WordPress 관련 주제를 더 잘 얻기 위해 자체 FALCON NLP 솔루션을 개발하게 되었습니다 .

사내 NLP 솔루션을 사용하면 더 나은 주제 식별을 얻을 수 있습니다. 이를 통해 상용 도구로 제작된 경쟁 콘텐츠보다 더 완전한 콘텐츠를 제작할 수 있습니다.

다룰 주제를 더 잘 식별하고 콘텐츠에서 Google이 주제를 식별할 수 있도록 하면 경쟁 우위를 확보할 수 있습니다. 이것이 우리의 콘텐츠가 가지고 있는 것입니다.

또한 키워드 연구 단계에서 NLP를 사용하여 키워드를 주제 클러스터로 자동 그룹화하고 있습니다. 이전에는 느린 수동 프로세스였으므로 자동화가 매우 유용합니다.

타이틀 생성을 위한 맞춤형 GPT-3 모델

위에서 GPT-3을 강조 표시했습니다. GPT-3는 Open AI가 만든 놀라운 기술입니다. 그것은 텍스트 생성을 수행하고 잘 수행합니다. GPT-3는 1,750억 개의 매개변수에 대해 훈련되었으며 인간이 할 수 있는 것과 구별할 수 없는 짧은 텍스트를 작성할 수 있습니다. 정말 놀랍습니다.

나중에 설명하겠지만 긴 형식의 콘텐츠 생성에는 GPT-3을 사용하지 않습니다. 하지만 우리가 하고 있는 것은 콘텐츠 프로세스의 특정 부분에 대해 맞춤형 모델을 사용하는 것입니다. 이것은 꽤 강력한 물건입니다.

GPT-3에 대한 과대 광고의 대부분은 GPT-3으로 할 수 있는 일에서 비롯됩니다. 거기에 구축된 앱의 긴 목록이 있습니다. "AI 카피라이팅"은 GPT-3에서 가장 명백한 영역 중 하나이며 현재 이러한 작업을 수행하는 도구를 만들기 위한 군비 경쟁이 벌어지고 있습니다. 이 모든 도구는 Open AI의 GPT-3 API를 기반으로 합니다.

상용 도구의 한계는 일반 프롬프트에 의존한다는 것입니다. "AI 카피라이터"로부터 얻을 수 있는 "블로그 게시물 제목 생성기" SaaS는 모든 유형의 제목과 함께 작동해야 합니다. WordPress 콘텐츠에 특별히 최적화된 것이 필요합니다.

우리는 AI를 사용하여 SEO에 매우 최적화된 타이틀을 생성하고 있습니다. FALCON을 사용하면 대상 키워드를 선택하고 상위 결과를 조회한 다음 GPT-3을 사용하여 상위 순위 콘텐츠 결과와 유사한 제목을 생성할 수 있습니다(블로그 게시물이 아닌 결과는 필터링). 출력은 이미 순위를 기반으로 하기 때문에 Google에 완벽하게 최적화된 제목 입니다.

이것은 AI가 인간보다 훨씬 나은 부분입니다. AI는 결과의 뉘앙스를 보고 즉석에서 여러 버전을 생성할 수 있습니다. 따라서 여러 타이틀 옵션을 생성하고 위에서 설명한 기계 학습 단계를 통해 실행합니다. 그러면 FALCON이 우승 타이틀을 출력합니다.

고도로 최적화된 타이틀 작업 중인 FALCON: AI는 최고 순위 결과를 기반으로 타이틀을 생성한 다음 여러 버전을 테스트하여 우승 옵션을 얻습니다.

우리는 여기서 시간이나 비용 절감을 제공하지 않지만(시간과 비용이 더 많이 든다면) 이제 더 많은 옵션을 대규모로 평가하고 고객에게 최상의 옵션을 제공할 수 있습니다. 이에 대한 지원을 해주신 Oxford University의 Oliver Crook 박사님께 감사드립니다.

분명한 질문은 AI 생성 콘텐츠는 어떻습니까? 나는 이것이 끔찍한 생각이라는 점에 대해 매우 낙관적입니다. 다음에 설명하겠습니다.

AI 생성 콘텐츠는 어떻습니까?

우리는 긴 형식의 콘텐츠 생성을 위해 GPT-3을 사용하지 않습니다. GPT-3은 무슨 말인지 모르기 때문에 긴 형식의 콘텐츠에 끔찍합니다. 그것은 진실이 무엇인지에 대한 개념이 없습니다. 단어를 함께 연결할 수 있지만 그것이 의미하는 바는 모릅니다.

Google이 주제의 권위를 점점 더 중요시할 때 무슨 말을 하는지도 모르는 AI를 사용하는 것은 재앙의 지름길입니다.

Conversion.AI와 같은 도구는 훌륭하지만 긴 형식의 콘텐츠 생성에 사용하는 것은 끔찍한 생각입니다. 긴 형식의 콘텐츠에는 통찰력과 전문성이 있어야 하며 AI는 그것이 무엇을 말하는지 전혀 모릅니다.

따라서 우리는 콘텐츠 프로세스의 여백에서 텍스트 생성을 사용하여 개선하고 효율성을 찾고 있지만 긴 형식의 콘텐츠 생성에는 GPT-3을 사용하지 않습니다.

어쨌든, 이것의 증가는 주제 전문가와 함께 일하는 것을 두 배로 더 행복하게 만듭니다. 이러한 전문가들은 비용이 많이 들지만 다른 사람들이 말도 안되는 콘텐츠를 자동 생성하려고 시도한다면 우리와 우리 고객은 훨씬 더 많은 경쟁 우위를 갖게 될 것입니다. 가져와!

FALCON 시스템 및 얻을 수 있는 방법

콘텐츠 프로세스에 AI를 진지하게 구현하기 시작한 이후 지금까지의 결과 는 SEO 콘텐츠 결과에서 30% 개선된 것으로 나타났습니다. 올해 초부터 우리는 이러한 결과를 고객에게 실현하기 시작했습니다.

시스템 전체에 FALCON 시스템이라는 레이블이 지정됩니다. 우리가 고객을 위해 수행하는 SEO 콘텐츠 작업의 성공을 높이기 위해 설계된 사내 도구 모음입니다.

FALCON은 이제 SEO 콘텐츠를 위한 모든 콘텐츠 성장 패키지에 포함됩니다. 여기에서 자세한 내용을 확인하거나 연락하여 도움을 받을 수 있는 방법을 알아보세요.