Как мы используем искусственный интеллект и машинное обучение для повышения производительности SEO-контента на 30%

Опубликовано: 2021-07-13

Любой, кто разговаривал со мной в течение последних девяти месяцев, знает, что я глубоко погрузился в кроличью нору искусственного интеллекта. Я полностью увлекся тем, как работает ИИ, и мы в Ellipsis быстро внедрили его в наши процессы.

Самым большим бенефициаром стала наша работа по SEO-контенту, которая составляет большую часть нашей повседневной работы. Теперь у нас есть набор внутренних инструментов, оптимизированных специально для создания контента для бизнеса WordPress. Этот набор инструментов значительно лучше, чем что-либо, доступное на рынке, и помогает нам обеспечить ранжирование нашего контента и конверсию.

Мы называем систему FALCON, и с ее помощью мы улучшили результаты SEO-контента примерно на 30%. Вот как это все работает.

Этот пост интересен как снимок во времени! Но сейчас это устарело. FALCON AI теперь намного мощнее, дает даже лучшие результаты, чем то, что мы видели здесь, а актуальную информацию можно найти на этой специальной странице: https://getellipsis.com/falcon-ai/

Обзор: что может делать ИИ?

Здесь нас интересуют четыре типа ИИ:

  • классификация текста (к какой категории относится текст?)
  • генерация текста (создание в основном оригинального ответа)
  • предсказание (что будет дальше, исходя из прошлых данных?)
  • понимание естественного языка (что означает текст?)

ИИ в 2021 году хорошо подходит для этих вариантов использования. Для каждого из этих типов требуется «модель», которая используется для создания выходных данных. Они бывают двух типов: самообучаемые и предварительно обученные.

Самообучаемые — это настраиваемые модели, построенные на ваших собственных данных для вашего варианта использования. Это основано на машинном обучении (ML), поэтому вы часто видите, что ML используется здесь взаимозаменяемо. Предварительно обученные модели обучаются на чужих данных. Они имеют тенденцию быть гораздо более общими, но хорошая общая модель очень эффективна.

Если вы хотите узнать, является ли новый запрос контактной формы электронным письмом с продажами или запросом в службу поддержки клиентов, вы, вероятно, хорошо подойдете с предварительно обученной моделью. Если вы хотите знать, к какой команде должно быть направлено конкретное сообщение службы поддержки, вам, вероятно, понадобится самообучаемая настраиваемая модель.

Большим прорывом за последний год стало значительное улучшение предварительно обученных моделей. Подобные GPT-3 от Open AI, которые очень хорошо генерируют текст, открыли гораздо больше возможностей. Это было объединено с обучением пользовательских моделей, которое стало намного более доступным (привет клиенту Ellipsis Akkio): раньше для этого вам требовался специалист по данным.

Это контекст того, что может делать ИИ и как мы можем его использовать. Давайте теперь посмотрим на конкретные варианты использования Ellipsis для каждого из них в нашем процессе SEO-контента.

Машинное обучение для повышения успешности комбинаций ключевых слов и заголовков

Одним из первых этапов процесса создания SEO-контента является выбор ключевых слов. Мы определим, к какому кластеру тем мы хотим, чтобы контент клиента подходил, а затем найдем хорошее целевое ключевое слово для поста. Если вы выберете неправильное ключевое слово, ничто из того, что вы можете сделать с созданием контента, не заставит публикацию работать.

В FALCON мы используем настраиваемую модель машинного обучения, чтобы предсказать, насколько хорошо будет работать комбинация ключевого слова и заголовка, на основе наших внутренних данных об успешности предыдущей публикации. Одна только эта пользовательская модель единолично отвечает за львиную долю 30-процентного повышения эффективности нашего SEO-контента.

У нас есть четыре версии этого, чтобы проверить:

  1. Существующие ключевые слова
  2. Связанные ключевые слова
  3. Ключевые слова с длинным хвостом
  4. Ключевые слова в уже опубликованном контенте

Первый выполняет простую проверку ключевого слова, которое вы ему дали, и может проверять до 100 ключевых слов за раз. Второй ищет связанные ключевые слова и прогоняет их через прогноз в масштабе (до 100 за раз), показывая вам связанные ключевые слова, которые будут работать. Это, в свою очередь, может одновременно обрабатывать 100 базовых ключевых слов, поэтому мы проверяем 1000 ключевых слов за считанные минуты. Третий похож, но углубляется в ключевые слова с длинным хвостом. Окончательная версия проверяет, будет ли другое целевое ключевое слово в существующем сообщении работать лучше.

Благодаря использованию FALCON мы наблюдаем как повышение производительности создаваемого нами контента — поскольку мы уверены, что пост будет занимать высокие позиции, — так и улучшение ключевых слов, которые мы можем найти, поскольку ИИ упрощает поиск ключевых слов.

Классификация целей поиска с помощью BERT

Google заинтересован в обеспечении наилучшего пользовательского опыта для искателя. Это означает быстрое предоставление полного ответа на все, что они искали. Чтобы сделать это, Google должен понять, что ищет пользователь, и дают ли результаты, которые он показывает, ответ на этот вопрос. Мы называем это поисковым намерением.

Мы понимаем, что ищет пользователь, глядя на результаты, которые показывает Google.

BERT — это методология понимания естественного языка (NLU), открытый исходный код Google в 2018 году. BERT используется Google для понимания цели поиска в контексте: если вы ищете «Queen альбомы», он поймет, что Queen в этом контексте означает группу, не королева человек.

Google использует методологию, чтобы понять, что ищет пользователь. Мы используем его, чтобы сделать то же самое с FALCON, просматривая результаты и используя их для классификации целей поиска. Для этого мы используем предварительно обученную модель BERT.

Это входит в наш процесс исследования ключевых слов. Вы можете сделать это вручную, но вручную это, как правило, выполняется по поисковому запросу, а не по результатам поиска: это довольно интуитивно понятно: «купить темы WordPress» — это ключевое слово, связанное с намерением совершить покупку. Однако Google все чаще выдает неожиданные результаты, поскольку он отвечает реальным пользователям, поэтому использование BERT позволяет нам просмотреть 10 лучших результатов и сделать классификацию на основе всех из них — и делает это примерно за полсекунды.

Обработка естественного языка для определения тем

Google хочет понять, что ищет пользователь. Чтобы определить, где ранжировать контент, ему необходимо понять, что находится на странице, чтобы он мог понять, в какой степени результат соответствует потребностям пользователя.

Для этого Google использует обработку естественного языка (NLP). НЛП позволяет Google брать URL-адрес и понимать объекты и темы, содержащиеся на странице. Как только он узнает, что находится на странице, он может понять, где его ранжировать.

НЛП уже давно является передовой областью SEO и является основной частью нашего процесса создания контента в течение последних трех лет. Коммерческие инструменты, такие как Clearscope, MarketMuse и Frase, популяризировали методологию: они просматривают первые 10-30 результатов по целевому ключевому слову, а затем объединяют темы в этих результатах. Это даст вам список из 30-50 тем, которые вы должны осветить в посте, и их освещение позволит вам убедиться, что вы хорошо ответили на все вопросы, которые возникнут у искателя.

Это испытанный процесс, и мы уже несколько лет получаем хорошие результаты.

Пример освещения темы с помощью НЛП. Мы использовали такие инструменты, как Clearscope, в течение нескольких лет, но теперь можем выйти за его рамки с помощью пользовательского НЛП.

Однако коммерческие инструменты имеют некоторые ограничения. Основной из них — ИИ: НЛП — это хорошо, но у него есть ограничения. Инструменты зависят от хороших результатов НЛП, которые они используют. Google, например, может идентифицировать только около 18% тем на странице, и часто неправильно их идентифицирует.

То же самое мы видим и с коммерческими инструментами: для них типично использовать одного поставщика НЛП, поэтому они упускают темы и сообщения, которые необходимо освещать. Если вы основываете свой контент на неполном списке тем, вы многое упускаете.

Как вы можете видеть в этом примере, я запустил демоверсию Google NLP в верхней строке рейтинга «лучший хостинг WordPress»:

Классификация в основном сработала, но Google считает, что Hostinger — это человек, а не компания.

Это привело к тому, что мы разработали собственное решение FALCON NLP, чтобы лучше получать темы, специфичные для WordPress .

С помощью нашего собственного решения NLP мы можем лучше идентифицировать тему. Это позволяет нам создавать более полный контент, чем конкурирующий контент, созданный с помощью коммерческих инструментов.

Если вы сможете лучше определить темы для освещения и убедитесь, что ваш контент позволяет Google идентифицировать ваши темы, у вас есть конкурентное преимущество. Это то, что есть в нашем контенте.

Мы также используем НЛП на этапе исследования ключевых слов, чтобы автоматически группировать ключевые слова в тематические кластеры. Раньше это был медленный ручной процесс, поэтому автоматизация чрезвычайно полезна.

Пользовательские модели GPT-3 для генерации заголовков

Я выделил GPT-3 выше. GPT-3 — замечательная технология, созданная Open AI. Он генерирует текст, и делает это хорошо. GPT-3 обучен на 175 миллиардах параметров и может писать короткие тексты, неотличимые от того, что может сделать человек. Это невероятно.

Мы не используем GPT-3 для генерации длинного контента, о чем я расскажу позже. Что мы делаем, тем не менее, используем пользовательские модели для определенных частей процесса контента. Это довольно мощная штука.

Большая часть ажиотажа вокруг GPT-3 связана с тем, что вы можете с ним делать. На нем построен длинный список приложений. «Копирайтинг ИИ» — одна из самых очевидных областей для GPT-3, и в настоящее время идет гонка вооружений по созданию инструментов для этого. Все эти инструменты построены на API GPT-3 от Open AI.

Ограничение коммерческих инструментов заключается в том, что вы полагаетесь на общие подсказки. «Генератор заголовков сообщений в блогах», который вы получите от «ИИ-копирайтера» SaaS, должен работать со всеми типами заголовков. Нам нужно что-то специально оптимизированное для контента WordPress.

Мы используем искусственный интеллект для создания очень хорошо оптимизированных для SEO заголовков. С помощью FALCON мы можем взять целевое ключевое слово, найти лучшие результаты, а затем использовать GPT-3 для создания заголовков, похожих на самые популярные результаты контента (мы отфильтровываем результаты, не относящиеся к сообщениям в блоге). На выходе получается заголовок, идеально оптимизированный для Google , поскольку он основан на том, что уже ранжируется.

В этом ИИ намного лучше людей: ИИ может учитывать нюансы результатов и генерировать несколько версий на лету. Таким образом, мы генерируем несколько вариантов заголовков и запускаем их через описанный выше этап машинного обучения: затем FALCON выводит выигрышный заголовок.

FALCON работает над высокооптимизированными играми: искусственный интеллект генерирует игры на основе лучших результатов рейтинга, а затем мы тестируем несколько версий, чтобы выбрать лучший вариант.

Мы не обеспечиваем здесь никакой экономии времени или затрат (во всяком случае, это требует больше времени и денег), но теперь мы можем оценить гораздо больше вариантов в масштабе и предоставить нашим клиентам лучшие из них. Я благодарю доктора Оливера Крука из Оксфордского университета за поддержку в этом вопросе.

Очевидный вопрос: как насчет контента, созданного ИИ? Я довольно оптимистичен в том, что это ужасная идея, так как я перейду к следующему.

Как насчет контента, созданного ИИ?

Мы НЕ используем GPT-3 для создания длинного контента. GPT-3 ужасен для длинных форм контента, поскольку он не знает, о чем говорит. Он не имеет представления о том, что такое истина: он может соединять слова вместе, но понятия не имеет, что они означают.

Когда Google все больше и больше ценит авторитет в предметной области, использование ИИ, который понятия не имеет, о чем говорит, — это прямой путь к катастрофе.

Такие инструменты, как Conversion.AI, — это круто, но использовать их для создания длинного контента — ужасная идея. Длинный контент должен иметь понимание и опыт, а ИИ понятия не имеет, о чем он говорит.

Поэтому мы используем генерацию текста на полях нашего процесса создания контента, чтобы вносить улучшения и повышать эффективность, но мы не используем GPT-3 для создания длинного контента.

Во всяком случае, рост этого делает нас более счастливыми, чтобы удвоить усилия по работе с экспертами в предметной области. Эти эксперты стоят дорого, но если другие начнут пытаться автоматически генерировать контент, который может быть бессмысленным, мы и наши клиенты получим еще большее конкурентное преимущество. Давай!

Система FALCON и как ее получить

Наши результаты на данный момент показали улучшение результатов SEO-контента на 30% с тех пор, как мы начали серьезно внедрять ИИ в наш процесс контента. С начала этого года мы начали реализовывать эти результаты для клиентов.

Система в целом обозначена как система FALCON. Это наша коллекция внутренних инструментов, предназначенных для повышения успеха работы по SEO-контенту, которую мы делаем для клиентов.

FALCON теперь включен во все наши пакеты Content Growth для SEO-контента. Вы можете увидеть подробности здесь или связаться с нами, чтобы узнать, как мы можем вам помочь.