Como usamos IA e Machine Learning para aumentar o desempenho do conteúdo de SEO em 30%

Publicados: 2021-07-13

Qualquer um que tenha falado comigo nos últimos nove meses saberá que estive no fundo de uma toca de coelho de IA. Eu me absorvi completamente em como a IA funciona, e na Ellipsis nós a adotamos rapidamente em nossos processos.

O maior beneficiado foi nosso trabalho de SEO Content, que compõe a maior parte do nosso trabalho diário. Agora temos um conjunto de ferramentas internas otimizadas especificamente para criar conteúdo para negócios WordPress. Esse conjunto de ferramentas é significativamente melhor do que qualquer coisa disponível comercialmente e nos ajuda a garantir que nosso conteúdo obtenha classificações e conversões.

Chamamos o sistema de FALCON, e com ele melhoramos os resultados de SEO Content em cerca de 30%. É assim que tudo funciona.

Este post é interessante como um instantâneo no tempo! Mas já está desatualizado. O FALCON AI agora é muito mais poderoso, obtém resultados ainda melhores do que os que mostramos aqui, e informações atualizadas podem ser encontradas nesta página dedicada: https://getellipsis.com/falcon-ai/

Visão geral: o que a IA pode fazer?

Estamos interessados ​​em quatro tipos de IA aqui:

  • classificação de texto (em que categoria está um texto?)
  • geração de texto (crie uma resposta principalmente original)
  • previsão (o que acontecerá a seguir, com base em dados anteriores?)
  • compreensão da linguagem natural (o que significa texto?)

A IA em 2021 é adequada para esses casos de uso. Cada um desses tipos requer um “modelo” que é usado para gerar a saída. Existem dois tipos: auto-treinado e pré-treinado.

Autotreinados são modelos personalizados criados em seus próprios dados para seu caso de uso. Isso é desenvolvido pelo Machine Learning (ML), então você costuma ver o ML usado de forma intercambiável aqui. Modelos pré-treinados são treinados com dados de outra pessoa. Estes tendem a ser muito mais gerais, mas um bom modelo geral é muito poderoso.

Se você quiser saber se uma nova consulta de formulário de contato é um e-mail de vendas ou uma solicitação de suporte ao cliente, provavelmente não há problema em usar um modelo pré-treinado. Se você quiser saber para qual equipe uma mensagem de suporte específica precisa ser roteada, provavelmente precisará de um modelo personalizado autotreinado.

O grande avanço no último ano foram os modelos pré-treinados ficando significativamente melhores. O GPT-3 da Open AI, que faz geração de texto extremamente bem, abriu muitas outras possibilidades. Isso foi combinado com o treinamento de modelos personalizados se tornando muito mais acessíveis (agradeça ao cliente Ellipsis Akkio): anteriormente, você precisava de um Cientista de Dados para fazer isso.

Este é o contexto sobre o que a IA pode fazer e como podemos usá-la. Vejamos agora os casos de uso específicos que o Ellipsis tem para cada um deles em nosso processo de conteúdo de SEO.

Aprendizado de máquina para aumentar a taxa de sucesso de combinações de palavras-chave e títulos

Uma das primeiras etapas do processo de produção de conteúdo SEO é a seleção de palavras-chave. Identificamos em qual cluster de tópicos queremos que o conteúdo do cliente se encaixe e, em seguida, procuramos uma boa palavra-chave de destino para a postagem. Se você escolher a palavra-chave errada, nada que você possa fazer com a criação de conteúdo fará com que a postagem funcione.

Com o FALCON, estamos usando um modelo de aprendizado de máquina personalizado para prever o desempenho de uma combinação de palavra-chave e título, com base em nossos dados internos sobre o sucesso de postagens anteriores. Esse modelo personalizado sozinho é o único responsável pela maior parte do aumento de 30% em nosso desempenho de conteúdo de SEO.

Temos quatro versões disso, para verificar:

  1. Palavras-chave existentes
  2. Palavras-chave relacionadas
  3. Palavras-chave de cauda longa
  4. Palavras-chave em conteúdo que já está ativo

O primeiro faz uma verificação simples da palavra-chave que você forneceu e pode verificar até 100 palavras-chave por vez. A segunda pesquisa palavras-chave relacionadas e as executa pela previsão em escala (até 100 por vez), mostrando palavras-chave relacionadas que funcionariam. Isso, por sua vez, pode lidar com 100 palavras-chave básicas por vez, portanto, verificamos 1.000 palavras-chave em minutos. O terceiro é semelhante, mas se aprofunda nas palavras-chave de cauda longa. A versão final verifica se uma palavra-chave de destino diferente em uma postagem existente teria um desempenho melhor.

Por meio do uso do FALCON, estamos vendo um aumento no desempenho do conteúdo que produzimos – pois temos alta confiança de que a postagem será classificada – e melhorias nas palavras-chave que podemos encontrar, pois a IA facilita a exibição de palavras-chave.

Como classificar a intenção de pesquisa usando o BERT

O Google está interessado em fornecer a melhor experiência de usuário possível para o pesquisador. Isso significa fornecer uma resposta completa para o que eles procuraram, rapidamente. Para fazer isso, o Google precisa entender o que o pesquisador está procurando e, se os resultados exibidos, fornecem a resposta para isso. Chamamos isso de intenção de pesquisa.

Entendemos o que o pesquisador está procurando observando os resultados que o Google mostra.

BERT é uma metodologia de compreensão de linguagem natural (NLU) de código aberto do Google em 2018. BERT é usado pelo Google para entender a intenção de pesquisa no contexto: se você pesquisar por "álbuns do Queen", entenderá que o Queen nesse contexto significa a banda, não Rainha a pessoa.

O Google está usando a metodologia para entender o que o pesquisador está procurando. Estamos usando-o para fazer o mesmo com o FALCON, analisando os resultados e usando-os para classificar a intenção da pesquisa. Estamos usando um modelo BERT pré-treinado para fazer isso.

Isso entra em nosso processo de pesquisa de palavras-chave. Você pode fazer isso manualmente, mas manualmente tende a ser feito na consulta de pesquisa e não nos resultados da pesquisa: é bastante intuitivo “comprar temas do WordPress” é uma palavra-chave de intenção de compra. O Google cada vez mais lança resultados inesperados, pois está respondendo aos usuários do mundo real, então usar o BERT nos permite olhar para os 10 principais resultados e fazer uma classificação baseada em todos eles – e faz isso em cerca de meio segundo.

Processamento de linguagem natural para identificar tópicos

O Google quer entender o que o pesquisador está procurando. Para determinar onde classificar o conteúdo, ele precisa entender o que está em uma página para que possa entender até que ponto o resultado corresponde à necessidade do pesquisador.

O Google usa o Processamento de linguagem natural (NLP) para isso. A PNL permite que o Google pegue um URL e entenda as entidades e os tópicos contidos na página. Depois de saber o que está na página, ele pode entender onde classificá-lo.

A PNL tem sido uma área de SEO de ponta e tem sido uma parte central do nosso processo de conteúdo nos últimos três anos. Ferramentas comerciais como Clearscope, MarketMuse e Frase popularizaram a metodologia: elas analisam os primeiros 10 a 30 resultados de uma palavra-chave de destino e, em seguida, agregam os tópicos nesses resultados. Isso fornecerá uma lista de 30 a 50 tópicos para você abordar na postagem, e cobri-los permite garantir que você tenha feito um bom trabalho ao responder a todas as perguntas que um pesquisador terá.

Este é um processo testado e comprovado, e tivemos bons resultados por vários anos.

Um exemplo de cobertura de tópicos baseada em PNL. Usamos ferramentas como o Clearscope há vários anos, mas agora podemos ir além com a PNL personalizada.

As ferramentas comerciais têm algumas limitações, no entanto. A principal é a IA: a PNL é boa, mas tem limitações. As ferramentas dependem de bons resultados da PNL que utilizam. O Google, por exemplo, só consegue identificar cerca de 18% dos tópicos em uma página, e muitas vezes os identifica erroneamente.

Vemos o mesmo com ferramentas comerciais: é comum que eles usem um provedor de PNL, então eles perderão tópicos e entidades que as postagens precisam cobrir. Se você está baseando seu conteúdo em uma lista incompleta de tópicos, está perdendo.

Como você pode ver neste exemplo, eu executei a demonstração de PNL do Google no post de classificação superior para “melhor hospedagem WordPress”:

A classificação funcionou principalmente, mas o Google acha que a Hostinger é uma pessoa e não uma empresa.

Isso nos levou a desenvolver nossa própria solução FALCON NLP, para obter melhor tópicos específicos do WordPress .

Com nossa solução interna de PNL, podemos obter uma melhor identificação de tópicos. Isso nos permite produzir conteúdo ainda mais completo do que conteúdo concorrente produzido com ferramentas comerciais.

Se você conseguir identificar melhor os tópicos a serem abordados e garantir que seu conteúdo permita que o Google identifique seus tópicos, você terá uma vantagem competitiva. Isso é o que nosso conteúdo tem.

Também estamos usando a PNL em nosso estágio de pesquisa de palavras-chave para agrupar automaticamente palavras-chave em grupos de tópicos. Anteriormente, este era um processo manual lento, então a automação é extremamente útil.

Modelos GPT-3 personalizados para geração de títulos

Eu destaquei GPT-3 acima. GPT-3 é uma tecnologia notável feita pela Open AI. Faz geração de texto, e faz um bom trabalho. O GPT-3 é treinado em 175 bilhões de parâmetros e pode escrever textos curtos indistinguíveis do que um humano pode fazer. É incrível.

Não estamos usando o GPT-3 para qualquer geração de conteúdo de formato longo, como falarei mais tarde. O que estamos fazendo, porém, é usar modelos personalizados para partes específicas do processo de conteúdo. Isso é uma coisa muito poderosa.

Muito do hype para o GPT-3 vem do que você pode fazer com ele. Há uma longa lista de aplicativos construídos sobre ele. “Copywriting AI” é uma das áreas mais óbvias para o GPT-3, e atualmente há uma corrida armamentista para construir ferramentas que façam isso. Todas essas ferramentas são construídas na API GPT-3 da Open AI.

A limitação com ferramentas comerciais é que você depende de prompts genéricos. O “gerador de título de postagem de blog” que você receberá de um SaaS “redactor de IA” precisa funcionar com todos os tipos de títulos. Precisamos de algo especificamente otimizado para conteúdo WordPress.

Estamos usando IA para gerar títulos extremamente bem otimizados para SEO. Com o FALCON, podemos pegar uma palavra-chave de destino, procurar os principais resultados e, em seguida, usar o GPT-3 para gerar títulos semelhantes aos resultados de conteúdo de classificação mais alta (filtramos os resultados de postagens que não são do blog). A saída é um título perfeitamente otimizado para o Google , pois é baseado no que já está ranqueando.

É aqui que a IA é muito melhor do que os humanos: a IA pode observar as nuances dos resultados e gerar várias versões em tempo real. Estamos, portanto, gerando várias opções de título e executando-as através da etapa de aprendizado de máquina descrita acima: FALCON produzirá o título vencedor.

FALCON trabalhando em títulos altamente otimizados: a IA gera títulos com base nos melhores resultados do ranking e, em seguida, testamos várias versões para obter a opção vencedora.

Não estamos oferecendo nenhuma economia de tempo ou custo aqui (se é que é mais demorado e caro), mas agora podemos avaliar muito mais opções em escala e oferecer aos nossos clientes as melhores. Meus agradecimentos ao Dr. Oliver Crook, da Universidade de Oxford, por seu apoio.

Uma pergunta óbvia é: e o conteúdo gerado por IA? Estou bastante otimista sobre isso ser uma ideia terrível, pois vou chegar ao próximo.

E quanto ao conteúdo gerado por IA?

NÃO estamos usando GPT-3 para geração de conteúdo de formato longo. O GPT-3 é terrível para conteúdo de formato longo, pois não sabe do que está falando. Não tem noção do que é a verdade: pode conectar palavras, mas não tem ideia do que elas significam.

Quando o Google valoriza cada vez mais a autoridade do assunto, usar uma IA que não tem ideia do que está falando é uma receita para o desastre.

Ferramentas como Conversion.AI são legais, mas usá-las para geração de conteúdo de formato longo é uma péssima ideia. O conteúdo de formato longo deve ter conhecimento e experiência, e a IA não tem ideia do que está falando.

Portanto, estamos usando a geração de texto nas margens do nosso processo de conteúdo para fazer melhorias e encontrar eficiências, mas não estamos usando GPT-3 para geração de conteúdo de formato longo.

De qualquer forma, o aumento disso nos deixa mais felizes em dobrar o trabalho com especialistas no assunto. Esses especialistas são caros, mas se outros começarem a tentar gerar automaticamente conteúdo que poderia ser absurdo, nós e nossos clientes teremos ainda mais vantagem competitiva. Pode vir!

O sistema FALCON e como você pode obtê-lo

Nossos resultados até agora mostraram uma melhoria de 30% nos resultados de conteúdo de SEO desde que começamos a implementar seriamente a IA em nosso processo de conteúdo. Desde o início deste ano, começamos a perceber esses resultados para os clientes.

O sistema como um todo é rotulado como sistema FALCON. É a nossa coleção de ferramentas internas projetadas para aumentar o sucesso do trabalho de conteúdo de SEO que fazemos para os clientes.

O FALCON agora está incluído em todos os nossos pacotes de crescimento de conteúdo para conteúdo de SEO. Você pode ver detalhes aqui ou entrar em contato para ver como podemos ajudá-lo.