Guia do iniciante para evitar a extração de conteúdo de blog no WordPress

Publicados: 2023-03-09

Você está procurando uma maneira de impedir que spammers e golpistas roubem suas postagens de blog do WordPress usando raspadores de conteúdo?

É muito frustrante, como proprietário de um site, ver que alguém está roubando seu conteúdo sem permissão, monetizando-o, superando você no Google e roubando seu público.

Neste artigo, abordaremos o que é a raspagem de conteúdo do blog, como você pode reduzir e evitar a raspagem de conteúdo e até mesmo como tirar proveito dos raspadores de conteúdo para seu próprio benefício.

Beginner's Guide to Preventing Blog Content Scraping in WordPress

O que é a raspagem de conteúdo de blog no WordPress?

A extração de conteúdo do blog ocorre quando o conteúdo é retirado de várias fontes e republicado em outro site. Normalmente, isso é feito automaticamente por meio do feed RSS do seu blog.

Infelizmente, é muito fácil e muito comum ter o conteúdo do seu blog WordPress roubado dessa maneira. Se já aconteceu com você, então você entende como pode ser estressante e frustrante.

Às vezes, seu conteúdo será simplesmente copiado e colado diretamente em outro site, incluindo sua formatação, imagens, vídeos e muito mais.

Outras vezes, seu conteúdo será republicado com atribuição e um link para seu site, mas sem sua permissão. Embora isso possa ajudar seu SEO, você pode querer manter seu conteúdo original hospedado apenas em seu site.

Por que os raspadores de conteúdo roubam conteúdo?

Alguns de nossos usuários nos perguntaram por que os scrapers estão roubando conteúdo. Normalmente, a principal motivação para o roubo de conteúdo é lucrar com seu trabalho árduo:

  • Comissão de afiliados: comerciantes afiliados desonestos podem usar seu conteúdo para trazer tráfego para o site deles por meio de mecanismos de pesquisa, a fim de promover seus produtos de nicho.
  • Geração de Leads: Advogados e corretores de imóveis podem pagar alguém para adicionar conteúdo e ganhar autoridade em sua comunidade, sem perceber que está sendo copiado de outras fontes.
  • Receita de publicidade: os proprietários de blogs podem coletar conteúdo para criar um centro de conhecimento em um determinado nicho 'para o bem da comunidade' e depois encher o site de anúncios.

É possível impedir completamente a raspagem de conteúdo?

Neste artigo, mostraremos algumas etapas que você pode seguir para reduzir e evitar a extração de conteúdo. Mas, infelizmente, não há como parar completamente um ladrão determinado.

É por isso que terminamos este artigo com uma seção sobre como você pode aproveitar os raspadores de conteúdo. Embora nem sempre seja possível impedir um ladrão, você pode conseguir algum tráfego e receita por meio do conteúdo que eles roubaram de você.

O que você deve fazer quando descobrir que alguém raspou seu conteúdo?

Como não é possível parar completamente os scrapers, um dia você pode descobrir que alguém está usando o conteúdo que roubou do seu blog. Você pode se perguntar o que fazer quando isso acontecer.

Aqui estão algumas abordagens que as pessoas adotam ao lidar com raspadores de conteúdo:

  • Não fazer nada: você pode gastar muito tempo lutando contra raspadores, então alguns blogueiros populares decidem não fazer nada. O Google já vê sites conhecidos como autoridades, mas isso não é verdade para sites menores. Portanto, essa abordagem nem sempre é a melhor em nossa opinião.
  • Take Down: aqui você entra em contato com o scraper e pede para que ele derrube o conteúdo. Se eles recusarem, você enviará um aviso de remoção. Você pode aprender como em nosso guia sobre como encontrar e remover facilmente conteúdo roubado no WordPress.
  • Aproveite: embora trabalhemos ativamente para remover o conteúdo extraído do WPBeginner, também usamos algumas técnicas para obter tráfego e ganhar dinheiro com os raspadores. Você pode aprender como na seção 'Aproveite os raspadores de conteúdo' abaixo.

Com isso dito, vamos dar uma olhada em como evitar a extração de blogs no WordPress. Como este é um guia abrangente, incluímos um índice para facilitar a navegação.

  1. Direitos autorais ou marca registrada Nome e logotipo do seu blog
  2. Torne seu feed RSS mais difícil de raspar
  3. Desativar Trackbacks e Pingbacks
  4. Bloqueie o acesso do Scraper ao seu site WordPress
  5. Evite o roubo de imagens no WordPress
  6. Desencoraje a cópia manual do seu conteúdo
  7. Aproveite os raspadores de conteúdo

1. Direitos autorais ou marca registrada do nome e logotipo do seu blog

As leis de marcas registradas e direitos autorais protegem seus direitos de propriedade intelectual, marca e negócios contra muitos desafios legais. Isso inclui o uso ilegal de seu material protegido por direitos autorais ou do nome e logotipo de sua marca.

Você deve exibir claramente um aviso de direitos autorais em seu site. Embora seu conteúdo seja automaticamente coberto por leis de direitos autorais, a exibição de um aviso permitirá que você saiba que seu conteúdo é protegido por direitos autorais e que eles não podem usar suas propriedades protegidas para negócios.

Display a Copyright Notice on Your Website

Por exemplo, você pode adicionar um aviso de direitos autorais com uma data dinâmica ao rodapé do WordPress. Isso manterá seu aviso de direitos autorais atualizado.

Isso pode desencorajar alguns usuários de roubá-lo. Também ajudará no caso de você precisar enviar uma carta de cessar e desistir ou registrar uma reclamação do DCMA para remover seu conteúdo roubado.

Você também pode solicitar o registro de direitos autorais online. Esse processo pode ser complicado, mas felizmente existem serviços jurídicos de baixo custo que podem ajudar pequenas empresas e pessoas físicas.

Saiba como em nosso guia sobre como registrar e registrar os direitos autorais do nome e logotipo do seu blog.

2. Torne seu feed RSS mais difícil de rastrear

Como a coleta de conteúdo do blog geralmente é feita automaticamente por meio do feed RSS do blog, vejamos algumas alterações úteis que você pode fazer no feed.

Não inclua o conteúdo completo da postagem em seu feed RSS do WordPress

Você pode incluir apenas um resumo de cada postagem em seu feed RSS em vez do conteúdo completo. Isso inclui um trecho, bem como metadados da postagem, como data, autor e categoria.

Certamente há um debate na comunidade de blogs sobre a possibilidade de ter feeds RSS completos ou feeds resumidos. Não vamos entrar nisso agora, exceto para dizer que uma das vantagens de ter apenas um resumo é que ele ajuda a evitar a extração de conteúdo.

Você pode alterar as configurações acessando Configurações »Leitura no painel de administração do WordPress. Você precisa selecionar a opção 'Excerto' e, em seguida, clicar no botão 'Salvar alterações'.

RSS Feeds Can Contain Full Text or an Excerpt of Each Post

Agora o feed RSS mostrará apenas um trecho do seu artigo. Se alguém estiver roubando seu conteúdo por meio de seu feed RSS, eles receberão apenas o resumo, não a postagem completa.

Se você quiser ajustar o resumo, consulte nosso guia sobre como personalizar trechos do WordPress.

Otimize seu feed RSS para evitar a raspagem

Existem outras maneiras de você otimize seu feed RSS do WordPress para proteger seu conteúdo, obter mais backlinks, aumentar seu tráfego na web e muito mais. Uma das melhores maneiras é atrasar postagens de aparecer no feed RSS.

O benefício é que, quando você atrasa a exibição de postagens em seu feed RSS, dá aos mecanismos de pesquisa tempo para rastrear e indexar seu conteúdo antes que ele apareça em outro lugar, como em sites de raspadores. Os mecanismos de pesquisa verão seu site como autoridade.

A maneira mais segura e fácil de fazer isso é usando o WPCode, pois ele possui uma receita que adiciona automaticamente o código personalizado correto ao WordPress.

Add a snippet using WPCode

Para obter instruções detalhadas, consulte nosso guia sobre como atrasar a exibição de postagens em seu feed RSS do WordPress.

3. Desativar Trackbacks, Pingbacks e REST API

Nos primórdios dos blogs, trackbacks e pingbacks foram introduzidos como uma forma de os blogs notificarem uns aos outros sobre links. Quando alguém cria um link para uma postagem em seu blog, o site dessa pessoa envia automaticamente um ping para o seu.

Esse pingback aparecerá na fila de moderação de comentários do seu blog com um link para o site deles. Se você aprovar, eles recebem um backlink e uma menção do seu site.

Isso dá ao spammer um incentivo para raspar seu site e enviar trackbacks. Felizmente, você pode desabilitar trackbacks e pingbacks para dar aos scrapers um motivo a menos para roubar seu conteúdo.

Disabling Trackbacks and Pingbacks in WordPress

Para obter mais informações, confira nosso guia sobre como desativar trackbacks em todas as postagens futuras. Você também pode aprender como desabilitar trackbacks e pings em postagens existentes do WordPress.

Desativar API REST do WordPress

Além de trackbacks e pingbacks, também recomendamos desabilitar a API REST do WordPress, pois ela pode facilitar a captura de seu conteúdo por spammers.

Temos um guia detalhado sobre como você pode desabilitar a API REST do WordPress.

Tudo o que você precisa fazer é instalar e ativar o plug-in WPCode gratuito e usar o snippet pré-criado para desativar a API REST.

4. Bloqueie o acesso do Scraper ao seu site WordPress

Uma maneira de impedir que os raspadores roubem seu conteúdo é retirar o acesso deles ao seu site. Você pode fazer isso manualmente bloqueando o endereço IP, mas a maioria dos usuários achará mais fácil usar um plug-in de segurança, como um firewall de aplicativo da web.

Bloquear o raspador usando um plug-in de segurança (recomendado)

Bloquear raspadores manualmente é complicado e dá muito trabalho. Especialmente porque muitas tentativas e ataques de hackers são feitos usando uma ampla gama de endereços IP aleatórios de todo o mundo. É quase impossível acompanhar todos esses endereços IP aleatórios.

É por isso que você precisa de um Web Application Firewall (WAF), como WordFence ou Securi. Eles agem como um escudo entre seu site e todo o tráfego de entrada, monitorando o tráfego do site e bloqueando ameaças de segurança comuns antes que cheguem ao seu site WordPress.

Para o site WPBeginner, usamos Sucuri. É um serviço de segurança de sites que protege seu site contra esses ataques usando um firewall de aplicativo de site.

Basicamente, todo o tráfego do seu site passa pelos servidores do serviço de segurança, onde é examinado em busca de atividades suspeitas. Eles impedem automaticamente que endereços IP suspeitos cheguem ao seu site. Veja como a Sucuri nos ajudou a bloquear 450.000 ataques ao WordPress em 3 meses.

Bloqueie ou redirecione manualmente o endereço IP do Scraper

Usuários avançados também podem querer bloquear manualmente o endereço IP de um raspador. Isso é mais trabalhoso, mas você pode direcionar especificamente o endereço do raspador depois de aprendê-lo. O desenvolvedor da Web Jeff Star sugere essa abordagem quando escreveu sobre como lida com raspadores de conteúdo.

Observação: adicionar código aos arquivos do site pode ser perigoso. Mesmo um pequeno erro pode causar grandes erros em seu site. É por isso que recomendamos esse método apenas para usuários avançados.

Você pode encontrar o endereço IP do raspador visitando 'Raw Access Logs' no painel cPanel da sua conta de hospedagem WordPress. Você precisa procurar endereços IP com um número excepcionalmente alto de solicitações e manter um registro deles, por exemplo, copiando-os em um arquivo de texto separado.

Blocking the Scraper's IP Address

Dica: você precisa ter certeza de que não acabará bloqueando a si mesmo, usuários legítimos ou mecanismos de pesquisa de acessar seu site. Copie um endereço IP de aparência suspeita e use as ferramentas de pesquisa de IP online para descobrir mais sobre ele.

Assim que tiver certeza de que o endereço IP pertence a um raspador, você pode bloqueá-lo usando a ferramenta 'Bloqueador de IP' do cPanel ou adicionando um código como este em seu arquivo raiz .htaccess:

Deny from 123.456.789

Certifique-se de substituir o endereço IP no código por aquele que deseja bloquear. Você pode bloquear vários endereços IP inserindo-os na mesma linha separados por espaços.

Para obter instruções detalhadas, consulte nosso guia sobre como bloquear endereços IP no WordPress.

Em vez de simplesmente bloquear os raspadores, Jeff sugere que você envie feeds RSS fictícios. Você pode criar feeds cheios de Lorem Ipsum e imagens irritantes, ou até mesmo enviá-los de volta para o próprio site, causando um loop infinito e travando o servidor.

Para redirecioná-los para um feed fictício, você precisará adicionar um código como este ao seu arquivo .htaccess:

RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]

5. Evite o roubo de imagens no WordPress

Não é apenas o seu conteúdo escrito que você precisa proteger. Você também deve evitar o roubo de imagens no WordPress.

Como o texto, não há como impedir completamente que as pessoas roubem suas imagens, mas há várias maneiras de desencorajar o roubo de imagens em um site WordPress.

Por exemplo, você pode desativar o hotlinking de suas imagens do WordPress. Isso significa que, se alguém copiar seu conteúdo, as imagens não serão carregadas no site.

Ele também reduzirá a carga do servidor e o uso da largura de banda, aumentando a velocidade e o desempenho do WordPress.

Como alternativa, você pode adicionar uma marca d'água às suas imagens que lhe dá crédito. Isso deixará claro que o raspador roubou seu conteúdo.

Você pode aprender essas duas técnicas, bem como outras formas de proteger suas imagens em nosso guia sobre 4 maneiras de evitar o roubo de imagens no WordPress.

6. Desencoraje a cópia manual do seu conteúdo

Embora a maioria dos raspadores use ferramentas automáticas, alguns ladrões de conteúdo podem tentar copiar manualmente todo ou parte do seu conteúdo.

Uma maneira de tornar isso mais difícil é impedir que eles copiem e colem seu texto. Você pode fazer isso tornando mais difícil para eles selecionar o texto em seu site.

Para saber como interromper a cópia manual do seu conteúdo, consulte nosso guia passo a passo sobre como impedir a seleção de texto e copiar/colar no WordPress.

No entanto, isso não protegerá completamente seu conteúdo. Lembre-se de que usuários experientes em tecnologia ainda podem visualizar o código-fonte ou usar a ferramenta Inspecionar para copiar o que quiserem. Além disso, esse método não funcionará com todos os navegadores da web.

Além disso, tenha em mente que nem todo mundo que copiar seu texto será um ladrão de conteúdo. Por exemplo, algumas pessoas podem querer copiar o título para compartilhar sua postagem nas redes sociais.

É por isso que recomendamos que você use esse método apenas se achar que é realmente necessário para o seu site.

7. Aproveite os raspadores de conteúdo

À medida que seu blog cresce, é quase impossível parar ou acompanhar todos os raspadores de conteúdo. Ainda enviamos reclamações DMCA. No entanto, sabemos que existem muitos outros sites que estão roubando nosso conteúdo e que simplesmente não conseguimos acompanhar.

Em vez disso, nossa abordagem é tentar aproveitar os escapistas de conteúdo. Não é tão ruim quando você vê que está ganhando dinheiro com seu conteúdo roubado ou recebendo muito tráfego do site de um raspador.

Faça dos links internos um hábito para obter tráfego e backlinks de raspadores

Em nosso guia definitivo sobre SEO, recomendamos que você torne os links internos um hábito. Ao colocar links para seu outro conteúdo em suas postagens de blog, você pode aumentar as visualizações de página e reduzir a taxa de rejeição em seu próprio site.

Mas há um segundo benefício quando se trata de raspagem. Os links internos fornecem backlinks valiosos das pessoas que estão roubando seu conteúdo. Mecanismos de busca como o Google usam backlinks como um sinal de classificação, então os backlinks adicionais são bons para o seu SEO.

Por fim, esses links internos permitem que você roube a audiência do raspador. Blogueiros talentosos colocam links em palavras-chave interessantes, tornando tentador o clique dos usuários. Os visitantes do site do raspador também clicarão nos links, que os levarão diretamente de volta ao seu próprio site.

Palavras-chave de link automático com links de afiliados para ganhar dinheiro com raspadores

Se você ganhar dinheiro com o marketing de afiliados em seu site, recomendamos ativar a vinculação automática em seus feeds RSS. Isso ajudará você a maximizar seus ganhos com leitores que leem seu site apenas por meio de leitores de RSS.

Melhor ainda, ajudará você a ganhar dinheiro com os sites que estão roubando seu conteúdo.

Basta usar um plug-in como o ThirstyAffiliates, que substituirá automaticamente as palavras-chave atribuídas por links de afiliados. Mostramos como em nosso guia sobre como vincular automaticamente palavras-chave a links de afiliados no WordPress.

Promova seu site em seu rodapé RSS

Você pode usar o plug-in All in One SEO para adicionar itens personalizados ao seu rodapé RSS. Por exemplo, você pode adicionar um banner que promova seus próprios produtos, serviços ou conteúdo.

AIOSEO RSS feed footer save

A melhor parte é que esses banners também aparecerão no site do raspador.

No nosso caso, sempre adicionamos um pequeno aviso na parte inferior das postagens em nossos feeds RSS. Ao fazer isso, obtemos um backlink para o artigo original do site do scraper.

Isso permite que o Google e outros mecanismos de pesquisa saibam que somos a autoridade. Ele também permite que seus usuários saibam que o site está roubando nosso conteúdo.

Para obter mais dicas, confira nosso guia sobre como controlar o rodapé do feed RSS no WordPress.

Esperamos que este tutorial tenha ajudado você a aprender como evitar a extração de conteúdo de blog no WordPress. Você também pode querer ver nosso guia de segurança WordPress definitivo ou conferir nossa lista das melhores soluções de análise para WordPress.

Se você gostou deste artigo, assine nosso canal do YouTube para tutoriais em vídeo do WordPress. Você também pode nos encontrar no Twitter e no Facebook.