Como evitar a raspagem de conteúdo do site no WordPress

Publicados: 2023-01-19

Você se preocupa que alguém possa pegar o conteúdo do seu site e usá-lo sem a sua permissão?

A raspagem de sites, também conhecida como raspagem de conteúdo, é um problema comum para muitos proprietários de sites, e os usuários do WordPress podem enfrentá-lo com mais frequência do que outros.

De acordo com um estudo, 85% das imagens compartilhadas online são roubadas e cerca de 90% de todos os sites extraem conteúdo de outros sites.

Felizmente, existem maneiras de evitar a extração de conteúdo em seu site WordPress.

Neste artigo, examinarei algumas estratégias viáveis ​​e bem-sucedidas para proteger e controlar o conteúdo do seu site.

Índice
O que é raspagem de conteúdo?
Por que os raspadores de conteúdo estão roubando o conteúdo do seu site?
Como capturar raspadores de conteúdo?
11 maneiras de proteger seu site WordPress de raspadores de conteúdo
Método 1: Desativar Hotlinking no WordPress
Método 2: Limitação e Bloqueio de Taxa
Método 3: Use um plug-in de proteção contra cópia de conteúdo e desative o botão direito
Método 4: desativar ou limitar feeds RSS
Método 5: Adicione Muitos Links Internos
Método 6: Previna o Roubo de Imagens
Método 7: Instale o plug-in Recaptcha
Método 8: Instale um Plug-in de Segurança
Método 9: Bloquear IP de Web Scraping Bots
Método 10: Adicionar marca d'água às imagens
Método 11: peça manualmente ao Google para indexar seus artigos após a publicação
Como aproveitar os raspadores de conteúdo
Conclusão

O que é raspagem de conteúdo?

A raspagem de conteúdo é o ato de extrair conteúdo de sites usando ferramentas automatizadas sem o consentimento do proprietário do site.

Hackers e spammers frequentemente usam esse método para republicar conteúdo em outros sites ou coletar dados pessoais.

Aqui estão alguns exemplos de extração de conteúdo:

1. Raspagem de artigos: roubar artigos de blogs ou fontes de notícias e republicá-los sem permissão em outros sites usando plug-ins WordPress de autoblogging.

2. Raspagem de preços: roubar preços de sites de comércio eletrônico e usá-los para minar o vendedor original.

3. Raspagem de contatos : Raspar informações de contato de sites e usá-las para enviar mensagens de spam ou phishing. Você deve ocultar ou codificar endereços de e-mail para impedir a coleta de contatos em seu site.

4. Raspagem de pesquisa: usando os resultados do mecanismo de pesquisa que foram raspados para aumentar a classificação de outros sites.

5. Raspagem social: roubar informações de plataformas de mídia social e usá-las para criar contas falsas ou se passar por outra pessoa.

Proprietários de sites que se dedicam à coleta de conteúdo correm o risco de perder visitantes e dinheiro e manchar suas reputações.

Você pode usar ferramentas como proteções de conteúdo, CAPTCHAs e bloqueio de IP para bloquear o tráfego em seu site, para não ser raspado.

Por que os raspadores de conteúdo estão roubando o conteúdo do seu site?

A raspagem de conteúdo é um problema comum enfrentado pelos proprietários de sites.

Mas por que os raspadores de conteúdo roubam o conteúdo do seu site? Aqui estão cinco razões:

1. Lucro: Seu conteúdo pode ser copiado por raspadores para republicar e monetizar seus próprios sites pagando por publicidade ou revendendo anúncios

2. Conveniência: os raspadores de conteúdo permitem que você preencha rapidamente seu site com conteúdo sem ter que criar seu próprio, porque eles copiam o conteúdo de outros sites

3. Otimização do mecanismo de pesquisa: raspadores de conteúdo podem roubar o conteúdo do seu site para melhorar suas próprias classificações nos mecanismos de pesquisa.

4. Falta de originalidade: alguns raspadores de conteúdo roubam conteúdo devido à falta de originalidade ou criatividade.

5. Concorrência: alguns raspadores de conteúdo roubam conteúdo para competir com seu site ou prejudicar seus negócios.

Além de afetar negativamente a classificação do mecanismo de pesquisa do seu site, a extração de conteúdo também pode fazer com que sua empresa perca receita

Como capturar raspadores de conteúdo?

A raspagem de conteúdo pode ser um grande problema para blogueiros e proprietários de sites. Mas como você pode capturar raspadores de conteúdo?

Aqui estão seis dicas para identificar e lidar com a extração de conteúdo:

1. Use plug-ins protetores de conteúdo : você pode impedir que as pessoas copiem seu conteúdo com plug-ins protetores de conteúdo. Se você não quiser fazer isso, pode permitir que eles copiem o link de referência junto com o conteúdo e, finalmente, encontrem seus usuários dessa maneira.

2. Use Copyscape: Esta ferramenta pode ajudá-lo a encontrar instâncias de conteúdo de seu site sendo usadas em outros sites sem sua permissão.

3. Monitore o tráfego do seu site: Fique de olho nas análises do seu site para ver se houve um aumento repentino no tráfego de uma determinada fonte de referência.

4. Configurar Alertas do Google: Você pode receber alertas desta ferramenta quando o conteúdo do seu site aparecer em outros sites.

5. Use a Wayback Machine: ao permitir que você veja iterações anteriores de um site, essa ferramenta pode ajudá-lo a identificar instâncias em que o conteúdo foi adicionado a um site sem o seu consentimento.

6. Use marca d'água: fotos e vídeos com marca d'água podem desencorajar os raspadores de conteúdo porque torna mais difícil para eles usar seu conteúdo secretamente.

É importante observar que pode ser difícil detectar todas as ocorrências de extração de conteúdo e que prevenir é melhor do que remediar.

Ao combinar esses métodos, você pode aumentar as chances de capturar raspadores de conteúdo e proteger o conteúdo do seu site. Fique ligado para saber mais sobre como evitar a extração de conteúdo.

11 maneiras de proteger seu site WordPress de raspadores de conteúdo

Este é o novo normal para roubar seu conteúdo, e muitos estão apenas lidando com isso. Quase todo mundo já experimentou roubo de conteúdo.

Impedir que todo o conteúdo seja copiado é quase impossível, mas isso não significa que não podemos tornar isso mais difícil para eles. Além disso, esses métodos impedem a maioria dos usuários, incluindo alguns especialistas.

Se você criar conteúdo original e bom, há uma grande chance de que seu conteúdo seja descartado. Tentei mostrar a você métodos para evitar a extração de conteúdo neste artigo.

Também escrevi um artigo informando os métodos mais eficazes para evitar o roubo de conteúdo em seu site; certifique-se de verificar isso.

Método 1: Desativar Hotlinking no WordPress

Hotlinking é uma maneira comum de usar seu conteúdo no site deles. Com hotlinking, eles usam sua postagem, página ou link de mídia para mostrá-lo diretamente em seu site.

Ao fazer hotlinking, eles não apenas usam seu conteúdo sem o seu consentimento, mas também usam a largura de banda do seu host para mostrá-lo ao público.

Sugiro usar o WPShield Content Protector para desabilitar hotlinking, que oferece um protetor seguro para evitar hotlinking.

Para desativar o hotlink de iFrame, siga estas etapas:

Passo 1: Baixe o Protetor de Conteúdo WPShield.

Etapa 2: Vá para o painel do WordPress e instale o plug-in em Plugins → Adicionar novo .

Passo 3: Vá para WP Shield → Configurações .

Vá para WP Shield → Configurações e vá para o painel de configuração do protetor de conteúdo

Passo 4: Abra o iFrame Hotlink Protector e ligue o iFrame Hotlink Protector .

Abra o iFrame Hotlink Protector e ative o iFrame Hotlink Protector

Passo 5: Este protetor oferece quatro protocolos com diferentes níveis de segurança.

Escolha um protocolo que melhor atenda às suas necessidades

Escolha o melhor protocolo de acordo com a sua necessidade:

  • Mostrar mensagem pop-up em solicitações de iFrame: este protocolo mostra uma mensagem pop-up no iFrame solicitado. Este protocolo não é 100% seguro e outros protocolos são mais adequados se você estiver procurando por opções mais seguras.
  • Bloquear e mostrar uma página em branco em iFrames: este protocolo bloqueia a solicitação de iFrame e mostra uma página em branco. Este protocolo é a opção mais segura.
  • Mostrar uma marca d'água Direitos autorais em solicitações de iFrame: este protocolo mostra uma marca d'água no topo da página solicitada. Escolha a imagem e sua opacidade na seção Marca d'água nas páginas iFrame . Este protocolo tem o melhor UX garantindo que seu público tenha uma boa experiência em seu site.
  • Redirecionar solicitação de iFrame para página personalizada: você pode criar uma página personalizada para mostrar em vez do iFrame solicitado. Esta página pode mostrar o que você tem em seu site ou um aviso sobre roubo de conteúdo. Selecione a página personalizada em Redirecionar para a página .

Ladrões podem usar seu link de mídia para hotlink em seu site. A mídia de hotlinking acontece com frequência e pode diminuir a velocidade do servidor se acontecer muito.

Nota importante: sugiro que você leia nosso guia definitivo para desabilitar hotlinking no WordPress porque explicamos todos os métodos para desabilitar hotlinking, incluindo vídeo, áudio e imagens também.

Método 2: Limitação e Bloqueio de Taxa

A limitação de taxa é uma técnica que limita o número de solicitações que um usuário ou endereço IP pode fazer ao seu site dentro de um determinado período.

Isso pode impedir que os raspadores sobrecarreguem seu servidor com um grande número de solicitações, o que pode causar danos e tornar seu site lento para usuários legítimos.

O bloqueio, por outro lado, é uma técnica que nega o acesso ao seu site com base em determinados critérios, como endereço IP ou agente do usuário.

Isso pode ser usado para bloquear raspadores conhecidos ou endereços IP que estão fazendo muitas solicitações, evitando tentativas de raspagem antes mesmo de chegarem ao seu servidor.

Quando usados ​​juntos, a limitação de taxa e o bloqueio podem ser um método eficaz de impedir a extração de conteúdo. É como um segurança na porta, permitindo que apenas usuários legítimos acessem seu site enquanto bloqueia aqueles que estão lá para causar problemas.

A melhor maneira de adicionar limitação de taxa é usando plugins de segurança. Você pode verificar nossa lista dos melhores plugins de segurança do WordPress para obter mais informações.

Método 3: Use um plug-in de proteção contra cópia de conteúdo e desative o botão direito

Clicar com o botão direito é provavelmente o primeiro método que os ladrões usam para roubar o conteúdo de um site. Desativar o clique com o botão direito pode impedir que usuários normais roubem seu conteúdo.

Observação: desabilitar o clique com o botão direito pode diminuir a experiência do usuário e fazer com que seu público genuíno saia do site.

Eu uso o WPShield Content Protector para desabilitar o clique com o botão direito neste artigo.

O WPShield Content Protector também pode limitar o menu do botão direito. Esta opção protege seu conteúdo enquanto garante que o UX do site não seja afetado. A seguir, explicarei as duas opções; escolha com base em suas necessidades.

Para evitar clicar com o botão direito do mouse em seu site, siga estas etapas:

Passo 1: Vá para WP Shield → Configurações .

Etapa 2: vá para o Protetor de clique direito e habilite o Protetor de menu do botão direito .

Vá para o protetor de clique direito e ative o protetor de menu do botão direito

Etapa 3: neste protetor, você pode optar por desativar ou limitar o menu do botão direito .

Escolha um protocolo que melhor atenda às suas necessidades

Escolha um protocolo baseado na sua necessidade:

  • Desativar o menu de contexto do botão direito completamente: Este protocolo elimina o clique com o botão direito do mouse em seu site. É um método muito seguro, mas diminui a experiência do usuário (UX).
  • Limitador de menu do botão direito: Este protocolo limita o menu do botão direito em vez de desativá-lo. Os ladrões não podem abusar das opções de clique com o botão direito para roubar seu conteúdo, mas os usuários comuns podem usar seu recurso, como o link de abertura em uma nova guia.
Um exemplo de menu de clique direito limitado

É assim que o menu limitado do botão direito se parece.

Nota importante: para obter mais informações, consulte nosso guia definitivo para desativar o clique com o botão direito no WordPress, onde explicamos mais informações e métodos.

Método 4: desativar ou limitar feeds RSS

Os plug-ins e bots de automação usam links de feed RSS para roubar seu conteúdo, portanto, você precisa desativar ou limitar o link RSS.

O WPShield Content Protector pode ajudá-lo a evitar a raspagem de sites, limitando ou desativando feeds RSS.

Para desativar ou restringir o RSS Feed, siga estas etapas:

Passo 1: Vá para WP Shield → Configurações .

Etapa 2: vá para o Feed Protector e ative o Feed Protector .

Vá para Feed Protector e ative o Feed Protector.

Etapa 3: neste protetor, você pode desativar ou limitar o RSS Feed.

Escolha um protocolo que melhor atenda às suas necessidades

Escolha um protocolo baseado na sua necessidade:

  • Desativar e redirecionar URLs de feed para páginas normais: Este protocolo desativa totalmente o link RSS e redireciona o usuário para a página padrão.
  • Mostrar apenas trechos de postagem em feeds: este protocolo mostra apenas o trecho da postagem e elimina o conteúdo da postagem. Este protocolo tem o melhor UX.
  • Erro 404 de página não encontrada para todas as solicitações de feed: este protocolo mostra um erro de página 404 não encontrada para todas as solicitações de feed. Este método é altamente seguro.

Outro método eficaz é adicionar um aviso de direitos autorais ao seu conteúdo RSS Feed. Você pode adicionar um link ao seu site e obter um backlink ou obter crédito.

Para adicionar um aviso de direitos autorais no conteúdo do feed RSS, faça o seguinte:

Passo 1: Vá para WP Shield → Configurações .

Etapa 2: vá para o Feed Protector e ative o Feed Protector .

Etapa 3: adicionar um aviso de direitos autorais antes de publicar o conteúdo no feed ou um aviso de direitos autorais após publicar o conteúdo no feed .

Escreva um aviso de direitos autorais antes de postar conteúdo no feed ou aviso de direitos autorais após postar conteúdo no feed.

Método 5: Adicione Muitos Links Internos

Tornar difícil para os raspadores acessarem todo o seu conteúdo de uma vez é uma das melhores maneiras de os proprietários de sites interromperem a raspagem de conteúdo.

Aqui estão algumas dicas para adicionar links internos ao seu site WordPress:

1. Link para conteúdo antigo: Ao publicar um novo conteúdo, crie um link para conteúdo mais antigo que seja relevante para o tópico em questão. Você pode usar plugins de criação de links internos do WordPress como o LinkWhisper para fazer isso automaticamente. Isso manterá os usuários em seu site por mais tempo e tornará mais difícil para os raspadores acessarem todo o seu conteúdo de uma só vez.

2. Use o texto âncora: O texto âncora é o texto que é exibido como o link. Use palavras ou frases descritivas em seu texto âncora para dar aos usuários uma ideia da página vinculada.

3. Use categorias e tags: o WordPress possui categorias e tags integradas que você pode usar para organizar seu conteúdo. Use-os para vincular conteúdo relacionado e tornar mais difícil para os raspadores acessarem todo o seu conteúdo de uma só vez.

4. Use plugins de posts relacionados: Uma ótima maneira de adicionar links internos sem ter que fazer isso manualmente é usando um dos muitos plugins de posts relacionados para WordPress, que podem vincular automaticamente ao conteúdo do seu site relacionado.

É importante observar que apenas adicionar links internos pode não ser uma solução infalível para evitar a extração de conteúdo. É sempre bom ter várias camadas de proteção.

Você pode melhorar a segurança do seu site e proteger seus usuários combinando várias técnicas como limitação de taxa, bloqueio e adição de links internos.

Método 6: Previna o Roubo de Imagens

Se você é um fotógrafo com fotos originais em seu site, sempre se preocupa que suas fotos sejam roubadas e, sim, você deveria ser!

De acordo com o CopyTrack, aproximadamente 2,5 bilhões de imagens são roubadas todos os dias, ou seja, 85% de todas as imagens compartilhadas, o que é chocante!

Você pode usar o WPShield Content Protector para evitar o roubo de imagens em seu site. Este plug-in oferece diferentes opções para garantir que suas fotos estejam seguras.

Para evitar o roubo de imagens, siga estas etapas:

Passo 1: Vá para WP Shield → Configurações .

Passo 2: Vá para o Image Protector e habilite o Image Theft Protector.

Vá para o Image Protector e ative o Image Theft Protector.

Etapa 3: Image Protector oferece diferentes opções para proteger suas imagens.

Ative as opções que atendem às suas necessidades:

  • Desativar clique com o botão direito nas imagens: você pode desativar o clique com o botão direito do mouse na imagem para que ninguém possa baixá-la. Esta opção pode diminuir o UX do site. Sugiro que você limite o menu do botão direito do mouse em vez de desativá-lo para aprimorar a experiência do usuário do site.
  • Desativar arrastar e soltar em imagens: os ladrões podem arrastar e soltar imagens para fazer o download ou carregá-las em outra fonte. Este protocolo garante que arrastar e soltar esteja desabilitado nas fotos.
  • Remover link âncora ao redor das imagens: este protocolo remove qualquer link que aponte para a versão completa ou lightbox da imagem.
  • Proteção de hotlink para imagens: alguns ladrões podem usar o link da sua imagem para mostrá-la em seu site. Este protocolo bloqueia qualquer solicitação de recursos externos solicitando o carregamento da imagem.

A proteção de hotlink para imagens não bloqueia mecanismos de pesquisa como o google e apenas bloqueia solicitações de sites regulares.

Nota importante: Se você quiser saber mais sobre como evitar o roubo de imagens em seu site, escrevi um tutorial completo sobre como proteger imagens no site WordPress.

Método 7: Instale o plug-in Recaptcha

Para descartar o conteúdo, um bot precisa acessar seu site. bloqueando os bots do seu site, você pode garantir que a maioria deles não possa vaporizar o conteúdo do seu site.

Você pode usar um plug-in ReCaptcha WordPress para evitar a extração de conteúdo.

ReCAPTCHA é uma forma avançada de CAPTCHA que pode distinguir entre robôs e usuários humanos.

Passar no teste exige que os usuários marquem uma caixa de seleção para indicar que não são robôs. Eles passarão imediatamente ou serão apresentados a várias imagens correspondentes.

Método 8: Instale um Plug-in de Segurança

Você pode proteger seu site de raspadores de conteúdo instalando um plug-in de segurança do WordPress, como o Sucuri. Se você deseja que seu conteúdo seja raspado, os raspadores de conteúdo devem visitar seu site.

WordFence e Sucuri são dois dos principais plugins de segurança do WordPress.

É comum que os raspadores visitem as páginas mais rapidamente e enviem mais solicitações HTTP do que os visitantes humanos. No entanto, eles costumam ter sessões de visualização de página mais curtas.

Os plug-ins de segurança são projetados para detectar comportamentos suspeitos como esse.

Depois de instalado, ele procurará sinais de atividade de bot enquanto monitora o tráfego em seu site. Se o plug-in de segurança acreditar que o visitante é um bot, ele bloqueará todo o tráfego desse endereço IP.

Método 9: Bloquear IP de Web Scraping Bots

Você deve primeiro instalar o Wordfence Premium.

Solicitaremos ao Wordfence que registre os hosts IP e os agentes visitantes que visitam seu site e, em seguida, filtre os bots de raspagem da web.

Passo 1: Instale o modo Live Traffic . Vá para Wordfence → Ferramentas e instale-o.

Etapa 2: filtre os bots de raspagem para bloqueá-los. Clique em Mostrar filtros avançados Selecionar URL contém feed para ver quais bots de raspagem da web acessaram o URL do seu feed RSS

Os bots de raspagem da Web têm as seguintes características:

  • O nome do agente do usuário geralmente significa que é um pouco. No entanto, às vezes eles têm nomes humanos, tornando-os mais difíceis de encontrar.
  • Eles visitam seu site em um horário repetitivo e regular, como a cada 5 ou 10 minutos.
  • Nem o hostname nem o user-agent contêm palavras como feed, content ou jornal.

Como evitar o bloqueio de bots amigáveis:

  • O nome de host do bot do Google é crawl-X.googlebot.com e X é o IP do bot. Qualquer nome de host com a palavra “google”, mas não googlebot.com, pode ser falso.
  • Bot das páginas que você criou favoritos ou backlinks, o nome do bot geralmente conterá o nome do site ou nome de domínio. Em qual página você cria favoritos ou backlinks, lembre-se de comparar.

Passo 3: Vá para o Wordfence → Bloqueio → Padrão personalizado para adicionar um comando.

Método 10: Adicionar marca d'água às imagens

Uma maneira de evitar o roubo de imagens é adicionar uma marca d'água às suas imagens. Você pode usar um plug-in de marca d'água do WordPress.

Existem artigos detalhados sobre como adicionar automaticamente uma marca d'água a uma imagem no WordPress que fornecem instruções passo a passo

Existem três receitas de marcas d'água em suas imagens:

  • Eles não usarão sua imagem e ela será protegida
  • Eles tentam um aplicativo de photoshop que diminui a qualidade da imagem
  • Eles usam sua foto com marca d'água, que dá crédito ao seu trabalho, e o público conhece o criador.

Método 11: peça manualmente ao Google para indexar seus artigos após a publicação

Uma maneira de evitar a raspagem de conteúdo é garantir que os mecanismos de pesquisa, como o Google, indexem seus artigos assim que forem publicados.

Aqui estão as etapas para pedir manualmente ao Google para indexar seus artigos:

Passo 1: Vá para o Google Search Console .

Etapa 2: cole o novo URL do artigo na caixa de pesquisa e verifique o URL.

Etapa 3: clique em Solicitar indexação .

É importante observar que esse método não garante que o Google indexará seu artigo imediatamente, mas pode acelerar o processo.

Além disso, é uma boa ideia usar o plug-in Instant Indexing For Google, que indexa as postagens assim que você as publica.

Outra dica é que você também pode enviar seu sitemap para o Google usando o recurso “Sitemaps” no Search Console.

Isso ajudará o Google a encontrar e indexar todas as páginas do seu site, incluindo seus artigos recém-publicados.

Como aproveitar os raspadores de conteúdo

Embora a raspagem de conteúdo seja uma ferramenta muito útil, existem outros usos que podem ser feitos.

Aqui estão cinco dicas para fazer isso:

1. Use o conteúdo copiado para melhorar sua classificação nos mecanismos de pesquisa:

O conteúdo duplicado pode resultar da raspagem do conteúdo do seu site, o que aumenta a probabilidade de os mecanismos de pesquisa indexá-lo e diminuir a classificação do seu site como resultado.

Mas você pode informar aos mecanismos de pesquisa qual versão do conteúdo é a original e deve receber preferência usando uma tag canônica.

2. Use o conteúdo copiado como uma forma de publicidade gratuita:

Se o seu conteúdo está sendo copiado, significa que um público mais amplo o está vendo. Você pode usar isso a seu favor, incluindo links para seu site no conteúdo copiado.

3. Use o conteúdo copiado como forma de gerar backlinks:

Se o seu conteúdo está sendo copiado, é provável que contenha links para o seu site, pois os backlinks são um componente crucial da otimização do mecanismo de pesquisa.

Isso pode ajudar a aumentar a visibilidade do seu site e as classificações nos mecanismos de pesquisa.

4. Use o conteúdo copiado como forma de gerar leads:

Se o seu conteúdo estiver sendo copiado, é provável que inclua um link para o seu site. Você pode usar isso como uma oportunidade para gerar leads, incluindo uma frase de chamariz no conteúdo copiado.

5. Use o conteúdo copiado como uma forma de se estabelecer como uma autoridade em seu setor:

Se o seu conteúdo está sendo copiado, é provável que um grande público o esteja vendo, e você pode aproveitar isso incluindo suas informações de contato no conteúdo copiado para se posicionar como uma autoridade em seu campo.

Conclusão

Neste artigo, falei sobre extração de conteúdo, por que você precisa apresentar a extração de conteúdo, como desativar o roubo de conteúdo e métodos alternativos para proteger seu conteúdo.

Use o WPShield Content Protector, que garante que seu conteúdo seja seguro e pode impedir a extração de conteúdo com seus recursos exclusivos.

Obrigado por ler este artigo até o final. Informe-me se você conhece algum método alternativo para impedir a extração de conteúdo e se tem alguma experiência com o roubo de seu conteúdo.

Por favor, siga BetterStudio no Facebook e Twitter para ser o primeiro a saber sobre meus novos artigos.