Guía para principiantes para prevenir el raspado de contenido de blog en WordPress
Publicado: 2023-03-09¿Está buscando una manera de evitar que los spammers y los estafadores roben las publicaciones de su blog de WordPress utilizando raspadores de contenido?
Es muy frustrante como propietario de un sitio web ver que alguien está robando su contenido sin permiso, monetizándolo, superándolo en Google y robándose su audiencia.
En este artículo, cubriremos qué es el scraping de contenido de blog, cómo puede reducir y prevenir el scraping de contenido e incluso cómo aprovechar los scrapers de contenido para su propio beneficio.
¿Qué es el raspado de contenido de blog en WordPress?
El raspado de contenido de blog es cuando el contenido se toma de numerosas fuentes y se vuelve a publicar en otro sitio. Por lo general, esto se hace automáticamente a través de la fuente RSS de tu blog.
Desafortunadamente, es muy fácil y muy común que te roben el contenido de tu blog de WordPress de esta manera. Si te ha pasado a ti, entonces entiendes lo estresante y frustrante que puede ser.
A veces, su contenido simplemente se copiará y pegará directamente en otro sitio web, incluido su formato, imágenes, videos y más.
Otras veces, su contenido se volverá a publicar con atribución y un enlace a su sitio web, pero sin su permiso. Aunque esto puede ayudar a su SEO, es posible que desee mantener su contenido original alojado solo en su sitio.
¿Por qué los raspadores de contenido roban contenido?
Algunos de nuestros usuarios nos han preguntado por qué los scrapers están robando contenido. Por lo general, la principal motivación para el robo de contenido es sacar provecho de su arduo trabajo:
- Comisión de afiliados: los vendedores afiliados deshonestos pueden usar su contenido para atraer tráfico a su sitio a través de motores de búsqueda para promocionar sus productos de nicho.
- Generación de clientes potenciales: los abogados y los agentes inmobiliarios pueden pagarle a alguien para que agregue contenido y obtenga autoridad en su comunidad, y no se den cuenta de que se está extrayendo de otras fuentes.
- Ingresos por publicidad: los propietarios de blogs pueden recopilar contenido para crear un centro de conocimiento en un determinado nicho "por el bien de la comunidad" y luego cubrir el sitio con anuncios.
¿Es posible evitar por completo el scraping de contenido?
En este artículo, le mostraremos algunos pasos que puede seguir para reducir y evitar el scraping de contenido. Pero desafortunadamente, no hay forma de detener por completo a un ladrón decidido.
Es por eso que terminamos este artículo con una sección sobre cómo puede aprovechar los raspadores de contenido. Si bien no siempre puede detener a un ladrón, es posible que pueda obtener algo de tráfico e ingresos a través del contenido que le han robado.
¿Qué debe hacer cuando descubre que alguien ha extraído su contenido?
Dado que no es posible detener por completo los raspadores, es posible que algún día descubras que alguien está usando contenido que robó de tu blog. Usted puede preguntarse qué hacer cuando eso sucede.
Aquí hay algunos enfoques que las personas toman cuando se trata de raspadores de contenido:
- No hacer nada: puedes pasar mucho tiempo luchando contra los scrapers, por lo que algunos blogueros populares deciden no hacer nada. Google ya considera que los sitios conocidos son autoridades, pero eso no ocurre con los sitios más pequeños. Así que este enfoque no siempre es el mejor en nuestra opinión.
- Quitar: aquí te pones en contacto con el raspador y les pides que quiten el contenido. Si se niegan, envía un aviso de eliminación. Puede aprender cómo en nuestra guía sobre cómo encontrar y eliminar fácilmente contenido robado en WordPress.
- Aproveche: si bien trabajamos activamente para que se elimine el contenido extraído de WPBeginner, también utilizamos algunas técnicas para obtener tráfico y ganar dinero con los raspadores. Puede aprender cómo en la sección "Aproveche los raspadores de contenido" a continuación.
Dicho esto, echemos un vistazo a cómo evitar el raspado de blogs en WordPress. Dado que esta es una guía completa, hemos incluido una tabla de contenido para facilitar la navegación.
- Copyright o marca comercial Nombre y logotipo de su blog
- Haga que su fuente RSS sea más difícil de raspar
- Deshabilitar Trackbacks y Pingbacks
- Bloquee el acceso del raspador a su sitio web de WordPress
- Prevenir el robo de imágenes en WordPress
- Desaliente la copia manual de su contenido
- Aproveche los raspadores de contenido
1. Derechos de autor o marca comercial Nombre y logotipo de su blog
Las leyes de marcas registradas y derechos de autor protegen sus derechos de propiedad intelectual, su marca y su negocio contra muchos desafíos legales. Esto incluye el uso ilegal de su material protegido por derechos de autor o el nombre y el logotipo de su marca.
Debe mostrar claramente un aviso de derechos de autor en su sitio web. Si bien su contenido está cubierto automáticamente por las leyes de derechos de autor, mostrar un aviso le permitirá saber que su contenido tiene derechos de autor y que no pueden usar sus propiedades protegidas para negocios.
Por ejemplo, puede agregar un aviso de derechos de autor con una fecha dinámica a su pie de página de WordPress. Esto mantendrá su aviso de derechos de autor actualizado.
Esto puede disuadir a algunos usuarios de robarlo. También ayudará en el caso de que necesite enviar una carta de cese y desistimiento o presentar una queja de DCMA para eliminar su contenido robado.
También puede solicitar el registro de derechos de autor en línea. Este proceso puede ser complicado, pero afortunadamente existen servicios legales de bajo costo que pueden ayudar a las pequeñas empresas y a las personas.
Aprenda cómo en nuestra guía sobre cómo registrar y registrar los derechos de autor del nombre y el logotipo de su blog.
2. Haga que su fuente RSS sea más difícil de raspar
Dado que el raspado de contenido del blog generalmente se realiza automáticamente a través de la fuente RSS de su blog, veamos algunos cambios útiles que puede realizar en su fuente.
No incluya el contenido completo de la publicación en su fuente RSS de WordPress
Puede incluir solo un resumen de cada publicación en su fuente RSS en lugar del contenido completo. Esto incluye un extracto, así como metadatos de la publicación, como la fecha, el autor y la categoría.
Ciertamente, existe un debate en la comunidad de blogs acerca de si tener fuentes RSS completas o fuentes de resumen. No entraremos en eso ahora, excepto para decir que una de las ventajas de tener solo un resumen es que ayuda a evitar el raspado de contenido.
Puede cambiar la configuración yendo a Configuración » Lectura en su panel de administración de WordPress. Debe seleccionar la opción 'Extracto' y luego hacer clic en el botón 'Guardar cambios'.
Ahora la fuente RSS solo mostrará un extracto de su artículo. Si alguien está robando su contenido a través de su fuente RSS, solo obtendrá el resumen, no la publicación completa.
Si desea modificar el resumen, puede ver nuestra guía sobre cómo personalizar extractos de WordPress.
Optimice su fuente RSS para evitar el raspado
Hay otras formas en las que puedes optimice su fuente RSS de WordPress para proteger su contenido, obtener más vínculos de retroceso, aumentar su tráfico web y más. Una de las mejores maneras es Retrasar las publicaciones para que no aparezcan en la fuente RSS.
El beneficio es que cuando retrasa la aparición de publicaciones en su fuente RSS, le da tiempo a los motores de búsqueda para rastrear e indexar su contenido antes de que aparezca en otros lugares, como en los sitios web de scraper. Los motores de búsqueda verán entonces su sitio como la autoridad.
La forma más segura y fácil de hacer esto es usar WPCode porque tiene una receta que agrega automáticamente el código personalizado correcto a WordPress.
Para obtener instrucciones detalladas, consulte nuestra guía sobre cómo retrasar la aparición de publicaciones en su fuente RSS de WordPress.
3. Deshabilite Trackbacks, Pingbacks y REST API
En los primeros días de los blogs, se introdujeron trackbacks y pingbacks como una forma para que los blogs se notificaran entre sí sobre los enlaces. Cuando alguien se vincule a una publicación en su blog, su sitio web enviará automáticamente un ping al suyo.
Este pingback aparecerá en la cola de moderación de comentarios de tu blog con un enlace a su sitio web. Si lo aprueba, obtienen un vínculo de retroceso y una mención de su sitio.
Esto le da al spammer un incentivo para raspar su sitio y enviar trackbacks. Afortunadamente, puede deshabilitar trackbacks y pingbacks para darles a los rastreadores una razón menos para robar su contenido.
Para obtener más información, consulte nuestra guía sobre cómo deshabilitar los trackbacks en todas las publicaciones futuras. También le gustaría aprender cómo deshabilitar trackbacks y pings en publicaciones existentes de WordPress.
Deshabilitar la API REST de WordPress
Además de los trackbacks y los pingbacks, también recomendamos deshabilitar la API REST de WordPress, ya que puede facilitar que los spammers raspen su contenido.
Tenemos una guía detallada sobre cómo puede deshabilitar la API REST de WordPress.
Todo lo que necesita hacer es instalar y activar el complemento gratuito WPCode y usar su fragmento prefabricado para deshabilitar la API REST.
4. Bloquee el acceso del raspador a su sitio web de WordPress
Una forma de evitar que los raspadores roben su contenido es quitarles el acceso a su sitio web. Puede hacerlo manualmente bloqueando su dirección IP, pero a la mayoría de los usuarios les resultará más fácil usar un complemento de seguridad, como un firewall de aplicaciones web.
Bloquee el raspador usando un complemento de seguridad (recomendado)
Bloquear los raspadores manualmente es complicado y requiere mucho trabajo. Especialmente porque muchos intentos de piratería y ataques se realizan utilizando una amplia gama de direcciones IP aleatorias de todo el mundo. Es casi imposible mantenerse al día con todas esas direcciones IP aleatorias.
Es por eso que necesita un Firewall de aplicaciones web (WAF) como WordFence o Securi. Estos actúan como un escudo entre su sitio web y todo el tráfico entrante al monitorear el tráfico de su sitio web y bloquear las amenazas de seguridad comunes antes de que lleguen a su sitio de WordPress.
Para el sitio web de AprenderWP, usamos Sucuri. Es un servicio de seguridad de sitios web que protege su sitio web contra tales ataques utilizando un firewall de aplicación de sitio web.
Básicamente, todo el tráfico de su sitio web pasa por los servidores del servicio de seguridad, donde se examina en busca de actividad sospechosa. Bloquean automáticamente las direcciones IP sospechosas para que no lleguen a su sitio web por completo. Vea cómo Sucuri nos ayudó a bloquear 450 000 ataques a WordPress en 3 meses.
Bloquear o redirigir manualmente la dirección IP del raspador
Los usuarios avanzados también pueden desear bloquear manualmente la dirección IP de un raspador. Esto es más trabajo, pero puede apuntar específicamente a la dirección del raspador una vez que la aprenda. El desarrollador web Jeff Star sugiere este enfoque cuando escribió sobre cómo maneja los extractores de contenido.
Nota: agregar código a los archivos del sitio web puede ser peligroso. Incluso un pequeño error puede causar errores importantes en su sitio. Es por eso que solo recomendamos este método para usuarios avanzados.
Puede encontrar la dirección IP del raspador visitando 'Registros de acceso sin procesar' en el panel de control de cPanel de su cuenta de alojamiento de WordPress. Debe buscar direcciones IP con un número inusualmente alto de solicitudes y mantener un registro de ellas, por ejemplo, copiándolas en un archivo de texto separado.
Consejo: debe asegurarse de no terminar bloqueándose a sí mismo, a los usuarios legítimos o a los motores de búsqueda para que no accedan a su sitio web. Copie una dirección IP que parezca sospechosa y utilice las herramientas de búsqueda de IP en línea para obtener más información al respecto.
Una vez que esté seguro de que la dirección IP pertenece a un raspador, puede bloquearla usando la herramienta 'IP Blocker' de cPanel, o agregando un código como este en su archivo raíz .htaccess:
Deny from 123.456.789
Asegúrese de reemplazar la dirección IP en el código con la que desea bloquear. Puede bloquear varias direcciones IP ingresándolas en la misma línea separadas por espacios.
Para obtener instrucciones detalladas, consulte nuestra guía sobre cómo bloquear direcciones IP en WordPress.
En lugar de simplemente bloquear los raspadores, Jeff sugiere que podrías enviarles fuentes RSS ficticias. Podría crear fuentes llenas de Lorem Ipsum e imágenes molestas, o incluso enviarlas directamente a su propio sitio web, lo que provocaría un bucle infinito y colapsaría su servidor.
Para redirigirlos a un feed ficticio, deberá agregar un código como este a su archivo .htaccess:
RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]
5. Evita el robo de imágenes en WordPress
No es solo su contenido escrito lo que necesita proteger. También debe evitar el robo de imágenes en WordPress.
Al igual que el texto, no hay forma de evitar por completo que las personas roben sus imágenes, pero hay muchas formas de desalentar el robo de imágenes en un sitio web de WordPress.
Por ejemplo, puede deshabilitar el enlace activo de sus imágenes de WordPress. Esto significará que si alguien raspa su contenido, sus imágenes no se cargarán en su sitio.
También reducirá la carga del servidor y el uso del ancho de banda, aumentando la velocidad y el rendimiento de WordPress.
Alternativamente, puede agregar una marca de agua a sus imágenes que le dé crédito. Esto dejará en claro que el raspador ha robado su contenido.
Puede aprender estas dos técnicas, así como otras formas de proteger sus imágenes en nuestra guía sobre 4 formas de prevenir el robo de imágenes en WordPress.
6. Desaliente la copia manual de su contenido
Si bien la mayoría de los raspadores usan herramientas automáticas, algunos ladrones de contenido pueden intentar copiar manualmente todo o parte de su contenido.
Una forma de hacer esto más difícil es evitar que copien y peguen su texto. Puede hacer esto haciéndoles más difícil seleccionar el texto en su sitio web.
Para saber cómo detener la copia manual de su contenido, consulte nuestra guía paso a paso sobre cómo evitar la selección de texto y copiar/pegar en WordPress.
Sin embargo, esto no protegerá completamente su contenido. Recuerde, los usuarios expertos en tecnología aún pueden ver el código fuente o usar la herramienta Inspeccionar para copiar lo que quieran. Además, este método no funcionará con todos los navegadores web.
Además, ten en cuenta que no todos los que copien tu texto serán ladrones de contenido. Por ejemplo, algunas personas pueden querer copiar el título para compartir su publicación en las redes sociales.
Es por eso que le recomendamos que solo use este método si cree que es realmente necesario para su sitio.
7. Aproveche los raspadores de contenido
A medida que su blog crece, es casi imposible detener o realizar un seguimiento de todos los raspadores de contenido. Todavía enviamos quejas de DMCA. Sin embargo, sabemos que hay toneladas de otros sitios que están robando nuestro contenido que simplemente no podemos seguir.
En cambio, nuestro enfoque es tratar de aprovechar los escapes de contenido. No es tan malo cuando ves que estás ganando dinero con tu contenido robado o recibiendo mucho tráfico del sitio web de un raspador.
Haga de los enlaces internos un hábito para obtener tráfico y backlinks de los scrapers
En nuestra guía definitiva sobre SEO, le recomendamos que haga de los enlaces internos un hábito. Al colocar enlaces a su otro contenido en las publicaciones de su blog, puede aumentar las páginas vistas y reducir la tasa de rebote en su propio sitio.
Pero hay un segundo beneficio cuando se trata de raspar. Los enlaces internos le darán valiosos backlinks de las personas que están robando su contenido. Los motores de búsqueda como Google utilizan los vínculos de retroceso como una señal de clasificación, por lo que los vínculos de retroceso adicionales son buenos para su SEO.
Por último, estos enlaces internos le permiten robar la audiencia del raspador. Los bloggers talentosos colocan enlaces en palabras clave interesantes, lo que hace que sea tentador para los usuarios hacer clic. Los visitantes del sitio web del raspador también harán clic en los enlaces, lo que los llevará directamente a su propio sitio web.
Palabras clave de enlace automático con enlaces de afiliados para ganar dinero con raspadores
Si gana dinero en su sitio web con el marketing de afiliados, le recomendamos habilitar el enlace automático en sus fuentes RSS. Esto lo ayudará a maximizar sus ganancias de los lectores que solo leen su sitio web a través de lectores de RSS.
Aún mejor, lo ayudará a ganar dinero con los sitios que están robando su contenido.
Simplemente use un complemento como ThirstyAffiliates que reemplazará automáticamente las palabras clave asignadas con enlaces de afiliados. Te mostramos cómo en nuestra guía sobre cómo vincular automáticamente palabras clave con enlaces de afiliados en WordPress.
Promocione su sitio web en su pie de página RSS
Puede usar el complemento All in One SEO para agregar elementos personalizados a su pie de página RSS. Por ejemplo, puede agregar un banner que promocione sus propios productos, servicios o contenido.
La mejor parte es que esos banners también aparecerán en el sitio web del raspador.
En nuestro caso, siempre agregamos un pequeño descargo de responsabilidad al final de las publicaciones en nuestros canales RSS. Al hacer esto, obtenemos un vínculo de retroceso al artículo original del sitio del raspador.
Esto permite que Google y otros motores de búsqueda sepan que somos la autoridad. También permite que sus usuarios sepan que el sitio está robando nuestro contenido.
Para obtener más consejos, consulte nuestra guía sobre cómo controlar el pie de página de su fuente RSS en WordPress.
Esperamos que este tutorial le haya ayudado a aprender cómo evitar el scraping de contenido de blog en WordPress. También puede consultar nuestra guía de seguridad definitiva de WordPress o consultar nuestra lista de las mejores soluciones de análisis para WordPress.
Si te gustó este artículo, suscríbete a nuestro canal de YouTube para videos tutoriales de WordPress. También puede encontrarnos en Twitter y Facebook.