Guida per principianti per prevenire lo scraping dei contenuti del blog in WordPress
Pubblicato: 2023-03-09Stai cercando un modo per impedire a spammer e truffatori di rubare i post del tuo blog WordPress utilizzando i content scraper?
È molto frustrante come proprietario di un sito Web vedere che qualcuno sta rubando i tuoi contenuti senza autorizzazione, monetizzandoli, superandoti in Google e rubando il tuo pubblico.
In questo articolo, tratteremo cos'è lo scraping dei contenuti del blog, come ridurre e prevenire lo scraping dei contenuti e persino come sfruttare gli scraper dei contenuti a proprio vantaggio.
Che cos'è lo scraping dei contenuti del blog in WordPress?
Lo scraping del contenuto del blog è quando il contenuto viene prelevato da numerose fonti e ripubblicato su un altro sito. Di solito, questo viene fatto automaticamente tramite il feed RSS del tuo blog.
Sfortunatamente, è molto facile e molto comune che i contenuti del tuo blog WordPress vengano rubati in questo modo. Se ti è successo, allora capisci quanto possa essere stressante e frustrante.
A volte i tuoi contenuti verranno semplicemente copiati e incollati direttamente su un altro sito Web, inclusa la formattazione, le immagini, i video e altro.
Altre volte, i tuoi contenuti verranno ripubblicati con l'attribuzione e un link al tuo sito web, ma senza la tua autorizzazione. Anche se questo può aiutare il tuo SEO, potresti voler mantenere i tuoi contenuti originali ospitati solo sul tuo sito.
Perché i Content Scraper rubano i contenuti?
Alcuni dei nostri utenti ci hanno chiesto perché gli scraper rubano contenuti. Di solito, la motivazione principale per il furto di contenuti è trarre profitto dal tuo duro lavoro:
- Commissione di affiliazione: gli affiliati di marketing disonesti possono utilizzare i tuoi contenuti per portare traffico al loro sito attraverso i motori di ricerca al fine di promuovere i loro prodotti di nicchia.
- Generazione di lead: avvocati e agenti immobiliari possono pagare qualcuno per aggiungere contenuti e acquisire autorità nella propria comunità, senza rendersi conto che viene prelevato da altre fonti.
- Entrate pubblicitarie: i proprietari di blog possono raschiare i contenuti per creare un hub di conoscenza in una certa nicchia "per il bene della comunità" e quindi ricoprire il sito di annunci.
È possibile prevenire completamente lo scraping dei contenuti?
In questo articolo, ti mostreremo alcuni passaggi che puoi adottare per ridurre e prevenire lo scraping dei contenuti. Ma sfortunatamente, non c'è modo di fermare completamente un ladro determinato.
Ecco perché terminiamo questo articolo con una sezione su come sfruttare i content scraper. Anche se non puoi sempre fermare un ladro, potresti essere in grado di guadagnare traffico e entrate attraverso i contenuti che ti hanno rubato.
Cosa dovresti fare quando scopri che qualcuno ha raschiato i tuoi contenuti?
Poiché non è possibile bloccare completamente gli scraper, un giorno potresti scoprire che qualcuno sta utilizzando i contenuti che ha rubato dal tuo blog. Potresti chiederti cosa fare quando ciò accade.
Ecco alcuni approcci che le persone adottano quando si tratta di raschiatori di contenuti:
- Non fare nulla: puoi passare molto tempo a combattere gli scraper, quindi alcuni famosi blogger decidono di non fare nulla. Google vede già i siti noti come autorità, ma questo non è vero per i siti più piccoli. Quindi questo approccio non è sempre il migliore secondo noi.
- Take Down: qui contatti il raschietto e chiedi loro di rimuovere il contenuto. Se rifiutano, invii un avviso di rimozione. Puoi scoprire come nella nostra guida su come trovare e rimuovere facilmente i contenuti rubati in WordPress.
- Approfittane: mentre lavoriamo attivamente per rimuovere i contenuti estratti da WPBeginner, utilizziamo anche alcune tecniche per ottenere traffico e guadagnare denaro dagli scraper. Puoi scoprire come nella sezione "Sfrutta i vantaggi dei raschiatori di contenuti" di seguito.
Detto questo, diamo un'occhiata a come prevenire lo scraping del blog in WordPress. Poiché si tratta di una guida completa, abbiamo incluso un sommario per facilitare la navigazione.
- Copyright o marchio registrato Nome e logo del tuo blog
- Rendi il tuo feed RSS più difficile da raschiare
- Disattiva trackback e pingback
- Blocca l'accesso del raschietto al tuo sito Web WordPress
- Prevenire il furto di immagini in WordPress
- Scoraggia la copia manuale dei tuoi contenuti
- Approfitta dei Content Scraper
1. Copyright o marchio registrato Nome e logo del tuo blog
Le leggi sui marchi e sul copyright proteggono i diritti di proprietà intellettuale, il marchio e l'azienda da molte sfide legali. Ciò include l'uso illegale del tuo materiale protetto da copyright o del nome e del logo del tuo marchio.
Dovresti mostrare chiaramente un avviso di copyright sul tuo sito web. Sebbene i tuoi contenuti siano automaticamente coperti dalle leggi sul copyright, la visualizzazione di un avviso ti farà sapere che i tuoi contenuti sono protetti da copyright e che non possono utilizzare le tue proprietà protette per affari.
Ad esempio, puoi aggiungere un avviso di copyright con una data dinamica al piè di pagina di WordPress. Ciò manterrà aggiornato il tuo avviso di copyright.
Ciò potrebbe scoraggiare alcuni utenti dal rubarlo. Sarà utile anche nel caso in cui sia necessario inviare una lettera di cessazione e desistenza o presentare un reclamo DCMA per rimuovere i contenuti rubati.
Puoi anche richiedere la registrazione del copyright online. Questo processo può essere complicato, ma fortunatamente esistono servizi legali a basso costo che possono aiutare le piccole imprese e i privati.
Scopri come nella nostra guida su come marchiare e proteggere il nome e il logo del tuo blog.
2. Rendi il tuo feed RSS più difficile da raschiare
Poiché lo scraping dei contenuti del blog viene solitamente eseguito automaticamente tramite il feed RSS del tuo blog, diamo un'occhiata ad alcune utili modifiche che puoi apportare al tuo feed.
Non includere l'intero contenuto del post nel feed RSS di WordPress
Puoi includere solo un riepilogo di ogni post nel tuo feed RSS invece del contenuto completo. Ciò include un estratto e metadati del post come la data, l'autore e la categoria.
C'è certamente un dibattito nella comunità dei blog sull'opportunità di avere feed RSS completi o feed di riepilogo. Non entreremo in questo ora se non per dire che uno dei vantaggi di avere solo un riepilogo è che aiuta a prevenire lo scraping dei contenuti.
Puoi modificare le impostazioni andando su Impostazioni »Lettura nel pannello di amministrazione di WordPress. È necessario selezionare l'opzione "Estratto", quindi fare clic sul pulsante "Salva modifiche".
Ora il feed RSS mostrerà solo un estratto del tuo articolo. Se qualcuno sta rubando i tuoi contenuti tramite il tuo feed RSS, riceverà solo il riepilogo, non il post completo.
Se desideri modificare il riepilogo, puoi consultare la nostra guida su come personalizzare gli estratti di WordPress.
Ottimizza il tuo feed RSS per prevenire lo scraping
Ci sono altri modi in cui puoi ottimizza il tuo feed RSS di WordPress per proteggere i tuoi contenuti, ottenere più backlink, aumentare il tuo traffico web e altro ancora. Uno dei modi migliori è farlo ritardare la visualizzazione dei post nel feed RSS.
Il vantaggio è che quando ritardi la visualizzazione dei post nel tuo feed RSS, dai ai motori di ricerca il tempo di eseguire la scansione e l'indicizzazione dei tuoi contenuti prima che appaiano altrove, ad esempio sui siti Web di scraper. I motori di ricerca vedranno quindi il tuo sito come l'autorità.
Il modo più sicuro e semplice per farlo è usare WPCode perché ha una ricetta che aggiunge automaticamente il codice personalizzato corretto a WordPress.
Per istruzioni dettagliate, consulta la nostra guida su come ritardare la visualizzazione dei post nel feed RSS di WordPress.
3. Disattiva Trackback, Pingback e API REST
Agli albori del blog, i trackback e i pingback sono stati introdotti come un modo per i blog di informarsi a vicenda sui collegamenti. Quando qualcuno si collega a un post sul tuo blog, il suo sito Web invierà automaticamente un ping al tuo.
Questo pingback apparirà quindi nella coda di moderazione dei commenti del tuo blog con un link al loro sito web. Se lo approvi, ottengono un backlink e una menzione dal tuo sito.
Questo dà allo spammer un incentivo a raschiare il tuo sito e inviare trackback. Fortunatamente, puoi disabilitare trackback e pingback per dare agli scraper un motivo in meno per rubare i tuoi contenuti.
Per ulteriori informazioni, consulta la nostra guida su come disabilitare i trackback su tutti i post futuri. Potresti anche voler imparare a disabilitare i trackback e i ping sui post WordPress esistenti.
Disabilita l'API REST di WordPress
Oltre a trackback e pingback, ti consigliamo anche di disabilitare l'API REST di WordPress in quanto può facilitare agli spammer lo scraping dei tuoi contenuti.
Abbiamo una guida dettagliata su come disabilitare l'API REST di WordPress.
Tutto quello che devi fare è installare e attivare il plug-in WPCode gratuito e utilizzare il loro frammento predefinito per disabilitare l'API REST.
4. Blocca l'accesso del raschietto al tuo sito Web WordPress
Un modo per impedire agli scraper di rubare i tuoi contenuti è togliergli l'accesso al tuo sito web. Puoi farlo manualmente bloccando il loro indirizzo IP, ma la maggior parte degli utenti troverà più facile utilizzare un plug-in di sicurezza come un firewall per applicazioni web.
Blocca lo scraper utilizzando un plug-in di sicurezza (consigliato)
Il blocco manuale dei raschietti è complicato e richiede molto lavoro. Tanto più che molti tentativi di hacking e attacchi vengono effettuati utilizzando una vasta gamma di indirizzi IP casuali da tutto il mondo. È quasi impossibile tenere il passo con tutti quegli indirizzi IP casuali.
Ecco perché hai bisogno di un Web Application Firewall (WAF) come WordFence o Securi. Questi fungono da scudo tra il tuo sito web e tutto il traffico in entrata, monitorando il traffico del tuo sito web e bloccando le comuni minacce alla sicurezza prima che raggiungano il tuo sito WordPress.
Per il sito Web WPBeginner, utilizziamo Sucuri. È un servizio di sicurezza del sito Web che protegge il tuo sito Web da tali attacchi utilizzando un firewall per applicazioni Web.
Fondamentalmente, tutto il traffico del tuo sito Web passa attraverso i server del servizio di sicurezza dove viene esaminato per attività sospette. Impediscono automaticamente agli indirizzi IP sospetti di raggiungere del tutto il tuo sito web. Guarda come Sucuri ci ha aiutato a bloccare 450.000 attacchi WordPress in 3 mesi.
Blocca o reindirizza manualmente l'indirizzo IP del raschietto
Gli utenti esperti potrebbero anche voler bloccare manualmente l'indirizzo IP di uno scraper. Questo è più lavoro, ma puoi indirizzare in modo specifico l'indirizzo del raschietto una volta che lo impari. Lo sviluppatore web Jeff Star suggerisce questo approccio quando ha scritto su come gestisce gli scraper di contenuti.
Nota: l'aggiunta di codice ai file del sito Web può essere pericolosa. Anche un piccolo errore può causare gravi errori sul tuo sito. Ecco perché consigliamo questo metodo solo agli utenti esperti.
Puoi trovare l'indirizzo IP dello scraper visitando "Raw Access Logs" nella dashboard cPanel del tuo account di hosting WordPress. Devi cercare gli indirizzi IP con un numero insolitamente elevato di richieste e tenerne traccia, ad esempio copiandoli in un file di testo separato.
Suggerimento: devi assicurarti di non impedire a te stesso, agli utenti legittimi o ai motori di ricerca di accedere al tuo sito web. Copia un indirizzo IP dall'aspetto sospetto e utilizza gli strumenti di ricerca IP online per saperne di più.
Una volta che sei sicuro che l'indirizzo IP appartenga a uno scraper, puoi bloccarlo utilizzando lo strumento "IP Blocker" di cPanel o aggiungendo un codice come questo nel tuo file .htaccess di root:
Deny from 123.456.789
Assicurati di sostituire l'indirizzo IP nel codice con quello che desideri bloccare. Puoi bloccare più indirizzi IP inserendoli sulla stessa riga separati da spazi.
Per istruzioni dettagliate, consulta la nostra guida su come bloccare gli indirizzi IP in WordPress.
Invece di bloccare semplicemente gli scraper, Jeff suggerisce di inviare loro feed RSS fittizi. Potresti creare feed pieni di Lorem Ipsum e immagini fastidiose, o persino rimandarli direttamente al loro sito Web, causando un loop infinito e bloccando il loro server.
Per reindirizzarli a un feed fittizio, dovrai aggiungere un codice come questo al tuo file .htaccess:
RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]
5. Prevenire il furto di immagini in WordPress
Non è solo il tuo contenuto scritto che devi proteggere. Dovresti anche prevenire il furto di immagini in WordPress.
Come il testo, non c'è modo di impedire completamente alle persone di rubare le tue immagini, ma ci sono molti modi per scoraggiare il furto di immagini su un sito Web WordPress.
Ad esempio, puoi disabilitare l'hotlinking delle tue immagini WordPress. Ciò significa che se qualcuno esegue lo scraping dei tuoi contenuti, le loro immagini non verranno caricate sul loro sito.
Ridurrà anche il carico del server e l'utilizzo della larghezza di banda, aumentando la velocità e le prestazioni di WordPress.
In alternativa, puoi aggiungere una filigrana alle tue immagini che ti dia credito. Ciò chiarirà che il raschietto ha rubato i tuoi contenuti.
Puoi imparare queste due tecniche e altri modi per proteggere le tue immagini nella nostra guida su 4 modi per prevenire il furto di immagini in WordPress.
6. Scoraggia la copia manuale dei tuoi contenuti
Sebbene la maggior parte degli scraper utilizzi strumenti automatici, alcuni ladri di contenuti potrebbero tentare di copiare manualmente tutto o parte del tuo contenuto.
Un modo per renderlo più difficile è impedire loro di copiare e incollare il tuo testo. Puoi farlo rendendo più difficile per loro selezionare il testo sul tuo sito web.
Per sapere come interrompere la copia manuale dei tuoi contenuti, consulta la nostra guida dettagliata su come impedire la selezione del testo e il copia/incolla in WordPress.
Tuttavia, questo non proteggerà completamente i tuoi contenuti. Ricorda, gli utenti esperti di tecnologia possono comunque visualizzare il codice sorgente o utilizzare lo strumento Ispeziona per copiare tutto ciò che desiderano. Inoltre, questo metodo non funzionerà con tutti i browser web.
Inoltre, tieni presente che non tutti coloro che copiano il tuo testo saranno un ladro di contenuti. Ad esempio, alcune persone potrebbero voler copiare il titolo per condividere il tuo post sui social media.
Ecco perché ti consigliamo di utilizzare questo metodo solo se ritieni che sia veramente necessario per il tuo sito.
7. Approfitta dei Content Scraper
Man mano che il tuo blog diventa più grande, è quasi impossibile fermare o tenere traccia di tutti gli scraper di contenuti. Inviamo ancora reclami DMCA. Tuttavia, sappiamo che ci sono tantissimi altri siti che stanno rubando i nostri contenuti con cui non riusciamo proprio a tenere il passo.
Invece, il nostro approccio è cercare di trarre vantaggio dagli scaper di contenuti. Non è così male quando vedi che stai facendo soldi con i tuoi contenuti rubati o ricevi molto traffico dal sito web di uno scraper.
Rendi il collegamento interno un'abitudine per ottenere traffico e backlink dagli scraper
Nella nostra guida definitiva sulla SEO, ti consigliamo di fare dei collegamenti interni un'abitudine. Inserendo collegamenti ad altri tuoi contenuti nei post del tuo blog, puoi aumentare le visualizzazioni di pagina e ridurre la frequenza di rimbalzo sul tuo sito.
Ma c'è un secondo vantaggio quando si tratta di raschiare. I collegamenti interni ti forniranno preziosi backlink dalle persone che stanno rubando i tuoi contenuti. I motori di ricerca come Google utilizzano i backlink come segnale di ranking, quindi i backlink aggiuntivi sono utili per il tuo SEO.
Infine, questi collegamenti interni ti consentono di rubare il pubblico dello scraper. I blogger di talento inseriscono collegamenti su parole chiave interessanti, rendendo allettante per gli utenti fare clic. Anche i visitatori del sito Web dello scraper faranno clic sui collegamenti, che li ricondurranno direttamente al tuo sito Web.
Collega automaticamente le parole chiave con i link di affiliazione per guadagnare con gli scraper
Se guadagni sul tuo sito web dal marketing di affiliazione, ti consigliamo di abilitare il collegamento automatico nei tuoi feed RSS. Questo ti aiuterà a massimizzare i tuoi guadagni dai lettori che leggono solo il tuo sito web tramite i lettori RSS.
Ancora meglio, ti aiuterà a guadagnare dai siti che stanno rubando i tuoi contenuti.
Usa semplicemente un plug-in come ThirstyAffiliates che sostituirà automaticamente le parole chiave assegnate con link di affiliazione. Ti mostriamo come nella nostra guida su come collegare automaticamente le parole chiave con i link di affiliazione in WordPress.
Promuovi il tuo sito web nel piè di pagina RSS
Puoi utilizzare il plug-in All in One SEO per aggiungere elementi personalizzati al tuo footer RSS. Ad esempio, puoi aggiungere un banner che promuove i tuoi prodotti, servizi o contenuti.
La parte migliore è che quei banner appariranno anche sul sito Web del raschietto.
Nel nostro caso, aggiungiamo sempre un piccolo disclaimer in fondo ai post nei nostri feed RSS. In questo modo, otteniamo un backlink all'articolo originale dal sito dello scraper.
Ciò consente a Google e ad altri motori di ricerca di sapere che siamo l'autorità. Consente inoltre ai propri utenti di sapere che il sito sta rubando i nostri contenuti.
Per ulteriori suggerimenti, consulta la nostra guida su come controllare il piè di pagina del tuo feed RSS in WordPress.
Speriamo che questo tutorial ti abbia aiutato a imparare come prevenire lo scraping dei contenuti del blog in WordPress. Potresti anche voler consultare la nostra guida definitiva alla sicurezza di WordPress o dare un'occhiata al nostro elenco delle migliori soluzioni di analisi per WordPress.
Se ti è piaciuto questo articolo, iscriviti al nostro canale YouTube per i video tutorial di WordPress. Puoi trovarci anche su Twitter e Facebook.