Anfängerleitfaden zum Verhindern des Scraping von Blog-Inhalten in WordPress
Veröffentlicht: 2023-03-09Suchen Sie nach einer Möglichkeit, Spammer und Betrüger davon abzuhalten, Ihre WordPress-Blog-Posts mit Content Scrapern zu stehlen?
Als Websitebesitzer ist es sehr frustrierend zu sehen, dass jemand Ihre Inhalte ohne Erlaubnis stiehlt, sie zu Geld macht, Sie in Google übertrifft und Ihr Publikum stiehlt.
In diesem Artikel behandeln wir, was Blog-Content-Scraping ist, wie Sie Content-Scraping reduzieren und verhindern können und sogar, wie Sie Content-Scraping zu Ihrem eigenen Vorteil nutzen können.
Was ist Blog-Content-Scraping in WordPress?
Beim Blog-Content-Scraping werden Inhalte aus zahlreichen Quellen entnommen und auf einer anderen Website erneut veröffentlicht. Normalerweise geschieht dies automatisch über den RSS-Feed Ihres Blogs.
Leider ist es sehr einfach und weit verbreitet, dass Ihre WordPress-Blog-Inhalte auf diese Weise gestohlen werden. Wenn es Ihnen passiert ist, dann wissen Sie, wie stressig und frustrierend es sein kann.
Manchmal werden Ihre Inhalte einfach kopiert und direkt auf einer anderen Website eingefügt, einschließlich Ihrer Formatierung, Bilder, Videos und mehr.
In anderen Fällen werden Ihre Inhalte mit Namensnennung und einem Link zurück zu Ihrer Website erneut veröffentlicht, jedoch ohne Ihre Erlaubnis. Obwohl dies Ihrer SEO helfen kann, möchten Sie vielleicht, dass Ihre ursprünglichen Inhalte nur auf Ihrer Website gehostet werden.
Warum stehlen Content Scraper Inhalte?
Einige unserer Benutzer haben uns gefragt, warum Scraper Inhalte stehlen. Normalerweise besteht die Hauptmotivation für den Diebstahl von Inhalten darin, von Ihrer harten Arbeit zu profitieren:
- Affiliate-Provision: Unehrliche Affiliate-Vermarkter können Ihre Inhalte verwenden, um über Suchmaschinen Traffic auf ihre Website zu bringen, um für ihre Nischenprodukte zu werben.
- Lead-Generierung: Anwälte und Immobilienmakler können jemanden dafür bezahlen, Inhalte hinzuzufügen und Autorität in ihrer Community zu erlangen, ohne zu bemerken, dass sie aus anderen Quellen gestrichen werden.
- Werbeeinnahmen: Blog-Eigentümer können Inhalte zusammenkratzen, um in einer bestimmten Nische „zum Wohle der Gemeinschaft“ einen Wissensknotenpunkt zu schaffen, und die Website dann mit Anzeigen überfluten.
Ist es möglich, Content Scraping vollständig zu verhindern?
In diesem Artikel zeigen wir Ihnen einige Schritte, die Sie unternehmen können, um Content Scraping zu reduzieren und zu verhindern. Aber leider gibt es keine Möglichkeit, einen entschlossenen Dieb vollständig zu stoppen.
Aus diesem Grund beenden wir diesen Artikel mit einem Abschnitt darüber, wie Sie Content Scraper nutzen können. Auch wenn Sie einen Dieb nicht immer aufhalten können, können Sie durch die von Ihnen gestohlenen Inhalte möglicherweise Traffic und Einnahmen erzielen.
Was sollten Sie tun, wenn Sie feststellen, dass jemand Ihren Inhalt geschrottet hat?
Da es nicht möglich ist, Scraper vollständig zu stoppen, könnten Sie eines Tages feststellen, dass jemand Inhalte verwendet, die er aus Ihrem Blog gestohlen hat. Sie fragen sich vielleicht, was zu tun ist, wenn das passiert.
Hier sind einige Ansätze, die Menschen im Umgang mit Content Scrapern verfolgen:
- Nichts tun: Sie können viel Zeit damit verbringen, gegen Scraper zu kämpfen, also entscheiden sich einige beliebte Blogger dafür, nichts zu tun. Google sieht bekannte Websites bereits als Autoritäten an, aber das gilt nicht für kleinere Websites. Daher ist dieser Ansatz unserer Meinung nach nicht immer der beste.
- Take Down: Hier kontaktieren Sie den Scraper und bitten ihn, den Inhalt zu entfernen. Wenn sie sich weigern, reichen Sie eine Deaktivierungsmitteilung ein. In unserem Leitfaden erfahren Sie, wie Sie gestohlene Inhalte in WordPress einfach finden und entfernen können.
- Profitieren Sie: Während wir aktiv daran arbeiten, dass Inhalte, die von WPBeginner entfernt werden, entfernt werden, verwenden wir auch einige Techniken, um Traffic zu generieren und mit Scrapern Geld zu verdienen. Wie das geht, erfahren Sie weiter unten im Abschnitt „Nutzen Sie die Vorteile von Content Scrapern“.
Lassen Sie uns einen Blick darauf werfen, wie man Blog Scraping in WordPress verhindert. Da dies ein umfassender Leitfaden ist, haben wir zur einfacheren Navigation ein Inhaltsverzeichnis eingefügt.
- Copyright oder Warenzeichen des Namens und Logos Ihres Blogs
- Erschweren Sie das Scraping Ihres RSS-Feeds
- Deaktivieren Sie Trackbacks und Pingbacks
- Blockieren Sie den Zugriff des Scrapers auf Ihre WordPress-Website
- Verhindern Sie Bilddiebstahl in WordPress
- Vermeiden Sie das manuelle Kopieren Ihrer Inhalte
- Profitieren Sie von Content Scrapern
1. Urheberrecht oder Markenzeichen für den Namen und das Logo Ihres Blogs
Marken- und Urheberrechtsgesetze schützen Ihre geistigen Eigentumsrechte, Ihre Marke und Ihr Unternehmen vor vielen rechtlichen Herausforderungen. Dies schließt die illegale Nutzung Ihres urheberrechtlich geschützten Materials oder Ihres Markennamens und -logos ein.
Sie sollten auf Ihrer Website deutlich einen Urheberrechtshinweis anbringen. Während Ihre Inhalte automatisch durch Urheberrechtsgesetze geschützt sind, werden Sie durch die Anzeige eines Hinweises darüber informiert, dass Ihre Inhalte urheberrechtlich geschützt sind und dass sie Ihr geschütztes Eigentum nicht für geschäftliche Zwecke verwenden können.
Beispielsweise können Sie Ihrer WordPress-Fußzeile einen Urheberrechtshinweis mit einem dynamischen Datum hinzufügen. Dadurch bleibt Ihr Urheberrechtshinweis auf dem neuesten Stand.
Dies kann einige Benutzer davon abhalten, es zu stehlen. Es hilft auch für den Fall, dass Sie eine Unterlassungserklärung senden oder eine DCMA-Beschwerde einreichen müssen, um Ihre gestohlenen Inhalte zu entfernen.
Sie können die Urheberrechtsregistrierung auch online beantragen. Dieser Prozess kann kompliziert sein, aber zum Glück gibt es kostengünstige Rechtsdienste, die kleinen Unternehmen und Einzelpersonen helfen können.
Erfahren Sie in unserem Leitfaden, wie Sie den Namen und das Logo Ihres Blogs schützen und urheberrechtlich schützen können.
2. Machen Sie Ihren RSS-Feed schwieriger zu kratzen
Da das Scraping von Bloginhalten normalerweise automatisch über den RSS-Feed Ihres Blogs erfolgt, sehen wir uns einige hilfreiche Änderungen an, die Sie an Ihrem Feed vornehmen können.
Fügen Sie nicht den vollständigen Beitragsinhalt in Ihren WordPress-RSS-Feed ein
Sie können anstelle des vollständigen Inhalts nur eine Zusammenfassung jedes Beitrags in Ihren RSS-Feed aufnehmen. Dazu gehören ein Auszug sowie Post-Metadaten wie Datum, Autor und Kategorie.
In der Blogging-Community wird sicherlich darüber diskutiert, ob man vollständige RSS-Feeds oder Zusammenfassungs-Feeds haben soll. Wir werden jetzt nicht darauf eingehen, außer zu sagen, dass einer der Vorteile davon, nur eine Zusammenfassung zu haben, darin besteht, dass es hilft, das Scraping von Inhalten zu verhindern.
Sie können die Einstellungen ändern, indem Sie in Ihrem WordPress-Adminbereich zu Einstellungen » Lesen gehen. Sie müssen die Option „Auszug“ auswählen und dann auf die Schaltfläche „Änderungen speichern“ klicken.
Jetzt zeigt der RSS-Feed nur einen Auszug Ihres Artikels. Wenn jemand Ihre Inhalte über Ihren RSS-Feed stiehlt, erhält er nur die Zusammenfassung, nicht den vollständigen Beitrag.
Wenn Sie die Zusammenfassung optimieren möchten, können Sie unsere Anleitung zum Anpassen von WordPress-Auszügen lesen.
Optimieren Sie Ihren RSS-Feed, um Scraping zu verhindern
Es gibt andere Möglichkeiten, wie Sie können Optimieren Sie Ihren WordPress-RSS-Feed, um Ihre Inhalte zu schützen, mehr Backlinks zu erhalten, Ihren Web-Traffic zu erhöhen und vieles mehr. Einer der besten Wege ist verzögern, dass Beiträge im RSS-Feed erscheinen.
Der Vorteil besteht darin, dass Sie, wenn Sie das Erscheinen von Beiträgen in Ihrem RSS-Feed verzögern, den Suchmaschinen Zeit geben, Ihre Inhalte zu durchsuchen und zu indizieren, bevor sie an anderer Stelle erscheinen, z. B. auf den Websites von Scrapern. Die Suchmaschinen sehen dann Ihre Website als Autorität.
Der sicherste und einfachste Weg, dies zu tun, ist die Verwendung von WPCode, da es ein Rezept enthält, das WordPress automatisch den richtigen benutzerdefinierten Code hinzufügt.
Detaillierte Anweisungen finden Sie in unserer Anleitung, wie Sie das Erscheinen von Beiträgen in Ihrem WordPress-RSS-Feed verzögern können.
3. Deaktivieren Sie Trackbacks, Pingbacks und die REST-API
In den frühen Tagen des Bloggens wurden Trackbacks und Pingbacks eingeführt, um Blogs gegenseitig über Links zu informieren. Wenn jemand auf einen Beitrag in Ihrem Blog verlinkt, sendet seine Website automatisch einen Ping an Ihre.
Dieser Pingback erscheint dann in der Kommentarmoderationswarteschlange Ihres Blogs mit einem Link zu seiner Website. Wenn Sie es genehmigen, erhalten sie einen Backlink und eine Erwähnung von Ihrer Website.
Dies gibt dem Spammer einen Anreiz, Ihre Website zu scrapen und Trackbacks zu senden. Glücklicherweise können Sie Trackbacks und Pingbacks deaktivieren, um Scrapern einen Grund weniger zu geben, Ihre Inhalte zu stehlen.
Weitere Informationen finden Sie in unserem Leitfaden zum Deaktivieren von Trackbacks für alle zukünftigen Posts. Möglicherweise möchten Sie auch erfahren, wie Sie Trackbacks und Pings für vorhandene WordPress-Posts deaktivieren.
Deaktivieren Sie die WordPress-REST-API
Abgesehen von Trackbacks und Pingbacks empfehlen wir auch, die WordPress-REST-API zu deaktivieren, da dies es Spammern erleichtern kann, Ihre Inhalte zu kratzen.
Wir haben eine detaillierte Anleitung, wie Sie die WordPress REST API deaktivieren können.
Alles, was Sie tun müssen, ist das kostenlose WPCode-Plugin zu installieren und zu aktivieren und das vorgefertigte Snippet zum Deaktivieren der REST-API zu verwenden.
4. Blockieren Sie den Zugriff des Scrapers auf Ihre WordPress-Website
Eine Möglichkeit, Scraper daran zu hindern, Ihre Inhalte zu stehlen, besteht darin, ihnen den Zugriff auf Ihre Website zu entziehen. Sie können dies manuell tun, indem Sie ihre IP-Adresse blockieren, aber die meisten Benutzer werden es einfacher finden, ein Sicherheits-Plugin wie eine Webanwendungs-Firewall zu verwenden.
Blockieren Sie den Scraper mit einem Sicherheits-Plugin (empfohlen)
Das manuelle Blockieren von Abstreifern ist knifflig und macht viel Arbeit. Zumal viele Hacking-Versuche und Angriffe mit einer Vielzahl von zufälligen IP-Adressen aus der ganzen Welt durchgeführt werden. Es ist fast unmöglich, mit all diesen zufälligen IP-Adressen Schritt zu halten.
Deshalb brauchen Sie eine Web Application Firewall (WAF) wie WordFence oder Securi. Diese fungieren als Schutzschild zwischen Ihrer Website und dem gesamten eingehenden Datenverkehr, indem sie den Datenverkehr Ihrer Website überwachen und häufige Sicherheitsbedrohungen blockieren, bevor sie Ihre WordPress-Website erreichen.
Für die WPBeginner-Website verwenden wir Sucuri. Es handelt sich um einen Website-Sicherheitsdienst, der Ihre Website mithilfe einer Website-Anwendungsfirewall vor solchen Angriffen schützt.
Grundsätzlich läuft Ihr gesamter Website-Verkehr über die Server des Sicherheitsdienstes, wo er auf verdächtige Aktivitäten untersucht wird. Sie blockieren automatisch, dass verdächtige IP-Adressen Ihre Website vollständig erreichen. Sehen Sie, wie Sucuri uns geholfen hat, 450.000 WordPress-Angriffe in 3 Monaten zu blockieren.
Blockieren oder leiten Sie die IP-Adresse des Scrapers manuell um
Fortgeschrittene Benutzer möchten möglicherweise auch die IP-Adresse eines Scrapers manuell blockieren. Dies ist mehr Arbeit, aber Sie können die Adresse des Scrapers gezielt ansprechen, sobald Sie sie gelernt haben. Webentwickler Jeff Star schlägt diesen Ansatz vor, als er darüber schrieb, wie er mit Content Scrapern umgeht.
Hinweis: Das Hinzufügen von Code zu Website-Dateien kann gefährlich sein. Selbst ein kleiner Fehler kann zu großen Fehlern auf Ihrer Website führen. Deshalb empfehlen wir diese Methode nur fortgeschrittenen Benutzern.
Sie finden die IP-Adresse des Scrapers, indem Sie „Raw Access Logs“ im cPanel-Dashboard Ihres WordPress-Hosting-Kontos aufrufen. Sie müssen nach IP-Adressen mit ungewöhnlich vielen Anfragen suchen und diese protokollieren, indem Sie sie beispielsweise in eine separate Textdatei kopieren.
Tipp: Sie müssen sicherstellen, dass Sie nicht selbst, legitime Benutzer oder Suchmaschinen daran hindern, auf Ihre Website zuzugreifen. Kopieren Sie eine verdächtig aussehende IP-Adresse und verwenden Sie Online-Tools zur IP-Suche, um mehr darüber herauszufinden.
Sobald Sie sicher sind, dass die IP-Adresse zu einem Scraper gehört, können Sie sie mit dem cPanel-Tool „IP Blocker“ blockieren oder indem Sie Code wie diesen in Ihre .htaccess-Stammdatei einfügen:
Deny from 123.456.789
Stellen Sie sicher, dass Sie die IP-Adresse im Code durch diejenige ersetzen, die Sie blockieren möchten. Sie können mehrere IP-Adressen blockieren, indem Sie sie durch Leerzeichen getrennt in derselben Zeile eingeben.
Ausführliche Anweisungen finden Sie in unserer Anleitung zum Blockieren von IP-Adressen in WordPress.
Anstatt die Scraper einfach zu blockieren, schlägt Jeff vor, dass Sie ihnen stattdessen Dummy-RSS-Feeds senden könnten. Sie könnten Feeds voller Lorem Ipsum und nerviger Bilder erstellen oder sie sogar direkt an ihre eigene Website zurücksenden, was eine Endlosschleife verursacht und ihren Server zum Absturz bringt.
Um sie zu einem Dummy-Feed umzuleiten, müssen Sie Code wie diesen zu Ihrer .htaccess-Datei hinzufügen:
RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]
5. Verhindern Sie Bilddiebstahl in WordPress
Es sind nicht nur Ihre schriftlichen Inhalte, die Sie schützen müssen. Sie sollten auch Bilderdiebstahl in WordPress verhindern.
Wie bei Text gibt es keine Möglichkeit, Menschen vollständig davon abzuhalten, Ihre Bilder zu stehlen, aber es gibt viele Möglichkeiten, Bilddiebstahl auf einer WordPress-Website zu verhindern.
Sie können beispielsweise das Hotlinking Ihrer WordPress-Bilder deaktivieren. Dies bedeutet, dass, wenn jemand Ihren Inhalt kratzt, seine Bilder nicht auf seiner Website geladen werden.
Es wird auch Ihre Serverlast und Bandbreitennutzung reduzieren und Ihre WordPress-Geschwindigkeit und -Leistung steigern.
Alternativ können Sie Ihren Bildern ein Wasserzeichen hinzufügen, das Sie anerkennt. Dadurch wird deutlich, dass der Scraper Ihren Inhalt gestohlen hat.
Sie können diese beiden Techniken sowie andere Möglichkeiten zum Schutz Ihrer Bilder in unserem Leitfaden über 4 Möglichkeiten zur Verhinderung von Bilddiebstahl in WordPress kennenlernen.
6. Vermeiden Sie das manuelle Kopieren Ihrer Inhalte
Während die meisten Scraper automatische Tools verwenden, können einige Inhaltsdiebe versuchen, alle oder einen Teil Ihrer Inhalte manuell zu kopieren.
Eine Möglichkeit, dies zu erschweren, besteht darin, sie daran zu hindern, Ihren Text zu kopieren und einzufügen. Sie können dies tun, indem Sie es ihnen erschweren, den Text auf Ihrer Website auszuwählen.
Um zu erfahren, wie Sie das manuelle Kopieren Ihrer Inhalte stoppen können, lesen Sie unsere Schritt-für-Schritt-Anleitung zum Verhindern von Textauswahl und Kopieren/Einfügen in WordPress.
Dies schützt Ihre Inhalte jedoch nicht vollständig. Denken Sie daran, dass technisch versierte Benutzer immer noch den Quellcode anzeigen oder das Inspect-Tool verwenden können, um alles zu kopieren, was sie wollen. Außerdem funktioniert diese Methode nicht mit allen Webbrowsern.
Denken Sie auch daran, dass nicht jeder, der Ihren Text kopiert, ein Inhaltsdieb sein wird. Einige Leute möchten beispielsweise den Titel kopieren, um Ihren Beitrag in sozialen Medien zu teilen.
Aus diesem Grund empfehlen wir Ihnen, diese Methode nur dann zu verwenden, wenn Sie der Meinung sind, dass sie für Ihre Website wirklich erforderlich ist.
7. Nutzen Sie Content Scraper
Wenn Ihr Blog größer wird, ist es fast unmöglich, alle Content Scraper zu stoppen oder zu verfolgen. Wir versenden immer noch DMCA-Beschwerden. Wir wissen jedoch, dass es unzählige andere Websites gibt, die unsere Inhalte stehlen, mit denen wir einfach nicht Schritt halten können.
Stattdessen versuchen wir, Content-Scaper auszunutzen. Es ist nicht so schlimm, wenn Sie sehen, dass Sie mit Ihren gestohlenen Inhalten Geld verdienen oder viel Verkehr von der Website eines Scrapers erhalten.
Machen Sie sich die interne Verlinkung zur Gewohnheit, um Traffic und Backlinks von Scrapern zu gewinnen
In unserem ultimativen SEO-Leitfaden empfehlen wir Ihnen, die interne Verlinkung zur Gewohnheit zu machen. Indem Sie in Ihren Blog-Beiträgen Links zu Ihren anderen Inhalten platzieren, können Sie die Seitenaufrufe erhöhen und die Absprungrate auf Ihrer eigenen Website reduzieren.
Aber es gibt noch einen zweiten Vorteil, wenn es ums Schaben geht. Durch interne Links erhalten Sie wertvolle Backlinks von den Personen, die Ihre Inhalte stehlen. Suchmaschinen wie Google verwenden Backlinks als Ranking-Signal, daher sind die zusätzlichen Backlinks gut für Ihre SEO.
Schließlich ermöglichen Ihnen diese internen Links, das Publikum des Scrapers zu stehlen. Talentierte Blogger platzieren Links zu interessanten Schlüsselwörtern und machen es für Benutzer verlockend, darauf zu klicken. Besucher der Website des Scrapers klicken ebenfalls auf die Links, die sie direkt zu Ihrer eigenen Website zurückführen.
Keywords automatisch mit Affiliate-Links verknüpfen, um mit Scrapern Geld zu verdienen
Wenn Sie mit Affiliate-Marketing auf Ihrer Website Geld verdienen, empfehlen wir Ihnen, die automatische Verlinkung in Ihren RSS-Feeds zu aktivieren. Dadurch maximieren Sie Ihre Einnahmen von Lesern, die Ihre Website nur über RSS-Reader lesen.
Noch besser, es wird Ihnen helfen, Geld mit den Websites zu verdienen, die Ihre Inhalte stehlen.
Verwenden Sie einfach ein Plugin wie ThirstyAffiliates, das zugewiesene Keywords automatisch durch Affiliate-Links ersetzt. Wie das geht, zeigen wir Ihnen in unserer Anleitung zum automatischen Verknüpfen von Keywords mit Affiliate-Links in WordPress.
Bewerben Sie Ihre Website in Ihrer RSS-Fußzeile
Sie können das All-in-One-SEO-Plugin verwenden, um Ihrer RSS-Fußzeile benutzerdefinierte Elemente hinzuzufügen. Sie können beispielsweise ein Banner hinzufügen, das für Ihre eigenen Produkte, Dienstleistungen oder Inhalte wirbt.
Das Beste daran ist, dass diese Banner auch auf der Website des Scrapers erscheinen.
In unserem Fall fügen wir immer einen kleinen Haftungsausschluss am Ende der Beiträge in unseren RSS-Feeds hinzu. Auf diese Weise erhalten wir einen Backlink zum Originalartikel von der Website des Scrapers.
Dadurch wissen Google und andere Suchmaschinen, dass wir die Autorität sind. Es lässt ihre Benutzer auch wissen, dass die Website unsere Inhalte stiehlt.
Weitere Tipps finden Sie in unserem Leitfaden zur Steuerung Ihrer RSS-Feed-Fußzeile in WordPress.
Wir hoffen, dass dieses Tutorial Ihnen dabei geholfen hat, das Scraping von Blog-Inhalten in WordPress zu verhindern. Vielleicht möchten Sie auch unseren ultimativen WordPress-Sicherheitsleitfaden lesen oder sich unsere Liste der besten Analyselösungen für WordPress ansehen.
Wenn Ihnen dieser Artikel gefallen hat, dann abonnieren Sie bitte unseren YouTube-Kanal für WordPress-Video-Tutorials. Sie finden uns auch auf Twitter und Facebook.