Przewodnik dla początkujących dotyczący zapobiegania skrobaniu treści blogów w WordPress

Opublikowany: 2023-03-09

Szukasz sposobu na powstrzymanie spamerów i oszustów przed kradzieżą postów na blogu WordPress za pomocą skrobaków treści?

Jako właściciel witryny bardzo frustrujące jest obserwowanie, jak ktoś kradnie Twoje treści bez pozwolenia, zarabia na nich, wyprzedza Cię w Google i kradnie Twoją publiczność.

W tym artykule omówimy, czym jest skrobanie treści blogów, jak można ograniczyć i zapobiegać skrobaniu treści, a nawet jak wykorzystać skrobaki treści dla własnych korzyści.

Beginner's Guide to Preventing Blog Content Scraping in WordPress

Co to jest skrobanie zawartości bloga w WordPress?

Skrobanie zawartości bloga ma miejsce, gdy treść jest pobierana z wielu źródeł i ponownie publikowana w innej witrynie. Zwykle odbywa się to automatycznie za pośrednictwem kanału RSS Twojego bloga.

Niestety bardzo łatwo i bardzo często dochodzi do kradzieży treści bloga WordPress w ten sposób. Jeśli ci się to przydarzyło, rozumiesz, jak stresujące i frustrujące może to być.

Czasami Twoje treści zostaną po prostu skopiowane i wklejone bezpośrednio do innej witryny, w tym formatowanie, obrazy, filmy i inne.

Innym razem Twoje treści zostaną ponownie opublikowane z podaniem źródła i linkiem do Twojej witryny, ale bez Twojej zgody. Chociaż może to pomóc w SEO, możesz chcieć zachować oryginalne treści hostowane tylko w swojej witrynie.

Dlaczego skrobaki treści kradną treści?

Niektórzy z naszych użytkowników pytali nas, dlaczego skrobaki kradną zawartość. Zwykle główną motywacją do kradzieży treści jest czerpanie korzyści z własnej ciężkiej pracy:

  • Prowizja partnerska: nieuczciwi marketingowcy stowarzyszeni mogą wykorzystywać Twoje treści do przyciągania ruchu do swojej witryny za pośrednictwem wyszukiwarek w celu promowania swoich niszowych produktów.
  • Generowanie leadów: prawnicy i pośrednicy w handlu nieruchomościami mogą płacić komuś za dodawanie treści i zdobywanie autorytetu w ich społeczności, nie zdając sobie sprawy, że są one pozyskiwane z innych źródeł.
  • Przychody z reklam: Właściciele blogów mogą zbierać treści, aby stworzyć centrum wiedzy w określonej niszy „dla dobra społeczności”, a następnie zaklejać witrynę reklamami.

Czy można całkowicie zapobiec skrobaniu treści?

W tym artykule pokażemy Ci kilka kroków, które możesz podjąć, aby ograniczyć i zapobiec skrobaniu treści. Ale niestety nie ma sposobu, aby całkowicie powstrzymać zdeterminowanego złodzieja.

Dlatego kończymy ten artykuł sekcją o tym, jak możesz skorzystać ze skrobaków treści. Chociaż nie zawsze możesz powstrzymać złodzieja, możesz zyskać trochę ruchu i przychodów dzięki zawartości, którą ci ukradli.

Co powinieneś zrobić, gdy odkryjesz, że ktoś zeskrobał Twoje treści?

Ponieważ nie jest możliwe całkowite zatrzymanie scraperów, pewnego dnia możesz odkryć, że ktoś używa treści, które ukradł z Twojego bloga. Możesz się zastanawiać, co zrobić, gdy tak się stanie.

Oto kilka podejść, które ludzie stosują w kontaktach ze skrobakami treści:

  • Nic nie rób: Możesz spędzić dużo czasu walcząc ze skrobakami, więc niektórzy popularni blogerzy decydują się na nic nie robienie. Google już postrzega dobrze znane witryny jako autorytety, ale nie dotyczy to mniejszych witryn. Więc to podejście nie zawsze jest naszym zdaniem najlepsze.
  • Usuń: Tutaj kontaktujesz się ze skrobakiem i prosisz go o usunięcie treści. Jeśli odmówią, prześlij żądanie usunięcia. Możesz dowiedzieć się, jak to zrobić w naszym przewodniku, jak łatwo znaleźć i usunąć skradzione treści w WordPress.
  • Skorzystaj: chociaż aktywnie pracujemy nad usuwaniem treści zeskrobanych z WPBeginner, używamy również kilku technik, aby uzyskać ruch i zarabiać na skrobakach. Możesz dowiedzieć się, jak to zrobić, w sekcji „Skorzystaj ze skrobaków treści” poniżej.

Mając to na uwadze, przyjrzyjmy się, jak zapobiegać skrobaniu blogów w WordPress. Ponieważ jest to obszerny przewodnik, dołączyliśmy spis treści, aby ułatwić nawigację.

  1. Prawa autorskie lub znak towarowy Nazwa i logo Twojego bloga
  2. Spraw, aby Twój kanał RSS był trudniejszy do zeskrobania
  3. Wyłącz Trackbacki i Pingbacki
  4. Zablokuj dostęp Scrapera do Twojej witryny WordPress
  5. Zapobiegaj kradzieży obrazu w WordPress
  6. Zniechęcaj do ręcznego kopiowania swoich treści
  7. Skorzystaj ze skrobaków treści

1. Prawa autorskie lub znak towarowy Nazwa i logo Twojego bloga

Prawa dotyczące znaków towarowych i praw autorskich chronią Twoje prawa własności intelektualnej, markę i biznes przed wieloma wyzwaniami prawnymi. Obejmuje to nielegalne wykorzystanie materiałów chronionych prawem autorskim lub nazwy i logo Twojej marki.

Powinieneś wyraźnie umieścić informację o prawach autorskich w swojej witrynie. Chociaż Twoje treści są automatycznie objęte prawami autorskimi, wyświetlenie powiadomienia poinformuje Cię, że Twoje treści są chronione prawami autorskimi i nie mogą wykorzystywać Twoich chronionych właściwości do celów biznesowych.

Display a Copyright Notice on Your Website

Na przykład możesz dodać informację o prawach autorskich z dynamiczną datą do stopki WordPress. Dzięki temu informacja o prawach autorskich będzie aktualna.

Może to zniechęcić niektórych użytkowników do kradzieży. Pomoże to również w przypadku konieczności wysłania pisma o zaprzestaniu działalności lub złożenia skargi DCMA w celu usunięcia skradzionych treści.

Możesz również złożyć wniosek o rejestrację praw autorskich online. Ten proces może być skomplikowany, ale na szczęście istnieją tanie usługi prawne, które mogą pomóc małym firmom i osobom fizycznym.

Dowiedz się, jak to zrobić z naszego przewodnika na temat znaków towarowych i praw autorskich do nazwy i logo bloga.

2. Spraw, aby Twój kanał RSS był trudniejszy do zeskrobania

Ponieważ pobieranie zawartości bloga odbywa się zwykle automatycznie za pośrednictwem kanału RSS Twojego bloga, przyjrzyjmy się kilku pomocnym zmianom, które możesz wprowadzić w swoim kanale.

Nie dołączaj pełnej treści posta do swojego kanału RSS WordPress

Możesz dołączyć tylko podsumowanie każdego posta w swoim kanale RSS zamiast pełnej treści. Obejmuje to fragment, a także metadane postu, takie jak data, autor i kategoria.

Z pewnością w społeczności blogerów toczy się debata na temat tego, czy mieć pełne kanały RSS, czy kanały podsumowujące. Nie będziemy się teraz w to zagłębiać, chyba że powiemy, że jedną z zalet posiadania samego podsumowania jest to, że pomaga zapobiegać skrobaniu treści.

Możesz zmienić ustawienia, przechodząc do Ustawienia » Czytanie w panelu administracyjnym WordPress. Musisz wybrać opcję „Wyciąg”, a następnie kliknąć przycisk „Zapisz zmiany”.

RSS Feeds Can Contain Full Text or an Excerpt of Each Post

Teraz kanał RSS pokaże tylko fragment Twojego artykułu. Jeśli ktoś kradnie Twoje treści za pośrednictwem Twojego kanału RSS, otrzyma tylko podsumowanie, a nie pełny post.

Jeśli chcesz dostosować podsumowanie, możesz zapoznać się z naszym przewodnikiem na temat dostosowywania fragmentów WordPress.

Zoptymalizuj swój kanał RSS, aby zapobiec skrobaniu

Są inne sposoby zoptymalizuj swój kanał RSS WordPress, aby chronić swoje treści, uzyskać więcej linków zwrotnych, zwiększyć ruch w sieci i nie tylko. Jednym z najlepszych sposobów jest opóźniaj pojawianie się postów w kanale RSS.

Zaletą jest to, że opóźniając pojawianie się postów w kanale RSS, dajesz wyszukiwarkom czas na przeszukanie i zindeksowanie treści, zanim pojawi się ona gdzie indziej, na przykład na stronach skrobaków. Wyszukiwarki będą wtedy postrzegać Twoją witrynę jako autorytet.

Najbezpieczniejszym i najłatwiejszym sposobem na to jest użycie WPCode, ponieważ ma przepis, który automatycznie dodaje poprawny niestandardowy kod do WordPress.

Add a snippet using WPCode

Aby uzyskać szczegółowe instrukcje, zapoznaj się z naszym przewodnikiem dotyczącym opóźniania pojawiania się postów w kanale RSS WordPress.

3. Wyłącz Trackbacki, Pingbacki i REST API

Na początku blogowania wprowadzono trackbacki i pingbacki jako sposób wzajemnego powiadamiania się blogów o linkach. Gdy ktoś zamieści link do posta na Twoim blogu, jego witryna automatycznie wyśle ​​sygnał ping do Twojego.

Ten pingback pojawi się następnie w kolejce moderacji komentarzy na Twoim blogu wraz z linkiem do ich witryny. Jeśli to zatwierdzisz, otrzymają link zwrotny i wzmiankę z Twojej witryny.

Daje to spamerowi zachętę do zeskrobywania Twojej witryny i wysyłania trackbacków. Na szczęście możesz wyłączyć trackbacki i pingbacki, aby dać scraperom jeden powód mniej do kradzieży treści.

Disabling Trackbacks and Pingbacks in WordPress

Aby uzyskać więcej informacji, zapoznaj się z naszym przewodnikiem dotyczącym wyłączania trackbacków we wszystkich przyszłych postach. Możesz także chcieć dowiedzieć się, jak wyłączyć trackbacki i pingi w istniejących postach WordPress.

Wyłącz API REST WordPress

Oprócz trackbacków i pingbacków zalecamy również wyłączenie WordPress REST API, ponieważ może to ułatwić spamerom pobieranie treści.

Mamy szczegółowy przewodnik na temat wyłączania interfejsu API REST WordPress.

Wszystko, co musisz zrobić, to zainstalować i aktywować bezpłatną wtyczkę WPCode i użyć jej gotowego fragmentu kodu do wyłączenia interfejsu API REST.

4. Zablokuj dostęp Scrapera do Twojej witryny WordPress

Jednym ze sposobów powstrzymania skrobaków przed kradzieżą treści jest odebranie im dostępu do Twojej witryny. Możesz to zrobić ręcznie, blokując ich adres IP, ale większości użytkowników łatwiej będzie użyć wtyczki zabezpieczającej, takiej jak zapora sieciowa aplikacji.

Zablokuj Scraper za pomocą wtyczki zabezpieczającej (zalecane)

Ręczne blokowanie zgarniaczy jest trudne i wymaga dużo pracy. Zwłaszcza, że ​​wiele prób włamań i ataków odbywa się z wykorzystaniem szerokiej gamy losowych adresów IP z całego świata. Nadążanie za tymi wszystkimi losowymi adresami IP jest prawie niemożliwe.

Dlatego potrzebujesz zapory aplikacji sieci Web (WAF), takiej jak WordFence lub Securi. Działają one jak tarcza między Twoją witryną a całym ruchem przychodzącym, monitorując ruch w witrynie i blokując typowe zagrożenia bezpieczeństwa, zanim dotrą one do Twojej witryny WordPress.

Na stronie WPBeginner używamy Sucuri. Jest to usługa bezpieczeństwa witryny, która chroni Twoją witrynę przed takimi atakami za pomocą zapory aplikacji witryny.

Zasadniczo cały ruch w Twojej witrynie przechodzi przez serwery usługi bezpieczeństwa, gdzie jest sprawdzany pod kątem podejrzanej aktywności. Automatycznie blokują dostęp do Twojej witryny z podejrzanych adresów IP. Zobacz, jak Sucuri pomógł nam zablokować 450 000 ataków WordPress w ciągu 3 miesięcy.

Ręcznie zablokuj lub przekieruj adres IP skrobaka

Zaawansowani użytkownicy mogą również chcieć ręcznie zablokować adres IP skrobaka. Jest to więcej pracy, ale możesz konkretnie kierować adres skrobaka, gdy się go nauczysz. Deweloper internetowy Jeff Star sugeruje to podejście, gdy pisze o tym, jak radzi sobie ze skrobakami treści.

Uwaga: Dodawanie kodu do plików witryny może być niebezpieczne. Nawet mały błąd może spowodować poważne błędy w Twojej witrynie. Dlatego zalecamy tę metodę tylko zaawansowanym użytkownikom.

Możesz znaleźć adres IP skrobaka, odwiedzając „Raw Access Logs” w desce rozdzielczej cPanel swojego konta hostingowego WordPress. Musisz szukać adresów IP z niezwykle dużą liczbą żądań i rejestrować je, na przykład kopiując je do osobnego pliku tekstowego.

Blocking the Scraper's IP Address

Wskazówka: musisz upewnić się, że nie zablokujesz sobie, uprawnionym użytkownikom ani wyszukiwarkom dostępu do Twojej witryny. Skopiuj podejrzanie wyglądający adres IP i użyj internetowych narzędzi do wyszukiwania adresów IP, aby dowiedzieć się więcej na jego temat.

Gdy masz pewność, że adres IP należy do scrapera, możesz go zablokować za pomocą narzędzia cPanel „IP Blocker” lub dodając taki kod do głównego pliku .htaccess:

Deny from 123.456.789

Upewnij się, że zamieniłeś adres IP w kodzie na ten, który chcesz zablokować. Możesz zablokować wiele adresów IP, wprowadzając je w tym samym wierszu, oddzielone spacjami.

Aby uzyskać szczegółowe instrukcje, zobacz nasz przewodnik dotyczący blokowania adresów IP w WordPress.

Zamiast po prostu blokować skrobaki, Jeff sugeruje, że możesz zamiast tego wysyłać im fikcyjne kanały RSS. Możesz tworzyć kanały pełne Lorem Ipsum i irytujących obrazów, a nawet wysyłać je z powrotem na ich własną stronę internetową, powodując nieskończoną pętlę i awarię ich serwera.

Aby przekierować ich do fałszywego kanału, musisz dodać taki kod do pliku .htaccess:

RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]

5. Zapobiegaj kradzieży obrazu w WordPress

Należy chronić nie tylko treść pisemną. Powinieneś także zapobiegać kradzieży obrazu w WordPress.

Podobnie jak tekst, nie ma sposobu, aby całkowicie powstrzymać ludzi przed kradzieżą twoich zdjęć, ale istnieje wiele sposobów, aby zniechęcić do kradzieży obrazów w witrynie WordPress.

Na przykład możesz wyłączyć hotlinkowanie swoich obrazów WordPress. Oznacza to, że jeśli ktoś zeskrobuje Twoje treści, jego obrazy nie zostaną załadowane na jego stronie.

Zmniejszy to również obciążenie serwera i wykorzystanie przepustowości, zwiększając szybkość i wydajność WordPress.

Alternatywnie możesz dodać znak wodny do swoich zdjęć, który daje ci kredyt. Dzięki temu będzie jasne, że skrobak ukradł Twoją zawartość.

Możesz nauczyć się tych dwóch technik, a także innych sposobów ochrony swoich obrazów w naszym przewodniku na temat 4 sposobów zapobiegania kradzieży obrazów w WordPress.

6. Zniechęcaj do ręcznego kopiowania swoich treści

Podczas gdy większość scraperów korzysta z automatycznych narzędzi, niektórzy złodzieje treści mogą próbować ręcznie skopiować całość lub część treści.

Jednym ze sposobów na utrudnienie tego jest uniemożliwienie im kopiowania i wklejania tekstu. Możesz to zrobić, utrudniając im zaznaczenie tekstu w Twojej witrynie.

Aby dowiedzieć się, jak zatrzymać ręczne kopiowanie treści, zapoznaj się z naszym przewodnikiem krok po kroku, jak zapobiegać zaznaczaniu tekstu i kopiowaniu/wklejaniu w WordPress.

Nie zapewni to jednak całkowitej ochrony treści. Pamiętaj, że użytkownicy obeznani z technologią nadal mogą przeglądać kod źródłowy lub używać narzędzia Inspect do kopiowania wszystkiego, co chcą. Ponadto ta metoda nie będzie działać we wszystkich przeglądarkach internetowych.

Pamiętaj też, że nie każdy kopiujący Twój tekst będzie złodziejem treści. Na przykład niektóre osoby mogą chcieć skopiować tytuł, aby udostępnić Twój post w mediach społecznościowych.

Dlatego zalecamy korzystanie z tej metody tylko wtedy, gdy uważasz, że jest to naprawdę potrzebne w Twojej witrynie.

7. Skorzystaj ze skrobaków treści

Gdy Twój blog się rozrasta, prawie niemożliwe jest zatrzymanie lub śledzenie wszystkich skrobaków treści. Nadal wysyłamy skargi związane z ustawą DMCA. Wiemy jednak, że istnieje mnóstwo innych witryn kradnących nasze treści, za którymi po prostu nie nadążamy.

Zamiast tego, naszym podejściem jest próba skorzystania z scalerów treści. Nie jest tak źle, gdy widzisz, że zarabiasz na skradzionych treściach lub uzyskujesz duży ruch ze strony internetowej skrobaka.

Spraw, aby linkowanie wewnętrzne stało się nawykiem, aby uzyskać ruch i linki zwrotne ze skrobaków

W naszym ostatecznym przewodniku po SEO zalecamy, aby linkowanie wewnętrzne stało się nawykiem. Umieszczając linki do innych treści w swoich postach na blogu, możesz zwiększyć liczbę odsłon i zmniejszyć współczynnik odrzuceń we własnej witrynie.

Ale jest druga korzyść, jeśli chodzi o skrobanie. Linki wewnętrzne zapewnią Ci cenne linki zwrotne od osób, które kradną Twoje treści. Wyszukiwarki takie jak Google używają linków zwrotnych jako sygnału rankingowego, więc dodatkowe linki zwrotne są dobre dla Twojego SEO.

Wreszcie, te wewnętrzne linki pozwalają ukraść odbiorców skrobaka. Utalentowani blogerzy umieszczają linki na interesujących słowach kluczowych, zachęcając użytkowników do klikania. Odwiedzający witrynę skrobaka będą również klikać w linki, które kierują ich prosto z powrotem do Twojej własnej witryny.

Słowa kluczowe automatycznego linku z linkami partnerskimi do zarabiania pieniędzy na skrobakach

Jeśli zarabiasz w swojej witrynie na marketingu afiliacyjnym, zalecamy włączenie automatycznego łączenia w Twoich kanałach RSS. Pomoże Ci to zmaksymalizować zarobki od czytelników, którzy czytają Twoją witrynę tylko za pośrednictwem czytników RSS.

Co więcej, pomoże Ci zarabiać pieniądze na stronach, które kradną Twoje treści.

Po prostu użyj wtyczki, takiej jak ThirstyAffiliates, która automatycznie zastąpi przypisane słowa kluczowe linkami partnerskimi. W naszym przewodniku pokazujemy, jak automatycznie łączyć słowa kluczowe z linkami partnerskimi w WordPress.

Promuj swoją witrynę w stopce RSS

Możesz użyć wtyczki All in One SEO, aby dodać niestandardowe elementy do stopki RSS. Możesz na przykład dodać baner promujący własne produkty, usługi lub treści.

AIOSEO RSS feed footer save

Najlepsze jest to, że te banery pojawią się również na stronie skrobaka.

W naszym przypadku zawsze dodajemy małe zastrzeżenie na dole postów w naszych kanałach RSS. W ten sposób otrzymujemy link zwrotny do oryginalnego artykułu ze strony scrapera.

Dzięki temu Google i inne wyszukiwarki wiedzą, że jesteśmy autorytetem. Informuje również ich użytkowników, że witryna kradnie nasze treści.

Aby uzyskać więcej wskazówek, zapoznaj się z naszym przewodnikiem dotyczącym kontrolowania stopki kanału RSS w WordPress.

Mamy nadzieję, że ten samouczek pomógł ci dowiedzieć się, jak zapobiegać skrobaniu treści blogów w WordPress. Możesz także zapoznać się z naszym ostatecznym przewodnikiem bezpieczeństwa WordPress lub sprawdzić naszą listę najlepszych rozwiązań analitycznych dla WordPress.

Jeśli podobał Ci się ten artykuł, zasubskrybuj nasz kanał YouTube, aby uzyskać samouczki wideo WordPress. Można nas również znaleźć na Twitterze i Facebooku.