如何阻止內容抓取工具竊取您的帖子
已發表: 2022-10-05作為網站所有者或營銷團隊,當內容抓取工具竊取您投入時間和金錢的工作並用作他們自己的工作時,這令人憤怒。 通常,他們就是這樣做的——他們在未經您許可的情況下獲取您的內容,然後將其用作自己的內容,從中賺錢。
如果您正面臨另一個被不法競爭對手刮掉的博客,那麼了解正在發生的事情以及如何防止它是至關重要的。
什麼是內容抓取工具?
內容抓取是從各種來源和網站獲取內容(例如博客文章)然後在另一個網站上重新發布的過程。 通常,這可以通過使用您博客的 RSS 提要的自動抓取工具輕鬆完成。
事實上,內容抓取很容易做到。 竊賊需要做的就是建立自己的 WordPress 網站並將內容加載到其中。 有些插件會為他們抓取內容,因此他們甚至不必復制和粘貼您的工作。 如果您已經與內容作家進行了幾輪編輯,努力開發正確的反向鏈接,並且為完成的作品感到自豪,那將是非常令人沮喪的。
為什麼內容抓取工具會竊取我的內容?
他們為什麼首先想要您的內容? 不幸的是,人們竊取此類內容的原因有很多,這就是它經常發生的原因。 大多數情況下,您的內容被抓取的最大原因是它的質量很好。 它正在按照它希望其內容執行的方式執行,而不是做艱苦的工作,它只是使用內容抓取機器人來為它完成工作。
發生這種內容抓取的常見原因有幾個。
1. 做會員佣金
聯屬網絡營銷——通過指定鏈接購買產品的任何人都需要付費——是發生內容抓取的最常見原因之一。 聯盟營銷人員將使用您的內容,更改其中的鏈接以包含他們的鏈接,然後等待人們來到該網站以通過它賺錢。 內容通過搜索引擎優化 (SEO) 讓人們訪問他們的網站。
大多數時候,這些類型的內容都是針對正在銷售產品的利基市場,或者是對產品的補充。 如果您使用您的內容來銷售這樣的產品,那麼您的博客很有可能成為那些不太理想的內容抓取工具的目標。
2. 拿走你的廣告收入
一些網站內容抓取工具正在使用您網站上的內容來幫助增加他們從自己的網站獲得的廣告收入。 他們沒有要銷售的特定產品,但他們正在使用您的內容來產生廣告收入。
了解這是否是他們的目標的最佳方法是查看該網站。 它充滿了廣告嗎? 甚至試圖設法查看可能會讓人不知所措——因為它是專門為廣告收入而構建的。
3. 他們想要潛在客戶
您為什麼要為您的網站創建內容? 這通常是為了產生潛在客戶。 如果它對你有用,或者內容抓取工具認為它對你有用,那麼他們很可能會對你的內容做同樣的事情。 信不信由你,這對於專業人士來說是很常見的事情,例如鎮上的房地產經紀人,不幸的是,我們甚至看到律師也這樣做。
大多數時候,這些使用其他網站內容的人這樣做是因為他們沒有時間、金錢或專業知識來創建自己的內容,但他們想要擁有一個強大的網站所帶來的所有好處,尤其是他們看起來像一個行業領導者。
現在要全面披露,這並不總是背後的律師或其他專業人士。 有時,會涉及第三方對內容的實際抓取,然後將其打包出售給這些專業人士,以便在他們的網站上使用。 他們可能會為這項服務支付高額費用,費用可能遠低於您為自己編寫和開發該內容所支付的費用。
其他類型的常見轉義內容
每個博客文章和內容都可以被抓取。 但是,大多數情況下,內容抓取工具會針對可以為他們做某事的內容,例如:
- 思想領袖作品
- 關於產品或服務的博客
- 產品評論(特別是如果它們是具有高質量分析的深入評論。
- 技術研究文章和出版物
- 專欄文章
- 新聞文章
- 產品說明
- 金融研究內容
最常見的是,內容抓取是因為您的材料質量很好。 您的 SEO 內容營銷正在為您創建它的目的而工作。 而且,到目前為止,這比嘗試編寫自己的內容更容易。 如果您必須花錢開發有助於排名的優質 SEO 內容,那麼該內容對這些第三方用戶來說很有價值。
如何捕捉內容抓取工具
也許您偶然發現了這篇文章,但您不太確定內容抓取是否正在發生。 你怎麼知道的? 追踪起來並不容易,而且可能需要一些時間,但如果您真的想找出誰在使用您的內容,您可以採取一些措施來獲取該信息。
從谷歌開始
大多數情況下,如果時間足夠長,谷歌會像抓取所有內容一樣抓取他們的網站。 如果您有創意、獨一無二的內容,尤其是您的內容上的新標題,那麼 Google 很可能是您獲取有關內容抓取工具信息的最佳方式。 只需將您的內容標題粘貼到 Google 中,然後查看顯示的內容。
如果您的主題很常見,或者您的標題已被許多其他博主使用,那麼這種方法並沒有太大幫助。 您不太可能從該來源獲得太多信息。
阿雷夫斯
如果作為 SEO 營銷的一部分,您正在使用反向鏈接和 Ahrefs 等工具,您可以使用它來幫助您找出鏈接的位置。 找出內容正在發生的事情有點落後。 但是,它也是監控正在發生的事情的一種超級簡單的方法。
如果您使用數字營銷公司或網站設計師來處理您的內容,請詢問他們是否使用 Ahrefs 或類似工具。 他們可能會為您提取此信息。
引用
查找內容抓取工具的第三種選擇是使用引用。 您在博客文章中使用鏈接嗎? 大多數情況下,您是因為它非常適合在線營銷。 如果您注意到引用,則意味著其他人從您的網站上抓取了內容。
要查找此信息,請訪問 Akismet。 這是一個非常常見的工具。 但是,您需要查看您的垃圾郵件文件夾,看看您是否收到任何此類引用。
總體而言,在其他人的網站上查找內容具有挑戰性。 對於那些真正對此感興趣的人,您必須仔細查看您的每篇博客文章和您的網站內容,才能找到它。 這很耗時,而且通常只會增加你的挫敗感。
如何處理內容抓取工具
怎麼辦? 當您得知其他人在他們的網站上使用您的內容時,您應該怎麼做? 你什麼也做不了。 這是一個常見且簡單的選擇,因為做一些關於內容抓取的事情需要大量的時間和最經常的工作。
如果您的網站具有權限,並且 Google 認為它是這樣的,那麼從網站上抓取的內容不會對您造成傷害。 谷歌相信你的洞察力,你的內容將比那些抓取你內容的低權限網站排名更高。 問題是您的網站可能還沒有達到那種尊重水平,如果 Google 認為不道德網站上的內容是原創的,它可能會懲罰您的網站。
把它拿下來
您可以將數字千年版權法案 (DMCA) 發送給網站的主機。 這是一種告訴網站刪除您的內容的文檔。 如果網站上有聯繫地址,請執行此操作。 那些專業的律師和房地產經紀人是一個很好的起點。 如果對方足夠關心採取行動,這樣的 DMCA 投訴可能會很有效。 您可以將其提升到一個新的水平,這是合法的途徑,但這也很昂貴。
如何利用內容抓取工具
對於內容抓取工具,您擁有的一種選擇是實際利用他們對您所做的事情。
當您的鏈接在爬蟲的網站上時,這會創建一個指向您網站的反向鏈接,這對您的 SEO 有好處,只要他們的網站不被 Google 視為垃圾郵件。 當然,您需要創建對放置在理想關鍵字上有意義的鏈接。 放置後,這些鏈接會將人們帶回您的網站。
您還可以創建一個 RSS 頁腳,這可以通過您的 WordPress 插件完成,例如 All in One SEO。 添加任何你想要的東西,比如用橫幅宣傳你的產品。 當內容抓取器抓取您的內容時,它會隨之而來,將您的廣告放置在互聯網的其他頁面上。
如何減少和防止 WordPress 內容抓取
讓我們回到開頭。 與其努力解決問題,不如首先考慮如何降低風險。
RSS 提要摘要
採取的一個步驟是不要將您的完整文章包含在您的 RSS 提要中。 相反,只使用摘要。 這可以防止使用您的 RSS 提要的內容抓取工具獲取您的內容。
禁用引用
更改您發布的所有新帖子以不允許引用。 當您擁有它們時,這會鼓勵爬蟲竊取您的內容,因為這意味著它們會在您的網站上獲得鏈接(請記住此類反向鏈接的價值)。 如果您禁用引用和 ping(您可以在 WordPress 平台上的所有帖子上執行此操作),它將減輕部分風險。
速率限制
這種方法也有助於防止內容抓取。 事實是,爬蟲可以一次提取數百個頁面,但是當您設置此限制時,您可以發現這些試圖竊取您的內容的機器人。 尋找像 Cloudflare 這樣可以幫助您將這種風險降到最低的防火牆。
了解並應用這些步驟來對抗內容抓取工具非常重要。 同時,不要太擔心它。 由於谷歌的最新更新(谷歌的有用內容更新),搜索引擎將降級抓取內容的網站。 谷歌和其他搜索引擎一直在尋求提高搜索者的滿意度,它對提升有用內容的新關注在這個過程中發揮了重要作用。
包起來
毫無疑問,有一種方法可以最大限度地減少內容抓取似乎是當務之急。 我們建議專注於幾件事。 首先,繼續製作精彩的內容,以便 Google 對您的網站進行排名。 其次,在可能的情況下採取一些步驟來幫助消除內容抓取。 您可以在這裡進行預防,這是值得的。 始終在您的內容中包含鏈接,因為如果您的內容被抓取,它將幫助您進行排名。
最重要的是,確保您的網站旨在繼續滿足讀者的期望。 谷歌不太關心這種類型的抓取,而不是你的讀者獲得的內容的質量。 確保您的網站以最佳狀態運行。
下載 Kadence 主題和 Kadence 塊以構建有效的網站
如果您喜歡用精美的設計創建引人入勝的內容,Kadence Blocks 提供了在原生 WordPress 編輯器中發揮創意的工具。 此外,享受大量可輕鬆包含在您的網站中的預構建內容,包括一個塊的線框庫,以幫助您開始您的下一個網頁設計。 非常適合靈感和快速發展!
每週,iThemes 團隊都會發布新的 WordPress 教程和資源,包括每週 WordPress 漏洞報告。 自 2008 年以來,iThemes 一直致力於幫助您為自己或客戶構建、維護和保護 WordPress 網站。 我們的任務? 讓人們的生活變得美好。