WordPress에서 블로그 콘텐츠 스크래핑 방지를 위한 초보자 가이드

게시 됨: 2023-03-09

스패머와 사기꾼이 콘텐츠 스크레이퍼를 사용하여 WordPress 블로그 게시물을 훔치지 못하도록 하는 방법을 찾고 있습니까?

누군가 허가 없이 귀하의 콘텐츠를 훔치고, 수익을 창출하고, Google에서 귀하를 능가하고, 청중을 훔치는 것을 보는 것은 웹사이트 소유자로서 매우 실망스러운 일입니다.

이 기사에서는 블로그 콘텐츠 스크래핑이 무엇인지, 콘텐츠 스크래핑을 줄이고 방지하는 방법, 심지어 자신의 이익을 위해 콘텐츠 스크레이퍼를 활용하는 방법까지 다룰 것입니다.

Beginner's Guide to Preventing Blog Content Scraping in WordPress

WordPress에서 블로그 콘텐츠 스크래핑이란 무엇입니까?

블로그 콘텐츠 스크래핑은 다양한 소스에서 콘텐츠를 가져와 다른 사이트에 다시 게시하는 경우입니다. 일반적으로 이것은 블로그의 RSS 피드를 통해 자동으로 수행됩니다.

불행히도 이런 방식으로 WordPress 블로그 콘텐츠를 도난당하는 것은 매우 쉽고 매우 일반적입니다. 당신에게 그런 일이 일어난다면, 당신은 그것이 얼마나 스트레스를 받고 좌절할 수 있는지 이해합니다.

서식, 이미지, 비디오 등을 포함하여 콘텐츠를 단순히 복사하여 다른 웹 사이트에 직접 붙여넣는 경우가 있습니다.

다른 경우에는 귀하의 콘텐츠가 귀속 및 귀하의 웹사이트로 돌아가는 링크와 함께 재게시되지만 귀하의 허락은 없습니다. 이는 SEO에 도움이 될 수 있지만 원래 콘텐츠를 사이트에서만 호스팅하는 것이 좋습니다.

콘텐츠 스크레이퍼가 콘텐츠를 훔치는 이유는 무엇입니까?

일부 사용자는 스크레이퍼가 콘텐츠를 훔치는 이유를 묻습니다. 일반적으로 콘텐츠 도용의 주요 동기는 다음과 같이 열심히 일하여 이익을 얻는 것입니다.

  • 제휴 수수료: 부정직한 제휴 마케팅 담당자는 귀하의 콘텐츠를 사용하여 틈새 제품을 홍보하기 위해 검색 엔진을 통해 사이트로 트래픽을 가져올 수 있습니다.
  • 잠재 고객 생성: 변호사와 부동산업자는 누군가에게 비용을 지불하고 콘텐츠를 추가하고 커뮤니티에서 권한을 얻을 수 있으며 다른 출처에서 콘텐츠를 긁어내고 있다는 사실을 인식하지 못합니다.
  • 광고 수익: 블로그 소유자는 '커뮤니티의 이익을 위해' 특정 틈새에 지식 허브를 만들기 위해 콘텐츠를 스크랩한 다음 사이트를 광고로 칠할 수 있습니다.

콘텐츠 스크래핑을 완전히 방지할 수 있습니까?

이 문서에서는 콘텐츠 스크래핑을 줄이고 방지하기 위해 수행할 수 있는 몇 가지 단계를 보여줍니다. 하지만 안타깝게도 단호한 도둑을 완전히 막을 방법은 없습니다.

이것이 콘텐츠 스크레이퍼를 활용하는 방법에 대한 섹션으로 이 기사를 마무리하는 이유입니다. 항상 도둑을 막을 수는 없지만 그들이 훔친 콘텐츠를 통해 약간의 트래픽과 수익을 얻을 수 있습니다.

누군가가 귀하의 콘텐츠를 스크랩한 것을 발견하면 어떻게 해야 합니까?

스크레이퍼를 완전히 중지하는 것은 불가능하므로 언젠가 누군가가 귀하의 블로그에서 훔친 콘텐츠를 사용하고 있음을 발견할 수 있습니다. 그럴 때 어떻게 해야 하는지 궁금할 것입니다.

다음은 콘텐츠 스크레이퍼를 다룰 때 사람들이 취하는 몇 가지 접근 방식입니다.

  • 아무것도 하지 않기: 스크레이퍼와 싸우는 데 많은 시간을 할애할 수 있으므로 일부 인기 블로거는 아무것도 하지 않기로 결정합니다. Google은 이미 잘 알려진 사이트를 권한으로 간주하지만 소규모 사이트에는 해당되지 않습니다. 따라서 이 접근 방식이 항상 최선은 아닙니다.
  • 테이크다운: 여기에서 스크레이퍼에게 연락하여 콘텐츠를 내려달라고 요청합니다. 거부하면 게시 중단 통지를 제출합니다. WordPress에서 도난당한 콘텐츠를 쉽게 찾고 제거하는 방법에 대한 가이드에서 방법을 배울 수 있습니다.
  • 활용: WPBeginner에서 스크랩한 콘텐츠를 제거하기 위해 적극적으로 노력하는 동안 몇 가지 기술을 사용하여 트래픽을 얻고 스크레이퍼에서 돈을 벌기도 합니다. 아래의 '콘텐츠 스크레이퍼 활용' 섹션에서 방법을 배울 수 있습니다.

그렇게 말하면 WordPress에서 블로그 스크래핑을 방지하는 방법을 살펴 보겠습니다. 이것은 포괄적인 가이드이므로 더 쉽게 탐색할 수 있도록 목차를 포함했습니다.

  1. 블로그 이름 및 로고의 저작권 또는 상표권
  2. RSS 피드를 스크랩하기 더 어렵게 만드십시오.
  3. 트랙백 및 핑백 비활성화
  4. WordPress 웹사이트에 대한 Scraper의 액세스 차단
  5. WordPress에서 이미지 도용 방지
  6. 콘텐츠 수동 복사 금지
  7. 콘텐츠 스크레이퍼 활용

1. 블로그 이름 및 로고의 저작권 또는 상표권

상표 및 저작권법은 많은 법적 문제로부터 귀하의 지적 재산권, 브랜드 및 비즈니스를 보호합니다. 여기에는 저작권이 있는 자료나 브랜드 이름 및 로고의 불법 사용이 포함됩니다.

웹사이트에 저작권 표시를 명확하게 표시해야 합니다. 귀하의 콘텐츠는 자동으로 저작권법의 적용을 받지만 알림을 표시하면 귀하의 콘텐츠가 저작권이 있으며 귀하의 보호된 자산을 비즈니스에 사용할 수 없음을 알 수 있습니다.

Display a Copyright Notice on Your Website

예를 들어 WordPress 바닥글에 동적 날짜가 있는 저작권 표시를 추가할 수 있습니다. 이렇게 하면 저작권 고지가 최신 상태로 유지됩니다.

이것은 일부 사용자가 그것을 훔치는 것을 막을 수 있습니다. 도난당한 콘텐츠를 삭제하기 위해 중단 및 중단 편지를 보내거나 DCMA 불만을 제기해야 하는 경우에도 도움이 됩니다.

온라인으로 저작권 등록을 신청할 수도 있습니다. 이 과정은 복잡할 수 있지만 다행스럽게도 소기업과 개인을 도울 수 있는 저렴한 법률 서비스가 있습니다.

블로그 이름과 로고에 상표권을 부여하고 저작권을 등록하는 방법에 대한 가이드에서 방법을 알아보세요.

2. RSS 피드를 스크랩하기 어렵게 만듭니다.

블로그 콘텐츠 스크래핑은 일반적으로 블로그의 RSS 피드를 통해 자동으로 수행되므로 피드에 적용할 수 있는 몇 가지 유용한 변경 사항을 살펴보겠습니다.

WordPress RSS 피드에 전체 게시물 콘텐츠를 포함하지 마십시오.

전체 콘텐츠 대신 RSS 피드에 각 게시물의 요약만 포함할 수 있습니다. 여기에는 날짜, 작성자 및 범주와 같은 게시물 메타데이터뿐만 아니라 발췌문도 포함됩니다.

전체 RSS 피드 또는 요약 피드를 가질 것인지에 대해 블로깅 커뮤니티에서 확실히 논쟁이 있습니다. 요약만 있는 장점 중 하나는 콘텐츠 스크래핑을 방지하는 데 도움이 된다는 점을 제외하고 지금은 다루지 않겠습니다.

WordPress 관리자 패널에서 설정 » 읽기 로 이동하여 설정을 변경할 수 있습니다. 'Excerpt' 옵션을 선택한 다음 'Save Changes' 버튼을 클릭해야 합니다.

RSS Feeds Can Contain Full Text or an Excerpt of Each Post

이제 RSS 피드에는 기사의 일부만 표시됩니다. 누군가 귀하의 RSS 피드를 통해 귀하의 콘텐츠를 훔치고 있다면 전체 게시물이 아닌 요약만 받게 됩니다.

요약을 조정하려면 WordPress 발췌문을 사용자 정의하는 방법에 대한 가이드를 참조하십시오.

스크래핑 방지를 위해 RSS 피드 최적화

당신이 할 수있는 다른 방법이 있습니다 WordPress RSS 피드를 최적화하여 콘텐츠를 보호하고 더 많은 백링크를 얻고 웹 트래픽을 늘리십시오. 가장 좋은 방법 중 하나는 게시물이 RSS 피드에 표시되는 것을 지연시킵니다.

게시물이 RSS 피드에 표시되는 것을 지연하면 스크레이퍼의 웹사이트와 같은 다른 곳에 콘텐츠가 표시되기 전에 검색 엔진이 콘텐츠를 크롤링하고 색인을 생성할 시간을 줄 수 있다는 이점이 있습니다. 검색 엔진은 귀하의 사이트를 기관으로 볼 것입니다.

이를 수행하는 가장 안전하고 쉬운 방법은 WordPress에 올바른 사용자 정의 코드를 자동으로 추가하는 레시피가 있기 때문에 WPCode를 사용하는 것입니다.

Add a snippet using WPCode

자세한 지침은 게시물이 WordPress RSS 피드에 표시되는 것을 지연시키는 방법에 대한 가이드를 참조하십시오.

3. 트랙백, 핑백 및 REST API 비활성화

블로깅 초기에는 블로그가 링크에 대해 서로에게 알리는 방법으로 트랙백과 핑백이 도입되었습니다. 누군가 귀하의 블로그 게시물에 링크를 걸면 해당 웹사이트에서 귀하의 웹사이트에 자동으로 핑을 보냅니다.

그러면 이 핑백이 웹사이트 링크와 함께 블로그의 댓글 검토 대기열에 나타납니다. 당신이 그것을 승인하면 그들은 당신의 사이트에서 백 링크와 멘션을 얻습니다.

이것은 스패머에게 귀하의 사이트를 스크랩하고 트랙백을 보낼 동기를 부여합니다. 운 좋게도 트랙백과 핑백을 비활성화하여 스크레이퍼가 콘텐츠를 훔칠 이유를 줄일 수 있습니다.

Disabling Trackbacks and Pingbacks in WordPress

자세한 내용은 향후 모든 게시물에서 트랙백 비활성화에 대한 가이드를 확인하십시오. 기존 WordPress 게시물에서 트랙백 및 핑을 비활성화하는 방법을 배우고 싶을 수도 있습니다.

WordPress REST API 비활성화

트랙백 및 핑백 외에도 스팸 발송자가 콘텐츠를 쉽게 스크랩할 수 있도록 WordPress REST API를 비활성화하는 것이 좋습니다.

WordPress REST API를 비활성화하는 방법에 대한 자세한 가이드가 있습니다.

무료 WPCode 플러그인을 설치 및 활성화하고 미리 만들어진 스니펫을 사용하여 REST API를 비활성화하기만 하면 됩니다.

4. WordPress 웹사이트에 대한 Scraper의 액세스 차단

스크레이퍼가 귀하의 콘텐츠를 훔치는 것을 막는 한 가지 방법은 귀하의 웹사이트에 대한 액세스 권한을 박탈하는 것입니다. IP 주소를 차단하여 수동으로 이를 수행할 수 있지만 대부분의 사용자는 웹 애플리케이션 방화벽과 같은 보안 플러그인을 사용하는 것이 더 쉽다는 것을 알게 될 것입니다.

보안 플러그인을 사용하여 스크레이퍼 차단(권장)

스크레이퍼를 수동으로 차단하는 것은 까다롭고 많은 작업입니다. 특히 전 세계의 광범위한 임의 IP 주소를 사용하여 많은 해킹 시도와 공격이 이루어지기 때문입니다. 모든 임의의 IP 주소를 따라잡는 것은 거의 불가능합니다.

그렇기 때문에 WordFence나 Securi와 같은 WAF(Web Application Firewall)가 필요합니다. 이들은 WordPress 사이트에 도달하기 전에 웹사이트 트래픽을 모니터링하고 일반적인 보안 위협을 차단하여 웹사이트와 들어오는 모든 트래픽 사이의 보호막 역할을 합니다.

WPBeginner 웹 사이트의 경우 Sucuri를 사용합니다. 웹사이트 애플리케이션 방화벽을 사용하여 이러한 공격으로부터 웹사이트를 보호하는 웹사이트 보안 서비스입니다.

기본적으로 모든 웹사이트 트래픽은 의심스러운 활동이 있는지 검사하는 보안 서비스 서버를 통과합니다. 의심스러운 IP 주소가 웹 사이트에 도달하지 못하도록 자동으로 차단합니다. Sucuri가 3개월 동안 450,000건의 WordPress 공격을 차단하는 데 어떻게 도움이 되었는지 알아보세요.

Scraper의 IP 주소를 수동으로 차단 또는 리디렉션

고급 사용자는 스크레이퍼의 IP 주소를 수동으로 차단할 수도 있습니다. 이것은 더 많은 작업이지만 스크레이퍼의 주소를 배우면 구체적으로 타겟팅할 수 있습니다. 웹 개발자 Jeff Star는 콘텐츠 스크레이퍼를 처리하는 방법에 대해 글을 쓸 때 이 접근 방식을 제안합니다.

참고: 웹사이트 파일에 코드를 추가하는 것은 위험할 수 있습니다. 작은 실수라도 사이트에 큰 오류를 일으킬 수 있습니다. 그렇기 때문에 고급 사용자에게만 이 방법을 권장합니다.

WordPress 호스팅 계정의 cPanel 대시보드에서 'Raw Access Logs'를 방문하여 스크레이퍼의 IP 주소를 찾을 수 있습니다. 요청 수가 비정상적으로 많은 IP 주소를 찾아 별도의 텍스트 파일에 복사하는 등의 기록을 유지해야 합니다.

Blocking the Scraper's IP Address

팁: 귀하 자신, 합법적인 사용자 또는 검색 엔진이 귀하의 웹사이트에 액세스하는 것을 막지 않도록 해야 합니다. 의심스러운 IP 주소를 복사하고 온라인 IP 조회 도구를 사용하여 이에 대해 자세히 알아보세요.

IP 주소가 스크레이퍼에 속한다고 확신하면 cPanel 'IP 차단기' 도구를 사용하거나 루트 .htaccess 파일에 다음과 같은 코드를 추가하여 차단할 수 있습니다.

Deny from 123.456.789

코드의 IP 주소를 차단하려는 IP 주소로 바꾸십시오. 여러 IP 주소를 공백으로 구분하여 같은 줄에 입력하여 차단할 수 있습니다.

자세한 지침은 WordPress에서 IP 주소를 차단하는 방법에 대한 가이드를 참조하십시오.

단순히 스크레이퍼를 차단하는 대신 Jeff는 대신 더미 RSS 피드를 보낼 수 있다고 제안합니다. Lorem Ipsum과 성가신 이미지로 가득 찬 피드를 만들거나 자신의 웹사이트로 바로 보내서 무한 루프를 일으키고 서버를 다운시킬 수 있습니다.

더미 피드로 리디렉션하려면 .htaccess 파일에 다음과 같은 코드를 추가해야 합니다.

RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]

5. WordPress에서 이미지 도용 방지

귀하가 보호해야 하는 것은 귀하의 서면 콘텐츠만이 아닙니다. WordPress에서 이미지 도용도 방지해야 합니다.

텍스트와 마찬가지로 사람들이 이미지를 훔치는 것을 완전히 막을 수 있는 방법은 없지만 WordPress 웹사이트에서 이미지 도용을 막을 수 있는 방법은 많습니다.

예를 들어 WordPress 이미지의 핫링크를 비활성화할 수 있습니다. 이는 누군가 귀하의 콘텐츠를 스크랩하면 해당 이미지가 사이트에 로드되지 않음을 의미합니다.

또한 서버 부하와 대역폭 사용량을 줄여 WordPress 속도와 성능을 향상시킵니다.

또는 출처를 밝히는 워터마크를 이미지에 추가할 수 있습니다. 이렇게 하면 스크레이퍼가 귀하의 콘텐츠를 훔쳤다는 것이 분명해집니다.

WordPress에서 이미지 도용을 방지하는 4가지 방법에 대한 가이드에서 이 두 가지 기술과 이미지를 보호하는 다른 방법을 배울 수 있습니다.

6. 콘텐츠를 수동으로 복사하지 않도록 합니다.

대부분의 스크레이퍼는 자동 도구를 사용하지만 일부 콘텐츠 도둑은 콘텐츠 전체 또는 일부를 수동으로 복사하려고 시도할 수 있습니다.

이를 더 어렵게 만드는 한 가지 방법은 텍스트를 복사하여 붙여넣는 것을 방지하는 것입니다. 사용자가 웹사이트에서 텍스트를 선택하기 어렵게 하여 이를 수행할 수 있습니다.

콘텐츠 수동 복사를 중지하는 방법을 알아보려면 WordPress에서 텍스트 선택 및 복사/붙여넣기를 방지하는 방법에 대한 단계별 가이드를 참조하세요.

그러나 이렇게 해도 콘텐츠가 완전히 보호되지는 않습니다. 기술에 정통한 사용자는 여전히 소스 코드를 보거나 검사 도구를 사용하여 원하는 것을 복사할 수 있습니다. 또한 이 방법은 모든 웹 브라우저에서 작동하지 않습니다.

또한 텍스트를 복사하는 모든 사람이 콘텐츠 도둑이 되는 것은 아닙니다. 예를 들어 어떤 사람들은 소셜 미디어에서 게시물을 공유하기 위해 제목을 복사하려고 할 수 있습니다.

그렇기 때문에 사이트에 꼭 필요하다고 생각되는 경우에만 이 방법을 사용하는 것이 좋습니다.

7. 콘텐츠 스크레이퍼 활용

블로그가 커짐에 따라 모든 콘텐츠 스크레이퍼를 중지하거나 추적하는 것은 거의 불가능합니다. 우리는 여전히 DMCA 불만 사항을 보냅니다. 그러나 우리가 따라갈 수 없는 콘텐츠를 훔치는 수많은 다른 사이트가 있다는 것을 알고 있습니다.

대신, 우리의 접근 방식은 콘텐츠 스케이퍼를 활용하는 것입니다. 훔친 콘텐츠로 돈을 벌거나 스크레이퍼 웹사이트에서 많은 트래픽을 받는 것을 보면 그리 나쁘지 않습니다.

스크레이퍼로부터 트래픽과 백링크를 얻기 위해 내부 링크를 습관으로 만드십시오.

SEO에 대한 궁극적인 가이드에서는 내부 연결을 습관화할 것을 권장합니다. 블로그 게시물에 다른 콘텐츠에 대한 링크를 배치하면 자신의 사이트에서 페이지뷰를 늘리고 이탈률을 줄일 수 있습니다.

그러나 스크래핑과 관련하여 두 번째 이점이 있습니다. 내부 링크는 귀하의 콘텐츠를 훔치는 사람들로부터 귀중한 백링크를 얻을 수 있습니다. Google과 같은 검색 엔진은 백링크를 순위 신호로 사용하므로 추가 백링크는 SEO에 좋습니다.

마지막으로 이러한 내부 링크를 통해 스크레이퍼의 청중을 훔칠 수 있습니다. 재능있는 블로거는 흥미로운 키워드에 링크를 걸어 사용자가 클릭하도록 유혹합니다. 스크레이퍼 웹사이트 방문자도 링크를 클릭하여 자신의 웹사이트로 바로 연결됩니다.

Scrapers에서 돈을 버는 제휴 링크가 있는 자동 링크 키워드

제휴 마케팅을 통해 웹사이트에서 수익을 창출하는 경우 RSS 피드에서 자동 링크를 활성화하는 것이 좋습니다. 이렇게 하면 RSS 리더를 통해서만 웹사이트를 읽는 독자로부터 수익을 극대화할 수 있습니다.

더 좋은 점은 콘텐츠를 훔치는 사이트에서 돈을 버는 데 도움이 된다는 것입니다.

할당된 키워드를 제휴 링크로 자동 대체하는 ThirstyAffiliates와 같은 플러그인을 사용하기만 하면 됩니다. WordPress의 제휴 링크와 키워드를 자동으로 연결하는 방법에 대한 가이드에서 방법을 보여줍니다.

RSS 바닥글에서 웹사이트 홍보

All in One SEO 플러그인을 사용하여 RSS 바닥글에 사용자 정의 항목을 추가할 수 있습니다. 예를 들어 자신의 제품, 서비스 또는 콘텐츠를 홍보하는 배너를 추가할 수 있습니다.

AIOSEO RSS feed footer save

가장 좋은 점은 해당 배너가 스크레이퍼 웹사이트에도 표시된다는 것입니다.

우리의 경우 RSS 피드의 게시물 하단에 항상 약간의 고지 사항을 추가합니다. 이렇게 하면 스크레이퍼 사이트에서 원본 기사로의 백링크를 얻을 수 있습니다.

이를 통해 Google 및 기타 검색 엔진은 우리가 기관임을 알 수 있습니다. 또한 사용자에게 사이트가 우리 콘텐츠를 훔치고 있음을 알립니다.

더 많은 팁을 보려면 WordPress에서 RSS 피드 바닥글을 제어하는 ​​방법에 대한 가이드를 확인하세요.

이 튜토리얼이 WordPress에서 블로그 콘텐츠 스크래핑을 방지하는 방법을 배우는 데 도움이 되었기를 바랍니다. 궁극적인 WordPress 보안 가이드를 보거나 WordPress를 위한 최고의 분석 솔루션 목록을 확인하고 싶을 수도 있습니다.

이 기사가 마음에 드셨다면 WordPress 비디오 자습서용 YouTube 채널을 구독하십시오. 트위터와 페이스북에서도 우리를 찾을 수 있습니다.