Cách ngăn chặn cào nội dung bài viết trong WordPress

Tác giả sysadmin, T.Ba 09, 2023, 04:50:36 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 2 Khách đang xem chủ đề.

Cách ngăn chặn cào nội dung bài viết trong WordPress


Bạn đang tìm cách ngăn chặn những kẻ gửi thư rác và những kẻ lừa đảo đánh cắp các bài đăng trên blog WordPress của bạn bằng cách sử dụng công cụ cào nội dung?

Với tư cách là chủ sở hữu trang web, sẽ rất bực bội khi thấy ai đó đang ăn cắp nội dung của bạn mà không được phép, kiếm tiền từ nội dung đó, nâng thứ hạng của bạn trên Google và đánh cắp khán giả của bạn.

Trong bài viết này, chúng tôi sẽ đề cập đến việc cào nội dung blog là gì, cách bạn có thể giảm thiểu và ngăn chặn việc cào nội dung và thậm chí cả cách tận dụng công cụ dọn nội dung vì lợi ích của chính bạn.

1. Cào nội dung blog trong WordPress là gì?

Cào nội dung blog là khi nội dung được lấy từ nhiều nguồn và xuất bản lại trên một trang web khác. Thông thường, điều này được thực hiện tự động thông qua nguồn cấp dữ liệu RSS của blog của bạn.

Thật không may, nội dung blog WordPress của bạn bị đánh cắp theo cách này rất dễ dàng và rất phổ biến. Nếu điều đó đã xảy ra với bạn, thì bạn sẽ hiểu nó có thể gây căng thẳng và bực bội như thế nào.

Đôi khi, nội dung của bạn sẽ chỉ được sao chép và dán trực tiếp vào một trang web khác, bao gồm định dạng, hình ảnh, video, v.v.

Những lần khác, nội dung của bạn sẽ được đăng lại với ghi công và liên kết quay lại trang web của bạn mà không có sự cho phép của bạn. Mặc dù điều này có thể giúp ích cho  SEO của bạn, nhưng bạn có thể chỉ muốn lưu trữ nội dung gốc trên trang web của mình.

2. Tại sao Trình thu thập nội dung ăn cắp nội dung?

Một số người dùng của chúng tôi đã hỏi chúng tôi tại sao những người cào lại ăn cắp nội dung. Thông thường, động cơ chính để đánh cắp nội dung là kiếm lợi từ công việc khó khăn của bạn:

  • Hoa hồng liên kết: Các nhà tiếp thị liên kết không trung thực có thể sử dụng nội dung của bạn để mang lại lưu lượng truy cập cho trang web của họ thông qua các công cụ tìm kiếm nhằm quảng cáo các sản phẩm thích hợp của họ.
  • Tạo khách hàng tiềm năng: Các luật sư và nhà môi giới có thể trả tiền cho ai đó để thêm nội dung và giành được quyền hạn trong cộng đồng của họ mà không nhận ra rằng nội dung đó đang được lấy từ các nguồn khác.
  • Doanh thu quảng cáo: Chủ sở hữu blog có thể thu thập nội dung để tạo ra một trung tâm kiến thức trong một phân khúc nhất định 'vì lợi ích của cộng đồng' và sau đó dán quảng cáo lên trang web.

3. Có thể ngăn chặn hoàn toàn việc cào nội dung không?

Trong bài viết này, chúng tôi sẽ chỉ cho bạn một số bước bạn có thể thực hiện để giảm thiểu và ngăn chặn việc cào nội dung. Nhưng thật không may, không có cách nào để ngăn chặn hoàn toàn một tên trộm kiên quyết.

Đó là lý do tại sao chúng tôi kết thúc bài viết này với một phần về cách bạn có thể tận dụng lợi thế của công cụ cào nội dung. Mặc dù không phải lúc nào bạn cũng có thể ngăn chặn kẻ trộm, nhưng bạn có thể kiếm được một số lưu lượng truy cập và doanh thu thông qua nội dung mà chúng đã đánh cắp từ bạn.

4. Bạn nên làm gì khi phát hiện ra ai đó đã lấy cắp nội dung của mình?

Vì không thể ngăn chặn hoàn toàn những người cào, nên một ngày nào đó bạn có thể phát hiện ra rằng ai đó đang sử dụng nội dung mà họ lấy cắp từ blog của bạn. Bạn có thể tự hỏi phải làm gì khi điều đó xảy ra.

Dưới đây là một số cách tiếp cận mà mọi người thực hiện khi xử lý các trình thu thập nội dung:

  • Không làm gì cả: Bạn có thể dành nhiều thời gian để chống lại những kẻ phá hoại, vì vậy một số blogger nổi tiếng quyết định không làm gì cả. Google đã coi các trang web nổi tiếng là có thẩm quyền, nhưng điều đó không đúng với các trang web nhỏ hơn. Vì vậy, cách tiếp cận này không phải lúc nào cũng là tốt nhất theo quan điểm của chúng tôi.
  • Take Down: Tại đây bạn liên hệ với người cào và yêu cầu họ gỡ nội dung xuống. Nếu họ từ chối, thì bạn gửi thông báo gỡ xuống. Bạn có thể tìm hiểu cách thực hiện trong hướng dẫn của chúng tôi về cách dễ dàng tìm và xóa nội dung bị đánh cắp trong WordPress.
  • Tận dụng lợi thế: Trong khi chúng tôi tích cực làm việc để gỡ bỏ nội dung cóp nhặt, chúng tôi cũng sử dụng một số kỹ thuật để thu hút lưu lượng truy cập và kiếm tiền từ những người thu thập dữ liệu. Bạn có thể tìm hiểu cách thực hiện trong phần 'Tận dụng lợi thế của Trình thu thập nội dung' bên dưới.

Như đã nói, chúng ta hãy xem làm thế nào để ngăn chặn việc cào blog trong WordPress.

5. Bản quyền hoặc Nhãn hiệu Tên và Logo của Blog của bạn

Luật nhãn hiệu và bản quyền bảo vệ quyền sở hữu trí tuệ, thương hiệu và doanh nghiệp của bạn trước nhiều thách thức pháp lý. Điều này bao gồm việc sử dụng bất hợp pháp tài liệu có bản quyền hoặc tên và logo thương hiệu của bạn.

Bạn nên hiển thị rõ ràng thông báo bản quyền trên trang web của mình. Mặc dù nội dung của bạn tự động được bảo vệ bởi luật bản quyền, việc hiển thị thông báo sẽ cho bạn biết rằng nội dung của bạn có bản quyền và họ không thể sử dụng các thuộc tính được bảo vệ của bạn để kinh doanh.

Ví dụ: bạn có thể thêm thông báo bản quyền có ngày động vào chân trang WordPress của mình. Điều này sẽ giữ cho thông báo bản quyền của bạn được cập nhật.

Điều này có thể ngăn cản một số người dùng ăn cắp nó. Nó cũng sẽ hữu ích trong trường hợp bạn cần gửi thư chấm dứt và hủy bỏ hoặc nộp đơn khiếu nại DCMA để gỡ bỏ nội dung bị đánh cắp của bạn.

Bạn cũng có thể đăng ký bản quyền trực tuyến. Quá trình này có thể phức tạp, nhưng may mắn thay, có những dịch vụ pháp lý chi phí thấp có thể giúp đỡ các doanh nghiệp nhỏ và cá nhân.

Tìm hiểu cách thực hiện trong hướng dẫn của chúng tôi về cách đăng ký nhãn hiệu và bản quyền cho tên và biểu trưng blog của bạn.

6. Làm cho RSS Feed của bạn khó cào hơn

Vì việc thu thập nội dung blog thường được thực hiện tự động thông qua  nguồn cấp dữ liệu RSS của blog của bạn nên chúng ta hãy xem xét một vài thay đổi hữu ích mà bạn có thể thực hiện đối với nguồn cấp dữ liệu của mình.

6.1. Không bao gồm toàn bộ nội dung bài đăng trong nguồn cấp dữ liệu RSS WordPress của bạn

Bạn có thể chỉ bao gồm một bản tóm tắt của mỗi bài đăng trong nguồn cấp dữ liệu RSS của mình thay vì toàn bộ nội dung. Điều này bao gồm một đoạn trích cũng như siêu dữ liệu bài đăng như ngày tháng, tác giả và danh mục.

Chắc chắn có cuộc tranh luận trong cộng đồng viết blog về việc nên có nguồn cấp dữ liệu RSS đầy đủ hay nguồn cấp dữ liệu tóm tắt. Bây giờ chúng ta sẽ không đi sâu vào vấn đề đó ngoại trừ việc nói rằng một trong những ưu điểm của việc chỉ có một bản tóm tắt là nó giúp ngăn chặn việc cào nội dung.

Bạn có thể thay đổi cài đặt bằng cách đi tới  Cài đặt »Đọc trong bảng quản trị WordPress của bạn. Bạn cần chọn tùy chọn 'Trích đoạn', sau đó nhấp vào nút 'Lưu thay đổi'.


Bây giờ nguồn cấp dữ liệu RSS sẽ chỉ hiển thị một đoạn trích trong bài viết của bạn. Nếu ai đó ăn cắp nội dung của bạn thông qua nguồn cấp dữ liệu RSS của bạn thì họ sẽ chỉ nhận được phần tóm tắt chứ không phải toàn bộ bài đăng.

Nếu bạn muốn điều chỉnh phần tóm tắt, thì bạn có thể xem hướng dẫn của chúng tôi về cách tùy chỉnh đoạn trích WordPress.

6.2. Tối ưu hóa nguồn cấp dữ liệu RSS của bạn để ngăn chặn việc cào

Có nhiều cách khác mà bạn có thể tối ưu hóa nguồn cấp RSS WordPress của mình để bảo vệ nội dung của mình, nhận được nhiều liên kết ngược hơn, tăng lưu lượng truy cập web của bạn, v.v. Một trong những cách tốt nhất là trì hoãn các bài đăng xuất hiện trong nguồn cấp dữ liệu RSS.

Lợi ích là khi bạn trì hoãn các bài đăng xuất hiện trong nguồn cấp dữ liệu RSS của mình, bạn sẽ cho các công cụ tìm kiếm thời gian để thu thập dữ liệu và lập chỉ mục nội dung của bạn trước khi nó xuất hiện ở nơi khác, chẳng hạn như trên các trang web của trình thu thập dữ liệu. Sau đó, các công cụ tìm kiếm sẽ xem trang web của bạn là cơ quan có thẩm quyền.

Cách an toàn nhất và dễ dàng nhất để thực hiện việc này là sử dụng WPCode  vì nó có công thức tự động thêm mã tùy chỉnh chính xác vào WordPress.


Để biết hướng dẫn chi tiết, hãy xem hướng dẫn của chúng tôi về cách trì hoãn các bài đăng xuất hiện trong nguồn cấp RSS WordPress của bạn.

7. Vô hiệu hóa Trackbacks, Pingbacks và REST API

Trong những ngày đầu viết blog,  trackback và pingback  được giới thiệu như một cách để các blog thông báo cho nhau về các liên kết. Khi ai đó liên kết đến một bài đăng trên blog của bạn, trang web của họ sẽ tự động gửi ping đến trang của bạn.

Sau đó, pingback này sẽ xuất hiện trong  hàng đợi kiểm duyệt nhận xét trên blog của bạn  cùng với một liên kết đến trang web của họ. Nếu bạn chấp thuận, thì họ sẽ nhận được một liên kết ngược và đề cập từ trang web của bạn.

Điều này mang lại cho người gửi thư rác một động cơ để quét trang web của bạn và gửi theo dõi. May mắn thay, bạn có thể vô hiệu hóa trackback và pingback để cung cấp cho những người cào ít lý do hơn để ăn cắp nội dung của bạn.


Để biết thêm thông tin, hãy xem hướng dẫn của chúng tôi về cách vô hiệu hóa trackback trên tất cả các bài đăng trong tương lai. Bạn cũng có thể muốn tìm hiểu cách tắt trackback và ping trên các bài đăng WordPress hiện có.

Ngoài trackback và pingback, chúng tôi cũng khuyên bạn nên tắt WordPress REST API vì nó có thể giúp những kẻ gửi thư rác dễ dàng thu thập nội dung của bạn hơn.

Chúng tôi có hướng dẫn chi tiết về cách bạn có thể tắt WordPress REST API.

Tất cả những gì bạn cần làm là cài đặt và kích hoạt plugin WPCode miễn phí và sử dụng đoạn mã được tạo sẵn của chúng để tắt API REST.

8. Chặn truy cập của Scraper vào trang web WordPress của bạn

Một cách để ngăn những kẻ thu thập dữ liệu ăn cắp nội dung của bạn là lấy đi quyền truy cập của họ vào trang web của bạn. Bạn có thể thực hiện việc này theo cách thủ công bằng cách chặn địa chỉ IP của họ, nhưng hầu hết người dùng sẽ thấy dễ dàng hơn khi sử dụng plugin bảo mật, chẳng hạn như tường lửa ứng dụng web.

8.1. Chặn Trình quét bằng Plugin bảo mật (Được khuyến nghị)

Chặn máy cào thủ công là một công việc phức tạp và tốn nhiều công sức. Đặc biệt là vì nhiều nỗ lực hack và tấn công được thực hiện bằng nhiều loại địa chỉ IP ngẫu nhiên từ khắp nơi trên thế giới. Gần như không thể theo kịp tất cả các địa chỉ IP ngẫu nhiên đó.

Đó là lý do tại sao bạn cần có Tường lửa ứng dụng web (WAF) chẳng hạn như WordFence hoặc Securi. Chúng hoạt động như một lá chắn giữa trang web của bạn và tất cả lưu lượng truy cập đến bằng cách giám sát lưu lượng truy cập trang web của bạn và chặn các mối đe dọa bảo mật phổ biến trước khi chúng tiếp cận trang web WordPress của bạn.

Đối với trang web WordPress, chúng tôi sử dụng  Sucuri. Đây là một dịch vụ bảo mật trang web bảo vệ trang web của bạn khỏi các cuộc tấn công như vậy bằng cách sử dụng tường lửa ứng dụng trang web.

Về cơ bản, tất cả lưu lượng truy cập trang web của bạn đều đi qua các máy chủ của dịch vụ bảo mật, nơi nó được kiểm tra hoạt động đáng ngờ. Họ tự động chặn hoàn toàn các địa chỉ IP đáng ngờ truy cập trang web của bạn. Xem cách  Sucuri giúp chúng tôi chặn 450.000 cuộc tấn công WordPress  trong 3 tháng.

8.2. Chặn hoặc chuyển hướng địa chỉ IP của Scraper theo cách thủ công

Người dùng nâng cao cũng có thể muốn chặn địa chỉ IP của trình quét theo cách thủ công. Việc này tốn nhiều công sức hơn, nhưng bạn có thể nhắm mục tiêu cụ thể địa chỉ của người cào sau khi bạn tìm hiểu nó. Nhà phát triển web Jeff Star gợi ý cách tiếp cận này khi anh ấy viết về cách anh ấy xử lý các trình thu thập nội dung.

Lưu ý: Việc thêm mã vào tệp trang web có thể nguy hiểm. Ngay cả một lỗi nhỏ cũng có thể gây ra lỗi lớn trên trang web của bạn. Đó là lý do tại sao chúng tôi chỉ đề xuất phương pháp này cho người dùng nâng cao.

Bạn có thể tìm địa chỉ IP của trình cào bằng cách truy cập 'Nhật ký truy cập thô' trong bảng điều khiển cPanel của  tài khoản lưu trữ WordPress của bạn. Bạn cần tìm kiếm các địa chỉ IP có số lượng yêu cầu cao bất thường và ghi lại chúng, chẳng hạn bằng cách sao chép chúng vào một tệp văn bản riêng.


Mẹo: Bạn cần đảm bảo rằng cuối cùng bạn không chặn chính mình, người dùng hợp pháp hoặc công cụ tìm kiếm truy cập trang web của bạn. Sao chép một địa chỉ IP đáng ngờ và sử dụng  các công cụ tra cứu IP trực tuyến  để tìm hiểu thêm về địa chỉ đó.

Khi bạn chắc chắn rằng địa chỉ IP thuộc về một trình quét, bạn có thể chặn nó bằng công cụ 'Trình chặn IP' của cPanel hoặc bằng cách thêm mã như thế này vào tệp.htaccess gốc của bạn:

Mã nguồn [Chọn]
Deny from 123.456.789
Đảm bảo bạn thay thế địa chỉ IP trong mã bằng địa chỉ bạn muốn chặn. Bạn có thể chặn nhiều địa chỉ IP bằng cách nhập chúng trên cùng một dòng được phân tách bằng dấu cách.

Để biết hướng dẫn chi tiết, hãy xem hướng dẫn của chúng tôi về cách chặn địa chỉ IP trong WordPress.

Thay vì chỉ chặn những người cào, Jeff gợi ý rằng bạn có thể gửi cho họ những nguồn cấp dữ liệu RSS giả để thay thế. Bạn có thể tạo các nguồn cấp dữ liệu chứa đầy Lorem Ipsum và các hình ảnh gây phiền nhiễu, hoặc thậm chí gửi chúng trở lại trang web của chính họ, gây ra vòng lặp vô hạn và làm hỏng máy chủ của họ.

Để chuyển hướng chúng đến nguồn cấp dữ liệu giả, bạn sẽ cần thêm mã như thế này vào tệp .htaccess của mình:

Mã nguồn [Chọn]
RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule.* http://dummyfeed.com/feed [R,L]

9. Ngăn chặn hành vi trộm cắp hình ảnh trong WordPress

Bạn không chỉ cần bảo vệ nội dung bằng văn bản của mình. Bạn cũng nên ngăn chặn hành vi trộm cắp hình ảnh trong WordPress.

Giống như văn bản, không có cách nào ngăn chặn hoàn toàn việc mọi người ăn cắp hình ảnh của bạn, nhưng có rất nhiều cách để ngăn chặn hành vi trộm cắp hình ảnh trên trang web WordPress.

Ví dụ: bạn có thể tắt liên kết nóng các hình ảnh WordPress của mình. Điều này có nghĩa là nếu ai đó cào nội dung của bạn, hình ảnh của họ sẽ không tải trên trang web của họ.

Nó cũng sẽ giảm tải máy chủ và mức sử dụng băng thông, tăng tốc độ và hiệu suất WordPress của bạn.

Ngoài ra, bạn có thể thêm hình mờ vào hình ảnh để ghi công cho bạn. Điều này sẽ làm rõ rằng máy cào đã đánh cắp nội dung của bạn.

Bạn có thể tìm hiểu hai kỹ thuật này cũng như các cách khác để bảo vệ hình ảnh của mình trong hướng dẫn của chúng tôi về 4 cách ngăn chặn hành vi trộm cắp hình ảnh trong WordPress.

10. Không khuyến khích sao chép thủ công nội dung của bạn

Trong khi hầu hết những người cào sử dụng các công cụ tự động, một số kẻ trộm nội dung có thể cố gắng sao chép thủ công tất cả hoặc một phần nội dung của bạn.

Một cách để làm cho điều này trở nên khó khăn hơn là ngăn họ sao chép và dán văn bản của bạn. Bạn có thể làm điều này bằng cách khiến họ khó chọn văn bản trên trang web của bạn hơn.

Để tìm hiểu cách ngừng sao chép thủ công nội dung của bạn, hãy xem hướng dẫn từng bước của chúng tôi về cách ngăn chọn văn bản và sao chép/dán trong WordPress.

Tuy nhiên, điều này sẽ không bảo vệ hoàn toàn nội dung của bạn. Hãy nhớ rằng, những người dùng am hiểu công nghệ vẫn có thể xem mã nguồn hoặc sử dụng  công cụ Inspect  để sao chép bất kỳ thứ gì họ muốn. Ngoài ra, phương pháp này sẽ không hoạt động với tất cả các trình duyệt web.

Ngoài ra, hãy nhớ rằng không phải ai sao chép văn bản của bạn cũng sẽ là kẻ ăn cắp nội dung. Chẳng hạn, một số người có thể muốn sao chép tiêu đề để  chia sẻ bài đăng của bạn trên mạng xã hội.

Đó là lý do tại sao chúng tôi khuyên bạn chỉ nên sử dụng phương pháp này nếu bạn cảm thấy nó thực sự cần thiết cho trang web của mình.

11. Tận dụng công cụ thu thập nội dung

Khi blog của bạn lớn hơn, gần như không thể dừng hoặc theo dõi tất cả các trình thu thập nội dung. Chúng tôi vẫn gửi khiếu nại DMCA. Tuy nhiên, chúng tôi biết rằng có rất nhiều trang web khác đang ăn cắp nội dung của chúng tôi mà chúng tôi không thể theo kịp.

Thay vào đó, cách tiếp cận của chúng tôi là cố gắng tận dụng lợi thế của trình tạo nội dung. Sẽ không quá tệ khi bạn thấy rằng mình đang kiếm tiền từ nội dung bị đánh cắp hoặc nhận được nhiều lưu lượng truy cập từ trang web của người thu thập dữ liệu.

11.1. Biến liên kết nội bộ thành thói quen để có được lưu lượng truy cập và liên kết ngược từ những người thu thập dữ liệu

Trong hướng dẫn cuối cùng của chúng tôi về SEO, chúng tôi khuyên bạn nên tạo thói quen liên kết nội bộ. Bằng cách đặt các liên kết đến nội dung khác của bạn trong các bài đăng trên blog của mình, bạn có thể tăng số lần xem trang và giảm tỷ lệ thoát trên trang web của chính mình.

Nhưng có một lợi ích thứ hai khi cào. Liên kết nội bộ sẽ giúp bạn có được các liên kết ngược có giá trị từ những người đang ăn cắp nội dung của bạn. Các công cụ tìm kiếm như Google sử dụng các liên kết ngược làm tín hiệu xếp hạng, vì vậy các liên kết ngược bổ sung sẽ tốt cho SEO của bạn.

Cuối cùng, các liên kết nội bộ này cho phép bạn đánh cắp đối tượng của người xem. Các blogger tài năng đặt các liên kết trên các từ khóa thú vị, khiến người dùng dễ dàng nhấp vào. Khách truy cập vào trang web của máy quét cũng sẽ nhấp vào các liên kết, điều này sẽ dẫn họ quay lại trang web của riêng bạn.

11.2. Tự động liên kết từ khóa với liên kết liên kết để kiếm tiền từ Scrapers

Nếu bạn kiếm tiền trên trang web của mình từ tiếp thị liên kết thì chúng tôi khuyên bạn nên bật tự động liên kết trong nguồn cấp RSS của mình. Điều này sẽ giúp bạn tối đa hóa thu nhập từ những độc giả chỉ đọc trang web của bạn thông qua trình đọc RSS.

Thậm chí tốt hơn, nó sẽ giúp bạn kiếm tiền từ các trang web ăn cắp nội dung của bạn.

Chỉ cần sử dụng một plugin như  ThirstyAffiliates  sẽ tự động thay thế các từ khóa được chỉ định bằng các liên kết liên kết. Chúng tôi chỉ cho bạn cách thực hiện trong hướng dẫn của chúng tôi về cách tự động liên kết từ khóa với liên kết liên kết trong WordPress.

11.3. Quảng bá trang web của bạn trong phần cuối RSS của bạn

Bạn có thể sử dụng  plugin All in One SEO  để thêm các mục tùy chỉnh vào chân trang RSS của mình. Ví dụ: bạn có thể thêm biểu ngữ quảng bá sản phẩm, dịch vụ hoặc nội dung của riêng mình.


Phần tốt nhất là những biểu ngữ đó cũng sẽ xuất hiện trên trang web của người cào.

Trong trường hợp của chúng tôi, chúng tôi luôn thêm một tuyên bố từ chối trách nhiệm nhỏ ở cuối bài đăng trong nguồn cấp dữ liệu RSS của mình. Bằng cách này, chúng tôi nhận được một liên kết ngược đến bài viết gốc từ trang web của người cào.

Điều này cho phép Google và các công cụ tìm kiếm khác biết chúng tôi là cơ quan có thẩm quyền. Nó cũng cho phép người dùng của họ biết rằng trang web đang ăn cắp nội dung của chúng tôi.

Để biết thêm mẹo, hãy xem hướng dẫn của chúng tôi về  cách kiểm soát chân trang nguồn cấp dữ liệu RSS của bạn trong WordPress.

Chúng tôi hy vọng hướng dẫn này đã giúp bạn tìm hiểu cách ngăn chặn việc cào nội dung blog trong WordPress. Bạn cũng có thể muốn xem hướng dẫn bảo mật WordPress cuối cùng của chúng tôi hoặc xem danh sách các giải pháp phân tích tốt nhất cho WordPress của chúng tôi.