Duplicate content có thể là một trong những nguyên nhân dẫn đến website của bạn bị ảnh hưởng trong quá trình SEO web.

Tuy nhiên, để khắc phục được tình trạng này điều đơn giản thì bạn cần hiểu được Duplicate content là gì, những nguyên nhân nào dẫn đến tình trạng đó.

Trong bài viết này tôi sẽ bạn sẽ hiểu được:

  • Duplicate content là gì?
  • Nguyên nhân và giải pháp khắc phục
  • Công cụ kiểm tra trùng lặp nội dung
  • Duplicate content có bị Google đánh dấu và bị phạt hay không?

Không để bạn chờ đợi lâu, tôi sẽ bắt đầu ngay.

Duplicate content là gì?

Duplicate content (tiếng việt có nghĩa là Nội dung trùng lặp) là bản sao tương tự hoặc chính xác của nội dung trên các trang web khác hoặc trên các trang khác nhau trên cùng một trang web. Có một lượng lớn nội dung trùng lặp trên một trang web có thể tác động tiêu cực đến thứ hạng của Google.

Duplicate content là gì
Duplicate content là gì?

Nói cách khác:

Nội dung trùng lặp là nội dung từng chữ giống với nội dung xuất hiện trên một trang khác.

Nhưng “Nội dung trùng lặp” cũng áp dụng cho nội dung tương tự với nội dung khác… ngay cả khi nó được viết lại một chút.

Duplicate content ảnh hưởng đến SEO như thế nào?

Nói đơn giản một điều rằng:

Ngay cả bạn cũng chẳng thích ăn những sản phẩm mà người khác ăn rồi hoặc đã từng ăn.

Google cũng thế, tôi nói gã khổng lồ to xác này luôn thích xếp hàng những nội dung mới, sáng tạo và đem lại giá trị cho người dùng. Hoặc ăn tiền của bạn để giúp bạn lên top Google.

Trên thực tế, Google tuyên bố rằng :

“Google cố gắng lập chỉ mục và hiển thị các trang có thông tin riêng biệt”.

Vì vậy, trên trang của bạn không có những nội dung mới, riêng biệt thì nó có thể là nguyên nhân làm ảnh hưởng đến việc xếp hạng công cụ tìm kiếm của bạn.

Cụ thể có 3 nguyên nhân chính dẫn đến lý do mà bạn không được xếp hạng cao:

Ít lưu lượng truy cập website: Điều này sẽ vô cùng dễ hiểu, Google chẳng muốn xếp hạng trang mà chẳng có lấy người dùng truy cập nào cả. (Vậy nên quảng cáo sẽ rất tốt cho SEO lúc đầu vì nó có traffic)

Hình phạt trùng lặp nội dung: Đây có thể là nguyên nhân dẫn đến việc bạn không được xếp hàng cao. Tuy nhiên, điều này là rất hiếm xảy ra. (bạn có thể xem thêm thông tin tôi để ở cuối trang) Vì vậy cách tốt nhất là bạn nên tạo nên những nét riêng biệt cho website của bạn (ý tôi nói đến là content, image hay UX/XI).

Vì vậy, nếu bạn có một loạt các trang trùng lặp trên trang web của mình, bạn có thể không cần phải lo lắng về “hình phạt nội dung trùng lặp”.

Ít trang được lập chỉ mục hơn: Việc trang của bạn ít lập chỉ mục hơn cũng là yếu tố mà bạn cần nên xem xét lại. Có thể trang của bạn quá ít nội dung hay hoặc bla…bla cái gì đó. Gã khổng lồ to xác cũng chẳng thích điều này trên trang của bạn đâu.

Công cụ hỗ trợ kiểm tra Duplicate Content

Công cụ hỗ trợ kiểm tra trùng lặp nội dung onsite

  • ng cụ Siteliner: Đây là một công cụ khá tốt dành cho các SEOer kiểm tra nội dung trùng lặp trên chính trang của mình. Điều quan trọng là nó miễn phí.
Công cụ hỗ trợ check copy Siteliner
Công cụ hỗ trợ check copy Siteliner
  • Google Search Console: Đây là công cụ mà chính Google cung cấp cho người dùng. Nhưng tôi thường sử dụng Siteliner hơn. Bởi tôi cũng chả thích gã khổng lồ to xác này lắm.

Công cụ hỗ trợ kiểm tra duplicate content offsite

Dưới đây, tôi sẽ liệt kê giúp bạn 11 công cụ hỗ trợ kiểm tra lỗi trùng lặp đối với các trang bên ngoài một cách dễ dàng hơn:

  • smallseotools.com
  • copyscape.com
  • plagium.com
  • duplichecker.com
  • dmca.com
  • copygator.com
  • plagiarisma.net
  • plagspotter.com
  • dustball.com
  • articlechecker.com
  • Spineditor

Cách khắc phục tình trạng duplicate content

Nguyên nhân dẫn đến trùng lặp nội dung

Biến thể URL

Các thông số URL, chẳng hạn như theo dõi lần nhấp và một số mã phân tích, có thể gây ra các vấn đề về nội dung trùng lặp. Đây có thể là sự cố không chỉ do chính các tham số gây ra mà còn do thứ tự mà các tham số đó xuất hiện trong chính URL.

Biến thể URL
ảnh minh hoạ biến thể URL gây trùng lặp nội dung

HTTP so với HTTPS Or WWW so với Non-WWW

Nếu trang web của bạn có các phiên bản riêng biệt tại “www.site.com” và “site.com” (có và không có tiền tố “www”) nó sẽ tạo ra 2 trang đều có nội dung trùng lặp giống nhau.

Điều tương tự cũng áp dụng cho các trang web duy trì phiên bản tại cả http: // và https: //. Nếu cả hai phiên bản của một trang đều hiển thị trực tiếp và hiển thị cho các ng cụ tìm kiếm, thì bạn cũng gặp vấn đề trong việc trùng lặp nội dung.

Sao chép hoặc cóp nhặt từ các trang web khác

Thường để tạo ra một nội dung mới là điều không phải dễ với nhiều người. Nó thường mất nhiều thời gian hơn, trải nghiệm, cũng như tư duy của mỗi người.

Thế nên!

Việc sao chép hay copy bài viết từ những trang web khác về trang của mình là điều thường thấy. Đặc biệt là thị trường Việt Nam.

Điều này dễ dàng tạo nên những bài viết bị trùng lặp với các trang bên ngoài (offsite).

Giải pháp khắc phục

Sử dụng chuyển hướng 301

Nếu thực sự bạn có những bài viết bị trùng lặp với nhau, nhưng 2 bài viết đó lại có traffic tương đối. Bạn lại tiếc không muốn xoá đi bất kỳ trang nào thì bạn nên sử dụng cách này.

Redirection
Giải pháp Redirect 301 về trang đích

Tuy nhiên,

Trước khi sử dụng cách này, bạn nên thêm bớt nội dung của trang đích mà bạn muốn chuyển hướng 301. Hãy làm giàu nội dung chính trước hoặc gộp 2 bài viết lại là một như tôi nói ở phương pháp bên dưới.

Khi bạn làm thế, bạn sẽ phát tín hiệu cho Google để nó biết rằng bạn muốn đâu là trang website cần được xếp hạng.

Cách này cũng sử dụng cho tình trạng www và non-www or http – https.

Sử dụng thẻ Canonical

Theo tôi bạn nên sử dụng thêm thẻ Canonical khi bạn muốn copy nguyên văn từ một website khác về trang của mình.

Google sẽ đáng giá cao hơn rất nhiều vì nó hiểu bạn minh bạch và không có ” mưu đồ” ăn cắp nội dung của người khác một cách trắng trợn về làm của mình.

Google sẽ biết rằng bạn chỉ mượn chúng để tham khảo và làm giàu cho bài viết của bạn mà thôi!

Tham khảo: Thẻ Canonical là gì? Hướng dẫn sử dụng Canonical hợp lý từ A đến Z

Kiểm soát nội dung

Theo kinh nghiệm của tôi, nếu bạn triển khai content mà không có một chiến lược cụ thể thì chắc chắn bạn sẽ bị dính vào duplicate content.

Vậy nên,

Việc tạo ra một chiến lược nội dung là một điều rất cần thiết và kiểm soát được quá trình triển khai sẽ giúp bạn làm tốt ngay từ bước đầu tiên. Bạn sẽ hoàn toàn không cần phải lo lắng trong việc chỉnh sửa lại những content kém chất lượng hay duplicate content không cần thiết.

Sử dụng gộp content 

Nếu thực sự website của bạn có rất nhiều nội dung bị trùng lặp. Bạn cũng có thể gom nhóm chúng lại để tạo thành một bài viết chất lượng. Và những bài viết cũ bạn có thể redirect 301 về bài viết mới nhất theo giải pháp đầu mà tôi đưa ra.

Sử dụng thẻ noindex

Nếu thực sự bạn nhận thấy trang nào gây ra hiện trạng trùng lặp nội dung và trang đó không nhất thiết bạn muốn SEO lên top. Điều đó sẽ tốt hơn nếu bạn tắt google index trang đó.

Nếu bạn sử dụng WordPress, bạn có thể tắt nó dễ dàng hơn.

Vì sẽ hữu ích hơn trong quá trình SEO, tôi khuyên bạn nên thêm thẻ “noindex” vào các trang gây ra tình trạng trùng lặp nội dung hoặc những trang không cần thiết.

Bảo vệ nội dung của mình với DMCA

Ví dụ bạn là người tạo nội dung, những nội dung của bạn rất hay và xuất sắc, đặc biệt bạn hoàn toàn không muốn ai đó copy bài viết của bạn và đăng lên website của họ.

Thật đơn giản để có thể bảo vệ bài viết của bạn với công cụ DMCA. >> Bạn có thể mua tại trang: https://www.dmca.com

Tóm lại, việc kiểm tra duplicate content và tối ưu chúng là một việc làm cần thiết để giúp cho người đọc có những kiến thức mới và hữu ích hơn. Đồng thời website của bạn cũng được đánh giá cao trong việc xếp hạng từ khóa trong các công cụ tìm kiếm.

Nguồn tham khảo:

https://moz.com/learn/seo/duplicate-content

https://backlinko.com/hub/seo/duplicate-content

Tìm hiểu thêm

Google xử lý nội dung trùng lặp như thế nào? : Một video chuyên gia Matt Cutts của Google chia sẻ về cách Google xem nội dung trùng lặp.

Huyền thoại về hình phạt nội dung trùng lặp : Bài viết sẽ cho bạn biết rằng việc google phạt về trùng lặp nội dung là điều rất hiếm thấy.

Trả lời

Email của bạn sẽ không được hiển thị công khai.

Chúng tôi sử dụng cookie để đảm bảo rằng chúng tôi cung cấp cho bạn trải nghiệm tốt nhất trên trang web của chúng tôi. Nếu bạn tiếp tục sử dụng trang web này, chúng tôi sẽ cho rằng bạn hài lòng với nó.