Duplicate content có thể là một trong những nguyên nhân dẫn đến website của bạn bị ảnh hưởng trong quá trình SEO web.
Tuy nhiên, để khắc phục được tình trạng này điều đơn giản thì bạn cần hiểu được Duplicate content là gì, những nguyên nhân nào dẫn đến tình trạng đó.
Trong bài viết này tôi sẽ bạn sẽ hiểu được:
- Duplicate content là gì?
- Nguyên nhân và giải pháp khắc phục
- Công cụ kiểm tra trùng lặp nội dung
- Duplicate content có bị Google đánh dấu và bị phạt hay không?
Không để bạn chờ đợi lâu, tôi sẽ bắt đầu ngay.
Duplicate content là gì?
Duplicate content (tiếng việt có nghĩa là Nội dung trùng lặp) là bản sao tương tự hoặc chính xác của nội dung trên các trang web khác hoặc trên các trang khác nhau trên cùng một trang web. Có một lượng lớn nội dung trùng lặp trên một trang web có thể tác động tiêu cực đến thứ hạng của Google.
Nói cách khác:
Nội dung trùng lặp là nội dung từng chữ giống với nội dung xuất hiện trên một trang khác.
Nhưng “Nội dung trùng lặp” cũng áp dụng cho nội dung tương tự với nội dung khác… ngay cả khi nó được viết lại một chút.
Duplicate content ảnh hưởng đến SEO như thế nào?
Nói đơn giản một điều rằng:
Ngay cả bạn cũng chẳng thích ăn những sản phẩm mà người khác ăn rồi hoặc đã từng ăn.
Google cũng thế, tôi nói gã khổng lồ to xác này luôn thích xếp hàng những nội dung mới, sáng tạo và đem lại giá trị cho người dùng. Hoặc ăn tiền của bạn để giúp bạn lên top Google.
Trên thực tế, Google tuyên bố rằng :
“Google cố gắng lập chỉ mục và hiển thị các trang có thông tin riêng biệt”.
Vì vậy, trên trang của bạn không có những nội dung mới, riêng biệt thì nó có thể là nguyên nhân làm ảnh hưởng đến việc xếp hạng công cụ tìm kiếm của bạn.
Cụ thể có 3 nguyên nhân chính dẫn đến lý do mà bạn không được xếp hạng cao:
Ít lưu lượng truy cập website: Điều này sẽ vô cùng dễ hiểu, Google chẳng muốn xếp hạng trang mà chẳng có lấy người dùng truy cập nào cả. (Vậy nên quảng cáo sẽ rất tốt cho SEO lúc đầu vì nó có traffic)
Hình phạt trùng lặp nội dung: Đây có thể là nguyên nhân dẫn đến việc bạn không được xếp hàng cao. Tuy nhiên, điều này là rất hiếm xảy ra. (bạn có thể xem thêm thông tin tôi để ở cuối trang) Vì vậy cách tốt nhất là bạn nên tạo nên những nét riêng biệt cho website của bạn (ý tôi nói đến là content, image hay UX/XI).
Vì vậy, nếu bạn có một loạt các trang trùng lặp trên trang web của mình, bạn có thể không cần phải lo lắng về “hình phạt nội dung trùng lặp”.
Ít trang được lập chỉ mục hơn: Việc trang của bạn ít lập chỉ mục hơn cũng là yếu tố mà bạn cần nên xem xét lại. Có thể trang của bạn quá ít nội dung hay hoặc bla…bla cái gì đó. Gã khổng lồ to xác cũng chẳng thích điều này trên trang của bạn đâu.
Công cụ hỗ trợ kiểm tra Duplicate Content
Công cụ hỗ trợ kiểm tra trùng lặp nội dung onsite
- Công cụ Siteliner: Đây là một công cụ khá tốt dành cho các SEOer kiểm tra nội dung trùng lặp trên chính trang của mình. Điều quan trọng là nó miễn phí.
- Google Search Console: Đây là công cụ mà chính Google cung cấp cho người dùng. Nhưng tôi thường sử dụng Siteliner hơn. Bởi tôi cũng chả thích gã khổng lồ to xác này lắm.
Công cụ hỗ trợ kiểm tra duplicate content offsite
Dưới đây, tôi sẽ liệt kê giúp bạn 11 công cụ hỗ trợ kiểm tra lỗi trùng lặp đối với các trang bên ngoài một cách dễ dàng hơn:
- smallseotools.com
- copyscape.com
- plagium.com
- duplichecker.com
- dmca.com
- copygator.com
- plagiarisma.net
- plagspotter.com
- dustball.com
- articlechecker.com
- Spineditor
Cách khắc phục tình trạng duplicate content
Nguyên nhân dẫn đến trùng lặp nội dung
Biến thể URL
Các thông số URL, chẳng hạn như theo dõi lần nhấp và một số mã phân tích, có thể gây ra các vấn đề về nội dung trùng lặp. Đây có thể là sự cố không chỉ do chính các tham số gây ra mà còn do thứ tự mà các tham số đó xuất hiện trong chính URL.
HTTP so với HTTPS Or WWW so với Non-WWW
Nếu trang web của bạn có các phiên bản riêng biệt tại “www.site.com” và “site.com” (có và không có tiền tố “www”) nó sẽ tạo ra 2 trang đều có nội dung trùng lặp giống nhau.
Điều tương tự cũng áp dụng cho các trang web duy trì phiên bản tại cả http: // và https: //. Nếu cả hai phiên bản của một trang đều hiển thị trực tiếp và hiển thị cho các công cụ tìm kiếm, thì bạn cũng gặp vấn đề trong việc trùng lặp nội dung.
Sao chép hoặc cóp nhặt từ các trang web khác
Thường để tạo ra một nội dung mới là điều không phải dễ với nhiều người. Nó thường mất nhiều thời gian hơn, trải nghiệm, cũng như tư duy của mỗi người.
Thế nên!
Việc sao chép hay copy bài viết từ những trang web khác về trang của mình là điều thường thấy. Đặc biệt là thị trường Việt Nam.
Điều này dễ dàng tạo nên những bài viết bị trùng lặp với các trang bên ngoài (offsite).
Giải pháp khắc phục
Sử dụng chuyển hướng 301
Nếu thực sự bạn có những bài viết bị trùng lặp với nhau, nhưng 2 bài viết đó lại có traffic tương đối. Bạn lại tiếc không muốn xoá đi bất kỳ trang nào thì bạn nên sử dụng cách này.
Tuy nhiên,
Trước khi sử dụng cách này, bạn nên thêm bớt nội dung của trang đích mà bạn muốn chuyển hướng 301. Hãy làm giàu nội dung chính trước hoặc gộp 2 bài viết lại là một như tôi nói ở phương pháp bên dưới.
Khi bạn làm thế, bạn sẽ phát tín hiệu cho Google để nó biết rằng bạn muốn đâu là trang website cần được xếp hạng.
Cách này cũng sử dụng cho tình trạng www và non-www or http – https.
Sử dụng thẻ Canonical
Theo tôi bạn nên sử dụng thêm thẻ Canonical khi bạn muốn copy nguyên văn từ một website khác về trang của mình.
Google sẽ đáng giá cao hơn rất nhiều vì nó hiểu bạn minh bạch và không có ” mưu đồ” ăn cắp nội dung của người khác một cách trắng trợn về làm của mình.
Google sẽ biết rằng bạn chỉ mượn chúng để tham khảo và làm giàu cho bài viết của bạn mà thôi!
Tham khảo: Thẻ Canonical là gì? Hướng dẫn sử dụng Canonical hợp lý từ A đến Z
Kiểm soát nội dung
Theo kinh nghiệm của tôi, nếu bạn triển khai content mà không có một chiến lược cụ thể thì chắc chắn bạn sẽ bị dính vào duplicate content.
Vậy nên,
Việc tạo ra một chiến lược nội dung là một điều rất cần thiết và kiểm soát được quá trình triển khai sẽ giúp bạn làm tốt ngay từ bước đầu tiên. Bạn sẽ hoàn toàn không cần phải lo lắng trong việc chỉnh sửa lại những content kém chất lượng hay duplicate content không cần thiết.
Sử dụng gộp content
Nếu thực sự website của bạn có rất nhiều nội dung bị trùng lặp. Bạn cũng có thể gom nhóm chúng lại để tạo thành một bài viết chất lượng. Và những bài viết cũ bạn có thể redirect 301 về bài viết mới nhất theo giải pháp đầu mà tôi đưa ra.
Sử dụng thẻ noindex
Nếu thực sự bạn nhận thấy trang nào gây ra hiện trạng trùng lặp nội dung và trang đó không nhất thiết bạn muốn SEO lên top. Điều đó sẽ tốt hơn nếu bạn tắt google index trang đó.
Nếu bạn sử dụng WordPress, bạn có thể tắt nó dễ dàng hơn.
Vì sẽ hữu ích hơn trong quá trình SEO, tôi khuyên bạn nên thêm thẻ “noindex” vào các trang gây ra tình trạng trùng lặp nội dung hoặc những trang không cần thiết.
Bảo vệ nội dung của mình với DMCA
Ví dụ bạn là người tạo nội dung, những nội dung của bạn rất hay và xuất sắc, đặc biệt bạn hoàn toàn không muốn ai đó copy bài viết của bạn và đăng lên website của họ.
Thật đơn giản để có thể bảo vệ bài viết của bạn với công cụ DMCA. >> Bạn có thể mua tại trang: https://www.dmca.com
Tóm lại, việc kiểm tra duplicate content và tối ưu chúng là một việc làm cần thiết để giúp cho người đọc có những kiến thức mới và hữu ích hơn. Đồng thời website của bạn cũng được đánh giá cao trong việc xếp hạng từ khóa trong các công cụ tìm kiếm.
Nguồn tham khảo:
https://moz.com/learn/seo/duplicate-content
https://backlinko.com/hub/seo/duplicate-content
Tìm hiểu thêm
Google xử lý nội dung trùng lặp như thế nào? : Một video chuyên gia Matt Cutts của Google chia sẻ về cách Google xem nội dung trùng lặp.
Huyền thoại về hình phạt nội dung trùng lặp : Bài viết sẽ cho bạn biết rằng việc google phạt về trùng lặp nội dung là điều rất hiếm thấy.
Tôi là Nguyễn Văn Liêm, hiện là Leader SEO tại DGO. Ngoài việc chịu trách nhiệm cho việc chiến lược SEO tổng thể của công ty và đối tác. Tôi còn phụ trách trong việc phát triển của DGO. Với kiến thức và kinh nghiệm ít ỏi của mình. Tôi hi vọng những kiến thức mà tôi góp nhặt được sẽ thúc đẩy chiến dịch tiếp cận khách hàng cho doanh nghiệp của bạn.