Xem danh mục
Duplicate Content là gì? Nội dung trùng lặp, nội dung sao chép và nội dung mỏng
- Bạn có thể đã gặp khá nhiều thuật ngữ trùng lặp nội dung, nhưng nó là gì? Duplicate Content - Nội dung trùng lặp là nội dung tồn tại ở một số địa điểm - tức là URL. Nó có thể gây hại cho thứ hạng của bạn và nhiều người nói rằng số lượng lớn của nó thậm chí có thể dẫn đến hình phạt của Google. Tuy nhiên, điều đó không đúng. Không có hình phạt nào, nhưng việc có vô số nội dung trùng lặp hoặc sao chép có thể khiến Google ảnh hưởng tiêu cực đến thứ hạng của bạn. cùng chuyennghiep.vn tìm hiểu nào !
>> Xem thêm: Khóa học thiết kế website
Duplicate Content là gì?
- Duplicate Content dịch sang tiếng Việt có nghĩa là Nội dung trùng lặp, là nội dung xuất hiện trên Internet ở nhiều nơi. “Một địa điểm” đó được định nghĩa là một địa điểm có địa chỉ trang web ( URL ) duy nhất - vì vậy, nếu cùng một nội dung xuất hiện tại nhiều địa chỉ web, bạn đã có nội dung trùng lặp.
- Mặc dù về mặt kỹ thuật không phải là một hình phạt , nhưng nội dung trùng lặp đôi khi vẫn có thể ảnh hưởng đến thứ hạng của công cụ tìm kiếm. Khi có nhiều nội dung , như Google gọi , nội dung "tương tự đáng kể" ở nhiều vị trí trên Internet, thì công cụ tìm kiếm có thể khó quyết định phiên bản nào phù hợp hơn với một truy vấn tìm kiếm nhất định.
Định nghĩa của Google về nội dung trùng lặp như sau:
- “Nội dung trùng lặp thường đề cập đến các khối nội dung thực sự trong hoặc trên các miền hoàn toàn khớp với nội dung khác hoặc tương tự đáng kể. Hầu hết, đây không phải là lừa đảo về nguồn gốc xuất xứ ”.
- Đó là phần cuối cùng quan trọng. Nếu bạn cóp nhặt, sao chép và quay nội dung hiện có - Google gọi đây là nội dung sao chép - với mục đích đánh lừa công cụ tìm kiếm để có được thứ hạng cao hơn, bạn sẽ ở trên vùng nguy hiểm.
- Google cho biết loại mục đích xấu này có thể kích hoạt một hành động:
- “Nội dung trùng lặp trên một trang web không phải là căn cứ để hành động trên trang web đó trừ khi có vẻ như mục đích của nội dung trùng lặp là để lừa đảo và thao túng kết quả của công cụ tìm kiếm”.
>> Xem thêm dịch vụ thiết kế website tại đây: https://chuyennghiep.vn/thiet-ke-website.html
Nội dung trùng lặp, nội dung sao chép và nội dung mỏng: sự khác biệt là gì?
- Chủ đề về nội dung trùng lặp gây nhầm lẫn cho rất nhiều người. Đối với Google, nó chủ yếu có nguồn gốc kỹ thuật, nhưng nó cũng sẽ xem xét nội dung của chính nó. “Tôi có hai URL cho cùng một bài viết, tôi nên chọn URL nào?” Trong khi hầu hết những người bình thường có thể sẽ nghĩ về những phần nội dung tương tự xuất hiện ở những nơi khác trên một trang web. "Tôi đã sử dụng đoạn văn bản này ở một số nơi khác, điều đó có tệ không?" Đây là tất cả nội dung trùng lặp, nhưng để xác định thứ hạng, các công cụ tìm kiếm phân biệt giữa nội dung trùng lặp, nội dung sao chép và nội dung mỏng.
- Nội dung trùng lặp của bạn có thể được phân loại là nội dung được sao chép nếu bạn sử dụng một văn bản hiện có và chuyển nó nhanh chóng để sử dụng lại trên trang web của mình. Không có vấn đề gì nếu bạn cho nó quay một chút hoặc đặt một vài từ khóa, hành vi này là không thể chấp nhận được. Đưa vào một vài trang nội dung mỏng - những trang có ít hoặc không có nội dung chất lượng - và bạn đang ở trong lãnh thổ nguy hiểm. Chất lượng trang web là một vấn đề và những chiến thuật này có thể gây hại nghiêm trọng cho trang web của bạn.
>> Xem thêm: Mobile-First Indexing là gì? 9 điều bạn cần biết về Mobile-First Indexing
Tại sao nội dung trùng lặp lại quan trọng?
Đối với công cụ tìm kiếm
Nội dung trùng lặp có thể gây ra ba vấn đề chính đối với các công cụ tìm kiếm:
- - Họ không biết nên bao gồm / loại trừ (các) phiên bản nào khỏi chỉ số của mình.
- - Họ không biết có nên định hướng các chỉ số liên kết (độ tin cậy, quyền hạn, văn bản liên kết ,liên kết vốn chủ sở hữu , v.v.) với một trang hoặc giữ nó tách biệt giữa nhiều phiên bản.
- - Họ không biết (các) phiên bản nào để xếp hạng cho các kết quả truy vấn.
Đối với chủ sở hữu trang web
- Khi nội dung trùng lặp xuất hiện, chủ sở hữu trang web có thể bị mất thứ hạng và lưu lượng truy cập. Những tổn thất này thường xuất phát từ hai vấn đề chính:
- Để cung cấp trải nghiệm tìm kiếm tốt nhất, các công cụ tìm kiếm sẽ hiếm khi hiển thị nhiều phiên bản của cùng một nội dung và do đó buộc phải chọn phiên bản nào có nhiều khả năng mang lại kết quả tốt nhất. Điều này làm loãng khả năng hiển thị của từng bản sao.
- Giá trị liên kết có thể bị pha loãng hơn nữa vì các trang web khác cũng phải lựa chọn giữa các bản sao. thay vì tất cả các liên kết đến đều trỏ đến một phần nội dung, chúng liên kết đến nhiều phần, làm lan tỏa liên kết giữa các phần trùng lặp. Bởi vì các liên kết trong nước là một yếu tố xếp hạng, điều này sau đó có thể ảnh hưởng đến khả năng hiển thị tìm kiếm của một phần nội dung.
>> Xem thêm dịch vụ seo tại đây đây: https://chuyennghiep.vn/dich-vu-seo
Google có phạt Duplicate Content không?
- Duplicate Content sẽ gây ảnh hưởng xấu đến hiệu suất SEO của website của bạn. Nhưng nó sẽ không khiến cho website của bạn bị Google phạt nếu bạn không cố tình sao chép nội dung của những website khác.
- Nếu bạn sử dụng một vài kỹ thuật trong website của mình nhưng không cố tình lừa Google thì không cần lo lắng về việc bị Google phạt.
- Nếu bạn đã sao chép một lượng lớn nội dung website khác. Thì chắc chắn bạn đang đứng ở ranh giới mỏng manh. Bởi Google đã từng lên tiếng về vấn đề Duplicate Content như sau:
- “Duplicate content trên một website không phải là cơ sở để áp dụng hình phạt. Google chỉ phạt khi website sử dụng Duplicate Content để đánh lừa và thao túng kết quả của công cụ tìm kiếm.
- Nếu website của bạn đang gặp vấn đề về Duplicate content và bạn không tuân theo các khuyến cáo của Google. Thì chúng tôi sẽ lựa chọn phiên bản nội dung tốt nhất để hiển thị trong kết quả tìm kiếm”
>> Xem thêm: Cấu trúc Silo là gì ? Cách cấu trúc Silo thúc đẩy SEO trang web
Cách khắc phục vấn đề Duplicate Content trên trang web
- Google rất giỏi trong việc phát hiện và xử lý nội dung trùng lặp. Công cụ tìm kiếm đủ thông minh để tìm ra những việc cần làm với hầu hết nội dung mà nó tìm thấy. Nếu nó tìm thấy nhiều phiên bản của một trang, nó sẽ xếp những phiên bản này thành phiên bản nó thấy tốt nhất - trong hầu hết các trường hợp, đây sẽ là bài viết / trang gốc.
- Tuy nhiên, những gì nó cần là quyền truy cập đầy đủ vào các URL này. Nếu bạn chặn Googlebot trong robots.txt của mình thu thập dữ liệu các URL này, nó không thể tự tìm ra những điều này và bạn sẽ gặp rủi ro khi Google coi các trang này là các bản sao riêng biệt. Dưới đây là một số điều bạn nên làm:
Sử dụng 301s
- Nếu bạn đã cấu trúc lại trang web của mình, hãy sử dụng chuyển hướng 301 ("RedirectPermanent") trong tệp .htaccess của bạn để chuyển hướng thông minh người dùng, Googlebot và các trình thu thập thông tin khác. (Trong Apache, bạn có thể thực hiện việc này bằng tệp .htaccess; trong IIS, bạn có thể thực hiện việc này thông qua bảng điều khiển quản trị.)
Nhất quán
- Cố gắng giữ cho liên kết nội bộ của bạn nhất quán. Ví dụ: không liên kết đến http://www.example.com/page/và http://www.example.com/pagevà http://www.example.com/page/index.htm.
Sử dụng miền cấp cao nhất
- Để giúp chúng tôi cung cấp phiên bản phù hợp nhất của tài liệu, hãy sử dụng miền cấp cao nhất bất cứ khi nào có thể để xử lý nội dung theo quốc gia cụ thể.
- Chúng tôi có nhiều khả năng biết http://www.example.de ví dụ như chứa nội dung tập trung vào Đức hơn là http://www.example.com/de hoặc http://de.example.com.
Cung cấp một cách cẩn thận
- Nếu bạn cung cấp nội dung của mình trên các trang web khác, Google sẽ luôn hiển thị phiên bản mà chúng tôi nghĩ là phù hợp nhất cho người dùng trong mỗi tìm kiếm nhất định, có thể có hoặc không phải phiên bản bạn muốn. Tuy nhiên, sẽ hữu ích khi đảm bảo rằng mỗi trang web mà nội dung của bạn được cung cấp bao gồm một liên kết quay lại bài viết gốc của bạn. Bạn cũng có thể yêu cầu những người sử dụng tài liệu do bạn cung cấp sử dụng noindex thẻ để ngăn các công cụ tìm kiếm lập chỉ mục phiên bản nội dung của họ.
Giảm thiểu sự lặp lại bản soạn sẵn
- Ví dụ: thay vì bao gồm văn bản bản quyền dài dòng ở cuối mỗi trang, hãy bao gồm một bản tóm tắt rất ngắn gọn và sau đó liên kết đến một trang có nhiều chi tiết hơn. Ngoài ra, bạn có thể sử dụng công cụ Xử lý tham số để chỉ định cách bạn muốn Google xử lý các tham số URL.
>> Xem đầy đủ: Kiến thức SEO
Tránh xuất bản các trang trống
- Người dùng không thích nhìn thấy các trang "trống", vì vậy hãy tránh các trang giữ chỗ nếu có thể. Ví dụ: không xuất bản các trang mà bạn chưa có nội dung thực. Nếu bạn tạo các trang giữ chỗ, hãy sử dụng noindex thẻ để chặn lập chỉ mục các trang này.
Hiểu hệ thống quản lý nội dung của bạn
- Đảm bảo rằng bạn đã quen với cách hiển thị nội dung trên trang web của mình. Các blog, diễn đàn và các hệ thống liên quan thường hiển thị cùng một nội dung ở nhiều định dạng. Ví dụ: một mục blog có thể xuất hiện trên trang chủ của blog, trong trang lưu trữ và trong một trang gồm các mục khác có cùng nhãn.
Giảm thiểu nội dung tương tự
- Nếu bạn có nhiều trang giống nhau, hãy xem xét mở rộng từng trang hoặc hợp nhất các trang thành một. Ví dụ: nếu bạn có một trang web du lịch với các trang riêng biệt cho hai thành phố, nhưng thông tin giống nhau trên cả hai trang, bạn có thể hợp nhất các trang thành một trang về cả hai thành phố hoặc bạn có thể mở rộng mỗi trang để chứa nội dung duy nhất về mỗi thành phố.
- Google không khuyên bạn nên chặn quyền truy cập của trình thu thập thông tin vào nội dung trùng lặp trên trang web của bạn, cho dù bằng tệp robots.txt hay các phương pháp khác. Nếu các công cụ tìm kiếm không thể thu thập dữ liệu các trang có nội dung trùng lặp, chúng không thể tự động phát hiện rằng các URL này trỏ đến cùng một nội dung và do đó hiệu quả sẽ phải coi chúng là các trang riêng biệt, duy nhất.
- Giải pháp tốt hơn là cho phép các công cụ tìm kiếm thu thập dữ liệu các URL này, nhưng đánh dấu chúng là trùng lặp bằng cách sử dụng rel="canonical"phần tử liên kết, công cụ xử lý tham số URL hoặc chuyển hướng 301. Trong trường hợp nội dung trùng lặp dẫn đến việc chúng tôi thu thập dữ liệu quá nhiều trang web của bạn, bạn cũng có thể điều chỉnh cài đặt tốc độ thu thập dữ liệu trong Search Console.
- Nội dung trùng lặp trên một trang web không phải là cơ sở để hành động trên trang web đó trừ khi có vẻ như mục đích của nội dung trùng lặp là để lừa đảo và thao túng kết quả của công cụ tìm kiếm. Nếu trang web của bạn gặp vấn đề về nội dung trùng lặp và bạn không tuân theo lời khuyên được liệt kê ở trên, chúng tôi sẽ thực hiện tốt việc chọn phiên bản nội dung để hiển thị trong kết quả tìm kiếm của mình.
>> Xem thêm khóa học đào tạo seo tại đây: https://chuyennghiep.vn/dao-tao-seo