Dành cho quản trị viên web: Trung cấp đến nâng cao
Việc bao gồm liên kết rel=canonical trong trang web của bạn là một cách gợi ý cho các công cụ tìm kiếm biết về phiên bản ưu tiên nên được lập chỉ mục trong số các trang trùng lặp trên web. Liên kết này được hỗ trợ bởi một số công cụ tìm kiếm, bao gồm Yahoo!, Bing và Google. Liên kết rel=canonical tổng hợp các sản phẩm lập chỉ mục từ các trang trùng lặp, chẳng hạn như liên kết đến của chúng, cũng như chỉ ra URL bạn muốn được hiển thị trong kết quả tìm kiếm. Tuy nhiên, rel=canonical có thể khá phức tạp vì bạn không thể biết rõ khi cấu hình bị sai.
Tuy quản trị viên thấy trang "red velvet" ở bên trái trong trình duyệt của họ, các công cụ tìm kiếm lưu ý về rel=canonical "blue velvet" không chủ định của quản trị viên web ở bên phải.
Chúng tôi khuyên bạn đề xuất các phương pháp hay nhất để sử dụng rel=canonical sau đây:
● Một phần lớn nội dung trên trang trùng lặp nên có trong phiên bản chuẩn.
Một thao tác kiểm tra là tưởng tượng rằng bạn không hiểu ngôn ngữ của nội dung—nếu bạn đặt trang trùng lặp cạnh trang chuẩn, một tỷ lệ lớn các từ trên trang trùng lặp có xuất hiện trên trang chuẩn không? Nếu bạn cần phải nói ngôn ngữ đó mới biết được hai trang giống nhau; ví dụ: nếu chúng chỉ giống nhau về chủ đề nhưng không quá giống về từ ngữ, trang chuẩn có thể bị công cụ tìm kiếm bỏ qua.
● Kiểm tra kỹ để đảm bảo rằng đích rel=canonical của bạn có tồn tại (không phải lỗi hay “soft 404”)
● Xác minh rằng đích rel=canonical không chứa thẻ meta robot ngăn lập chỉ mục
● Đảm bảo rằng bạn chọn URL rel=canonical được hiển thị trong kết quả tìm kiếm (thay vì URL trùng lặp)
● Bao gồm liên kết rel=canonical trong phần <head> của trang hoặc tiêu đề HTTP
● Chỉ định không quá một rel=canonical cho mỗi trang. Khi chỉ định nhiều hơn một rel=canonical, tất cả chúng đều sẽ bị bỏ qua.
Sai lầm 1: rel=canonical đến trang đầu tiên trong loạt được phân trang
Tưởng tượng rằng bạn có một bài báo trên vài trang:
● example.com/article?story=cupcake-news&page=1
● example.com/article?story=cupcake-news&page=2
● và tiếp tục
Việc chỉ định rel=canonical từ trang 2 (hay bất kỳ trang nào sau đó) đến trang 1 không phải là cách đúng để sử dụng rel=canonical, vì đây không phải là các trang trùng lặp. Việc sử dụng rel=canonical trong trường hợp này sẽ dẫn đến việc nội dung trên trang 2 và các trang sau đó không hề được lập chỉ mục.
Nội dung tốt (ví dụ: “bánh cookie không có dinh dưỡng tốt” và “đến rau củ”) bị mất khi chỉ định rel=canonical từ các trang thành phần đến trang đầu tiên trong loạt trang.
rel=canonical từ các trang thành phần đến trang xem toàn bộ
Nếu rel=canonical đến một trang xem toàn bộ không được chỉ định, nội dung được phân trang có thể sử dụng đánh dấu rel=”prev” và rel=”next”.
Sai lầm 2: URL tuyệt đối bị viết nhầm thành URL tương đối
Thẻ <link> tag, cũng như nhiều thẻ HTML, chấp nhận cả URL tương đối và tuyệt đối. URL tương đối bao gồm đường dẫn "tương đối" đến trang hiện tại. Ví dụ: “images/cupcake.png” nghĩa là “từ thư mục hiện tại hãy đến thư mục con “images” và sau đó đến cupcake.png.” URL tuyệt đối chỉ định đường dẫn đầy đủ—bao gồm giao thức như http://.
Việc chỉ định <link rel=canonical href=“example.com/cupcake.html” /> (một URL tương đối vì không có “http://”) ngụ ý rằng URL chuẩn mong muốn là http://example.com/example.com/cupcake.html ngay cả khi đó gần như chắc chắn là URL chuẩn chủ định. Trong các trường hợp này, thuật toán của chúng tôi có thể bỏ qua rel=canonical được chỉ định. Cuối cùng điều này nghĩa là bất kỳ điều gì bạn mong đạt được với rel=canonical này sẽ không thành hiện thực.
Sai lầm 3: rel=canonical ngoài ý muốn hoặc khai báo nhiều rel=canonical
Đôi khi, chúng tôi thấy các chỉ định rel=canonical mà chúng tôi tin là ngoài ý muốn. Trong các trường hợp rất hiếm chúng tôi thấy cả các lỗi chính tả đơn giản, nhưng trường hợp thường gặp hơn là một quản trị viên web bận rộn sao chép mẫu trang mà không nhớ đến việc thay đổi đích của rel=canonical. Giờ các trang của chủ sở hữu trang web sẽ chỉ định rel=canonical đến trang web của chủ sở hữu mẫu.
Nếu sử dụng mẫu, hãy kiểm tra để đảm bảo rằng bạn cũng không sao chép chỉ định rel=canonical.
Một vấn đề khác là khi các trang bao gồm nhiều liên kết rel=canonical đến các URL khác nhau. Điều này thường xảy ra với các plugin SEO thường chèn liên kết rel=canonical mặc định, và quản trị viên web đã cài đặt plugin có thể không biết đến điều này. Trong trường hợp có nhiều khai báo rel=canonical, Google có thể sẽ bỏ qua tất cả gợi ý rel=canonical. Bất kỳ lợi ích nào mà rel=canonical hợp lệ có thể mang lại sẽ bị mất.
Trong cả hai loại trường hợp này, việc kiểm tra kỹ mã nguồn của trang sẽ giúp khắc phục vấn đề. Đảm bảo kiểm tra toàn bộ phần <head> vì liên kết rel=canonical có thể được trải ra.
Kiểm tra hành vi của plugin bằng cách xem mã nguồn của trang.
Sai lầm 4: Danh mục hoặc trang đích chỉ định rel=canonical đến một bài viết nổi bật
Giả sử bạn điều hành một trang web về đồ tráng miệng. Trang web đồ tráng miệng của bạn có các trang danh mục hữu ích như "bánh mỳ ngọt" và "kem gelato". Mỗi ngày trang danh mục lại có một bài viết riêng nổi bật. Ví dụ: trang đích bánh mỳ ngọt của bạn có thể có bài nổi bật về "bánh cupcake red velvet." Vì trang danh mục "bánh mỳ ngọt" gần như có toàn bộ nội dung giống với trang "bánh cupcake red velvet," bạn sẽ thêm rel=canonical từ trang danh mục đến bài viết riêng nổi bật.
Nếu chúng tôi chấp nhận rel=canonical này thì trang danh mục bánh mỳ ngọt của bạn sẽ không xuất hiện trong kết quả tìm kiếm. Đó là vì rel=canonical cho biết rằng bạn muốn công cụ tìm kiếm hiển thị URL chuẩn thay vì trang trùng lặp. Tuy nhiên, nếu bạn muốn người dùng có thể tìm được cả trang danh mục và bài viết nổi bật, điều tốt nhất nên làm là chỉ sử dụng rel=canonical tự tham chiếu trên trang danh mục hoặc không sử dụng rel=canonical.
Hãy nhớ rằng chỉ định trang chuẩn cũng ngụ ý chỉ ra URL chuẩn ưu tiên. Hãy tránh thêm rel=canonical từ trang danh mục hay trang đích đến một bài viết nổi bật.
Sai lầm 5: rel=canonical trong <body>
Thẻ liên kết rel=canonical chỉ nên xuất hiện trong phần <head> của một tài liệu HTML. Ngoài ra, để tránh các vấn đề phân tích cú pháp HTML, bạn nên bao gồm rel=canonical sớm hết mức có thể trong phần <head>. Khi chúng tôi bắt gặp chỉ định rel=canonical trong phần <body>, chỉ định này bị bỏ qua.
Đây là một sai lầm dễ khắc phục. Chỉ cần kiểm tra kỹ để đảm bảo rằng liên kết rel=canonical của bạn luôn nằm trong phần <head> của trang và sớm hết mức có thể.
chỉ định rel=canonical trong phần <head> được xử lý, không phải <body>.
Kết luận
Để tạo các chỉ định rel=canonical có giá trị:
● Xác minh rằng phần lớn nội dung văn bản chính của một trang trùng lặp cũng xuất hiện trên trang chuẩn.
● Kiểm tra để đảm bảo rằng rel=canonical chỉ được chỉ định một lần (nếu được chỉ định) và trong phần <head> của trang.
● Kiểm tra để đảm bảo rằng rel=canonical trỏ đến một URL hiện có với nội dung tốt (nghĩa là không phải 404 hay tệ hơn là 404).
● Tránh chỉ định rel=canonical từ trang đích hay trang danh mục đến bài viết nổi bật vì điều đó sẽ làm cho bài viết nổi bật trở thành URL ưu tiên trong kết quả tìm kiếm.
Và, như thường lệ, hãy đặt bất kỳ câu hỏi nào trong Diễn đàn quản trị trang web của chúng tôi.
Được viết bởi Allan Scott, Kỹ sư phần mềm, nhóm Lập chỉ mục