Nếu bạn tìm hiểu về SEO nhưng chưa từng nghe qua về thẻ Canonical, thì đây sẽ là một bài viết bổ ích cho bạn. Bởi Canonical là một công cụ vô cùng quan trọng của SEO onpage. Hãy cùng APPNET tìm hiểu ngay nhé.
Canonical là gì?
Thẻ canonical (hoặc rel = canonical) là một đoạn mã HTML nhỏ giúp các công cụ tìm kiếm xác định phiên bản “chính” của trang từ phần còn lại của các trang giống hoặc rất giống với nó.
Trong SEO, thẻ canonical được sử dụng để cho Google biết phiên bản trang nào bạn muốn xuất hiện trong kết quả tìm kiếm, để củng cố giá trị liên kết từ các trang trùng lặp cũng như cải thiện việc thu thập thông tin và lập chỉ mục trang web của bạn.
Tại sao thẻ canonical lại quan trọng trong SEO?
Mục đích chính của thẻ canonical là cho các công cụ tìm kiếm biết trang nào là trang chính, phiên bản gốc và trang nào chỉ là các bản sao trông giống nhau.
Nói chung, các trang web thường chứa ít nhất một số trang được coi là trùng lặp – chúng hiển thị cùng một nội dung nhưng với các URL khác nhau.
Trong những trường hợp này, Google phải quyết định chọn trang nào cho mục đích lập chỉ mục và xếp hạng – nó sẽ không sử dụng tất cả các trang làm kết quả tìm kiếm vì tất cả chúng trông giống hệt nhau hoặc rất giống nhau.
Ví dụ, các trang sản phẩm thường không chỉ được hiển thị bởi 1 URL chính. Chúng cũng có thể được hiển thị với các tham số URL khác nhau thường được sử dụng (ví dụ: để sắp xếp, đơn vị tiền tệ, kích thước, v.v.)
Lưu ý: Hãy nhớ rằng Google coi thẻ canonical là một tín hiệu – không phải như một chỉ thị.
Hợp nhất xếp hạng trang
Thẻ canonical giúp hợp nhất giá trị liên kết (Xếp hạng trang) từ tất cả các trang trùng lặp thành một trang chính.
Các trang trùng lặp thường có thể nhận được các liên kết ngược từ các nguồn bên ngoài khác nhau – cho dù đó là các liên kết ngược từ các trang web ngẫu nhiên, người dùng trên các kênh social.
Do đó, các trang này tiếp nhận một phần giá trị liên kết từ phiên bản chính của trang – phiên bản mà bạn thực sự muốn xếp hạng dưới dạng kết quả tìm kiếm.
Giúp quản lý nội dung được cung cấp
Các thẻ canonical có thể cho công cụ tìm kiếm biết trang web nào chứa phiên bản gốc của nội dung và trang web nào chỉ xuất bản lại nó (hoặc cung cấp).
Nhiều chủ sở hữu trang web sử dụng các trang web khác để xuất bản nội dung của họ (cho mục đích quảng cáo hoặc các mục đích khác).
Trong trường hợp này, Google phải quyết định trang web nào là nguồn gốc của nội dung này và sẽ được hiển thị dưới dạng kết quả tìm kiếm và trang web nào chỉ quảng bá nội dung đó.
Thiết lập thẻ canonical trên các trang web bên ngoài này giúp giải quyết vấn đề này và quảng cáo phiên bản chính, gốc của trang trong Google Tìm kiếm .
Cải thiện việc thu thập thông tin
Thẻ canonical giúp các công cụ tìm kiếm như Google thu thập thông tin một cách hiệu quả các trang mà bạn thực sự muốn thu thập thông tin và lập chỉ mục – trái ngược với các bản sao hoàn toàn không nên thu thập thông tin.
Các trang trùng lặp làm lãng phí tài nguyên và thời gian của Google vì chúng không quan trọng cho mục đích thu thập thông tin hoặc lập chỉ mục.
Bằng cách chỉ định các trang chuẩn, Google sẽ tập trung nhiều hơn vào các trang quan trọng nhất và do đó tiết kiệm “ngân sách thu thập thông tin”.
Cách tối ưu thẻ Canonical Url chuẩn SEO
Sử dụng phiên bản miền chính xác ( HTTPS so với HTTP )
Mặc dù không bắt buộc, nhưng bạn nên thêm thẻ canonical trên một trang trỏ đến chính nó – ngay cả khi bạn không sử dụng thẻ canonical trên phần còn lại của các trang trùng lặp.
Việc sử dụng tính năng tự tham chiếu rel=canonical trên các trang chính, gốc cung cấp cho các công cụ tìm kiếm như Google một tín hiệu rõ ràng rằng chúng là phiên bản chuẩn.
Sử dụng URL tuyệt đối
Các URL tuyệt đối trong thẻ canonical có thể giúp bạn tránh những sai lầm không đáng có hoặc cách hiểu sai về các URL chuẩn bởi công cụ tìm kiếm (trái ngược với các URL tương đối).
URL tuyệt đối cũng phải bao gồm, https và dấu gạch chéo (nếu có thể).//www.
Sử dụng URL viết thường
Các công cụ tìm kiếm như Google có thể nhạy cảm về chữ hoa và chữ thường trong URL.
Do đó, việc sử dụng các chữ thường trong URL chuẩn có thể giúp bạn giữ được tính nhất quán và tránh các vấn đề trùng lặp trong mắt các công cụ tìm kiếm.
Một phương pháp hay, hãy thử sử dụng chữ thường trong các URL trên máy chủ của bạn cũng như áp dụng chúng cho các thẻ canonical.
Canonicalize bản sao tên miền chéo
Các thẻ canonical cũng có thể tham chiếu các trang chính của bạn từ các tên miền khác – không chỉ từ trang web của bạn.
Nếu bạn có nội dung trùng lặp xuất hiện trên các trang trên một trang web khác (ví dụ: bài đăng được đặt lại trên một số trang web tin tức), bạn nên:
- Sử dụng thẻ canonical tự tham chiếu trên trang gốc của bạn.
- Áp dụng thẻ canonical trên trang bên ngoài , tham chiếu đến thẻ ban đầu của bạn.
Những điều cần tránh khi sử dụng thẻ canonical
Nhiều tiêu chuẩn trên 1 trang
Hãy chú ý đến nhiều thẻ chính tắc có thể tình cờ xuất hiện trong HTML của một trang.
Mặc dù rất hiếm, nhưng việc có nhiều hơn 1 thẻ canonical trên một trang có thể tạo ra sự nhầm lẫn cho công cụ tìm kiếm và dẫn đến việc bỏ qua tín hiệu chuẩn này.
Tránh các quy tắc chuẩn đối với các trang không trùng lặp
Luôn đảm bảo rằng nội dung trên các trang trùng lặp và phiên bản chính của trang giống hệt nhau hoặc ít nhất là gần giống nhau khi áp dụng thẻ canonical.
Việc triển khai các thẻ canonical trên các trang hoàn toàn khác nhau có thể gây nhầm lẫn cho các công cụ tìm kiếm hoặc hoàn toàn bị bỏ qua.
Thẻ Canonical trên các trang được phân trang
Các trang được phân trang chứa nội dung bị phân mảnh trên nhiều trang khác nhau (ví dụ: phần bình luận trên trang web được chia thành các trang “1”, “2”, “3”).
Trong trường hợp này, bạn nên luôn sử dụng các thẻ canonical tự tham chiếu trên mỗi trang riêng lẻ – và không tham chiếu đến trang “1” từ phần còn lại của các trang được phân trang.
Không chặn canonicals qua robots.txt.
Bạn không bao giờ được chặn các URL có thẻ canonical bằng tệp robots.txt.
Robots.txt sẽ ngăn Google thu thập dữ liệu các trang trùng lặp – do đó, nó sẽ không thể thấy thẻ canonical tham chiếu đến phiên bản chính của trang. Hơn nữa, việc chặn các URL có chứa thẻ canonical cũng sẽ ngăn Xếp hạng trang được chuyển sang các phiên bản chính của bạn.
Không sử dụng canonical trong <body>
Các thẻ canonical phải luôn được áp dụng trong <head> phần của các trang của bạn – không phải ở bất kỳ vị trí nào khác trong tài liệu HTML. Google sẽ chỉ bỏ qua các thẻ canonical của bạn trong <body> phần này hoặc ở bất kỳ vị trí nào khác.
Tránh các vòng và chuỗi chuẩn
Bạn nên luôn cố gắng sử dụng các thẻ canonical tham chiếu trực tiếp đến trang chính để tránh các vòng lặp hợp quy (tương tự như các vòng chuyển hướng).
Ví dụ: Sử dụng thẻ canonical từ trang A đến trang B và sau đó từ trang B đến trang C sẽ tạo ra một chuỗi canonical có thể gây nhầm lẫn cho các công cụ tìm kiếm và lãng phí tài nguyên và thời gian của họ.
Kết luận
Qua bài viết này APPNET hi vọng mang lại cho bạn kiến thức bổ ích về thẻ Canonical, và cách tối ưu thẻ Canonical Url chuẩn SEO. Công dụng của nó cũng như cách để tránh các lỗi sai thường gặp khi sử dụng thẻ.
Các câu hỏi thường gặp
Canonical là gì
trong SEO, thẻ canonical được sử dụng để cho Google biết phiên bản trang nào bạn muốn xuất hiện trong kết quả tìm kiếm, để củng cố giá trị liên kết từ các trang trùng lặp cũng như cải thiện việc thu thập thông tin và lập chỉ mục trang web của bạn.
Tại sao thẻ canonical lại quan trọng trong SEO
Mục đích chính của thẻ canonical là cho các công cụ tìm kiếm biết trang nào là trang chính, phiên bản gốc và trang nào chỉ là các bản sao trông giống nhau. Trong những trường hợp này, Google phải quyết định chọn trang nào cho mục đích lập chỉ mục và xếp hạng - nó sẽ không sử dụng tất cả các trang làm kết quả tìm kiếm vì tất cả chúng trông giống hệt nhau hoặc rất giống nhau.
Cách tối ưu thẻ Canonical Url chuẩn SEO
• Sử dụng phiên bản miền chính xác ( HTTPS so với HTTP ) •Sử dụng URL tuyệt đối •Sử dụng URL viết thường •Canonical bản sao tên miền chéo