Co to jest Canonical – Definicja
Canonical (link kanoniczny, rel=”canonical”, tag canonical URL) to jeden z tagów umieszczanych w nagłówku strony HTML. Dzięki niemu, w sytuacji gdy posiadamy np. ten sam produkt pod dwoma adresami URL, możemy wskazać robotom wyszukiwarek, która wersja powinna być indeksowana. Jest to skuteczna metoda redukującą problem duplikacji treści i informująca roboty wyszukiwarek, która z zduplikowanych stron zawiera oryginalną treść.
Stosowanie tagu canonical jest szczególnie istotne, gdy struktura witryny jest rozbudowana, a konieczne jest używanie wielu różnych adresów URL dla tej samej lub bardzo podobnej treści.
Jak prawidłowo umieścić canonical w kodzie?
Adnotacje rel=”canonical” link można dodać na dwa sposoby, przy czym nie zaleca się korzystania z obu tych form jednocześnie, ponieważ może to powodować błędy. W każdym razie, rel=”canonical” można osadzić w następujący sposób:
- Element rel=”canonical” link w kodzie HTML: Umieść element <link> z atrybutem rel=”canonical” w sekcji <head> duplikatów stron, aby wskazać stronę kanoniczną. Wówczas ma on postać np. <link rel=”canonical” href=”https://domena.pl/bluzy/” />
- Nagłówek HTTP rel=”canonical” – Możliwe jest określenie adresu kanonicznego dla zasobów, które nie są plikami HTML. W sytuacji, gdy treść pliku PDF jest identyczna lub bardzo zbliżona do pliku w innym formacie, możemy wskazać, że to właśnie plik PDF jest kanonicznym. W takiej sytuacji, w pliku o innym formacie możemy zwrócić nagłówek HTTP rel=”canonical”, który będzie wskazywał na plik PDF, co wygląda następująco:
HTTP/1.1 200 OK
Content-Length: 19
…
Link: <https://www.domena.pl/downloads/white-paper.pdf>; rel=”canonical”
…
W obu tych przypadkach, zaleca się używanie bezwzględnych adresów URL, a także zgodnie ze standardem RFC2616, powinno się używać tylko cudzysłowów podwójnych.
Jak Google traktuje canonicale?
Tag kanoniczny (rel=canonical) to kluczowa wskazówka dla robotów Google, informująca, że dany adres jest oryginalny i najbardziej reprezentatywny, co powinno być sugestią dla indeksacji. Należy jednak zaznaczyć, że dodane przez nas linki kanoniczne stanowią jedynie wskazówkę, którą roboty wyszukiwarki mogą (lub nie) uwzględniać. Dla przykładu, może zdarzyć się sytuacja, w której wyszukiwarka samodzielnie wyznacza inną stronę kanoniczną. Informacje na ten temat można znaleźć w Google Search Console:
W przypadkach, gdy roboty nie respektują naszej sugestii, konieczne jest zbadanie przyczyny tego zjawiska. Dla przykładu, może się tak wydarzyć w sytuacji, gdy w serwisie występują min. dwie strony o identycznej treści, które posiadają canonical wskazujący na siebie (czyli adres www.domena.pl/adres-1/ wskazuje na www.domena.pl/adres-1/ ), natomiast Google widząc, że ma do czynienia z duplikatem, musi wybrać jeden z nich, ignorując wskazanie canonicala.
Czy canonical pomaga z duplikacją treści?
Linki kanoniczne mają na celu zminimalizowanie problemu duplikacji treści, znanej jako „duplicate content”. Nierzadko wielu właścicieli stron internetowych nie zdaje sobie sprawy z istnienia poważnego problemu, jakim jest duplikacja wewnętrzna, która skutecznie utrudnia osiągnięcie wysokich pozycji w wynikach wyszukiwania.
Przykładem duplikacji wewnętrznej w sklepie internetowym mogą być np. wyniki filtrowania/sortowania produktów ponieważ generuje to adresy URL z parametrami, natomiast sama zawartość może nie ulegać większym zmianom. Wygląda to tak:
- https://sklep.pl/kategoria/bluzy – adres oryginalny (kanoniczny)
- https://sklep.pl/kategoria/bluzy?kolor=biale – adres z parametrem „kolor=biale”
- https://sklep.pl/kategoria/bluzy?material=welna – adres z parametrem „material=welna”
W przedstawionym przykładzie każda strona różni się jedynie listą produktów prezentowaną w listingu, przy czym nie muszą to być wielkie zmiany, np. asortyment składa się w głównej mierze z białych, wełnianych bluz, przez co nałożenie osobnych filtrów nie powoduje znacznych zmian na liście produktów. Aby zminimalizować ryzyko indeksowania takich adresów, konieczne jest określenie głównej strony kategorii jako kanonicznej, co umożliwi robotom Google uwzględnienie jedynie oryginalnej wersji. W kodzie strony oryginalnej powinno się także wprowadzić jej własny adres URL, aby wskazywał bezpośrednio na siebie (self-referencing canonical), czyli tag canonical na stronie https://sklep.pl/kategoria/bluzy powinien wskazywać na adres https://sklep.pl/kategoria/bluzy .
Źródło: https://developers.google.com/search/docs/crawling-indexing/consolidate-duplicate-urls?hl=pl
Daniel Magrian
Od 2016 roku związany z marketingiem internetowym. W tym czasie zdobył doświadczenie, które aktualnie wykorzystuje w codziennej pracy z klientem analizując wyniki i wdrażając działania optymalizacyjne maksymalizujące efektywność kampanii. W pracy nigdy się nie nudzi, a najbardziej motywują go sukcesy klientów.