Czym jest Duplicate Content - Definicja w słowniku SEOCzym jest Duplicate Content?

Duplicate Content, czyli duplikat treści, odnosi się do sytuacji, w której tą samą lub bardzo podobną treść możemy znaleźć pod różnymi adresami URL. Duplicate Content może występować zarówno w obrębie jednej witryny (duplikacja wewnętrzna) jak i w obrębie kilku witryn (duplikacja zewnętrzna).

Skutki duplikacji treści dla SEO

Kopiowanie treści w negatywny sposób wpływa na widoczność, ruch i pozycję całej witryny. Wyszukiwarki internetowe, starają się rozpoznać i odpowiednio zareagować na duplikaty treści, w przypadku występowania wielu duplikatów mogą napotkać problem z określeniem, która ze stron oferuje najbardziej jakościową i wartościową dla użytkowników treść, w rezultacie wszystkie ze stron znajdą się na niższych pozycjach na stronie wyników wyszukiwania. Duplikacja treści może prowadzić także do zmniejszenia wiarygodności całej domeny przez użytkowników. Natrafiając na tą samą treść na różnych witrynach w sieci lub na różnych podstronach w obrębie jednego serwisu mogą poczuć się zdezorientowani i sfrustrowani brakiem możliwości znalezienia oryginalnych i wartościowych informacji.

W rzadkich przypadkach duplikacja treści może doprowadzić do nałożenia kary przez Google w postaci usunięcia strony z indeksu wyszukiwarki. Sytuacja ta jest rzadka, jednak nie niemożliwa.

Duplikacja zewnętrzna – przyczyny

Jedną z najprostszych i najbardziej powszechnych przyczyn występowania duplikacji zewnętrznej jest powielanie opisów produktów ze stron producenta. Praktyka ta jest często spotykana w przypadku prowadzenia platform e-commerce, a jej przyczynami są najczęściej, poza brakiem świadomości szkodliwości tych działań, brak zasobów copywriterskich oraz finansowych do tworzenia nowych i unikatowych treści. Tworzenie nowych, oryginalnych opisów produktów wymaga czasu, wiedzy i kreatywności, właśnie dlatego właściciele stron internetowych często decydują się kopiowanie gotowych opisów ze stron producenta, który udziela na to zgody. Rozwiązanie to jest o wiele szybsze i tańsze niż zatrudnianie copywritera, który stworzy nowe, unikatowe treści, jednak szybkość tego rozwiązania nie idzie w parze ze skutecznością. Warto jednak podkreślić, że nie oznacza to, że sklep importujący opisy ze stron producenta nie może osiągnąć dobrych wyników w SEO – niejednokrotnie można spotkać się z sytuacją, w której produkty z takimi opisami świetnie radzą sobie w Google. Jednak wszystko zależy od indywidualnego przypadku i jeśli w sklepie występują tysiące produktów, często koszt stworzenia opisów dla (przynajmniej) większości produktów byłby nieporównywalnie wyższy niż płynące z tego korzyści.

Do duplikacji zewnętrznej nierzadko dochodzi również w wyniku kradzieży treści, czyli umieszczania na stronie opisów, zdjęć etc. bez wcześniejszej zgody ich autora. Praktyka ta stanowi naruszenie praw autorskich, których autor i właściciel skradzionych treści będzie mógł dochodzić na drodze sądowej.

Duplikacja wewnętrzna – przyczyny

Duplikacja wewnętrzna często powstaje na stronach paginacji gdzie tekst powinien zostać umieszczony jedynie na pierwszej stronie, często jednak system zawodzi i działa tak, że powiela opis na każdej z podstron danej kategorii produktów. Podobnie działa to w przypadku stosowania filtrów oraz mechanizmu sortowania kategorii. Mechanizmy filtrowania i sortowania poprzez zastosowanie różnych kryteriów, takich jak cena, marka, rozmiar itp. pozwalają zawęzić i uporządkować wyniki na stronie, co jest bardzo przydatnym rozwiązaniem w przypadku dużych sklepów e-commerce, gdzie produkty na listingu można liczyć w setkach lub nawet tysiącach. Żeby jednak uniknąć duplikacji treści należy zastosować rozwiązanie, które umożliwi wyświetlanie opisu kategorii tylko raz, na głównym listingu. Niezależnie od tego, jakie filtry zostały zastosowane lub jakie kryteria sortowania zostały wybrane, opis kategorii nie powinien być powielany. Co warte podkreślenia – jeśli nie mamy planu budowania widoczności na stronach generowanych na bazie filtrów czy sortowania, często najlepszym rozwiązaniem będzie wykluczenie ich z indeksowania. Wówczas unikamy problemu duplikacji treści oraz powstawania stron o niskiej jakości (często mogą być to strony z pojedynczymi produktami, co może generować tzw. Thin content).

Inną, popularną przyczyną powstawania duplikacji wewnętrznej jest kopiowanie opisów w przypadku różnych wersji tego samego produktu. Właściciele sklepów internetowych często decydują się na skopiowanie identycznych opisów dla różnych wersji, zamiast tworzyć treści od zera. W ten sposób powielone zostają opisy na produktach, które przykładowo różnią się między sobą kolorem.

Prowadzi to nie tylko do duplikacji ale może również dezorientować użytkowników, przeglądając różne wersje danego produktu, przez identyczne opisy, stwierdzą brak różnic między nimi, w konsekwencji może to obniżyć ich skłonność do zakupu.

Narzędzia do wykrywania duplikatów treści

Najprostszym sposobem na wykrycie duplikatów danego tekstu jest wklejenie go w cudzysłowie w wyszukiwarce internetowej. W rezultacie wyszukiwarka pokaże wyniki zawierające dokładnie ten sam tekst, da to możliwość łatwego zidentyfikowania duplikatów na różnych stronach internetowych

Innym “ręcznym” sposobem analizy z pomocą wyszukiwarki internetowej jest skorzystanie z polecenia “site:”. Polecenie to pozwala nam na sprawdzenie podstron, które zostały zaindeksowane przez wyszukiwarkę i weryfikację, czy wśród z nich znajdują się przypadki duplikacji, metoda ta jednak najlepiej sprawdzi się w przypadku mniejszych serwisów, w przypadku większych platform, których liczbę podstron liczyć możemy w tysiącach, zadanie to należało będzie do mozolnych i z pewnością nie uda nam się wyłapać w ten sposób wszystkich przypadków duplikacji, wiele z nich zostanie po prostu przeoczonych.

Wykrycie duplikacji możliwe jest również w darmowym narzędziu Google Search Console udostępnianym przez Google właścicielom stron internetowych. W zakładce “Indeksowanie” -> “strony” znajdziemy informacje o błędach w indeksacji, gdzie powinny zainteresować nas trzy komunikaty:

  • „Duplikat, użytkownik nie oznaczył strony kanonicznej”,
  • „Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik”
  • “Alternatywna strona zawierająca prawidłowy tag strony kanonicznej”

Jednym z popularniejszych narzędzi umożliwiających sprawdzenie danej witryny pod kątem duplikacji treści jest crawler Screaming Frog. Narzędzie analizując całą witrynę zbiera informacje o duplikacji treści, nagłówków, meta tagów title i description oraz wskazuje konkretne, problematyczne adresy. Screaming Frog w sprawny sposób pozwala sprawdzić duplikację wewnętrzną w obrębie serwisu.

Innym przydatnym narzędziem jest Siteliner. Główną jego funkcją jest identyfikacja adresów URL, na których występuje duplikacja wewnętrzna treści. Narzędzie sprawdza, czy ta sama lub bardzo podobna treść pojawia się na różnych stronach w obrębie tej samej witryny. Dodatkowo, pokazuje procentową zawartość zduplikowanej treści na stronie, co pozwala na określenie skali problemu.

Do wykrycia duplikacji zewnętrznej możemy posłużyć się narzędziem Copyscape. Po wprowadzeniu adresu URL do analizy, Copyscape przeszukuje sieć w poszukiwaniu podobnych lub identycznych treści na innych stronach internetowych, jeżeli narzędzie wykryje przypadki duplikacji treści poda informacje o stopniu ich podobieństwa oraz wskaże konkretne adresy URL na których się one znajdują.

Jak zapobiegać duplikacji?

Podstawą zapobiegania duplikacji jest konsekwentne tworzenie nowych, unikalnych treści na stronę, które przyciągną uwagę nie tylko użytkowników ale też wyszukiwarek. Innym kluczowym aspektem jest dbanie o spójność adresów URL, konsekwentne stosowanie jednego formatu adresów URL, czy to z ukośnikiem na końcu czy bez, pomaga uniknąć powstawania duplikatów w obrębie serwisu.

W przypadku już występujących duplikatów należy zastosować rozwiązanie w postaci przekierowania 301 na prawidłowy adres URL lub linku kanonicznego wskazującego preferowaną wersję strony, o ile mówimy o dwóch podstronach o identycznej lub niemal identycznej treści – jeśli duplikacja dotyczyłaby wyłącznie części treści, wówczas canonical mógłby zadziałać wyłącznie jako wskazówka (czym de facto canonical jest), a nie sztywna wytyczna, przez co Google może go zignorować i zaindeksować oba adresy. Wówczas zdecydowanie skuteczniejszy jest noindex przypisany do jednej z podstron.

Monika Król - Specjalistka SEO
Autor wpisu

Monika Król

Z branżą SEO związana od 2022 roku, pierwsze doświadczenie zdobywała prowadząc działania organiczne na rynku polskim i zagranicznym. Stale dąży do doskonalenia i poszerzania swojej wiedzy. Stawia na połączenie SEO i UX aby osiągać najlepsze rezultaty dla swoich projektów. Prywatnie miłośniczka sportu, wypracowaną dzięki niemu dyscyplinę, determinację i umiejętność skupienia przenosi na grunt zawodowy.

0 komentarzy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Ten serwis wykorzystuje pliki cookies. Korzystanie z witryny oznacza zgodę na ich zapis lub odczyt wg ustawień przeglądarki. Polityka prywatności