Jednym z problemów powiązanych z wyszukiwarkami internetowymi, takimi jak Google jest duplicate content, czyli duplikacja treści. Pod pojęciem duplikacji należy rozumieć to, że podobna treść pojawia się w wielu miejscach (pod różnymi adresami URL) w sieci. Może to wpłynąć niekorzystnie na ranking strony internetowej, a problem pogarsza się gdy użytkownicy zaczną linkować do różnych wersji tej samej treści. Warto więc zapoznać się z różnymi przypadkami duplikacji treści oraz znaleźć rozwiązanie dla każdego z nich.
Duplikacja treści – co to takiego?
Powielona treść jest treścią dostępną pod wieloma adresami URL w sieci. Ze względu na to, że jeden adres pokazuje taką samą treść jak inne, wyszukiwarki nie wiedzą, który z tych adresów ma się znaleźć w rezultatach wyszukiwania. Warto przede wszystkim skupić się w głównej mierze na technicznych przyczynach duplikacji treści i rozwiązaniach tego problemu.
Duplikacja treści przypomina częściowo zatrzymanie się na skrzyżowaniu, gdzie drogowskazy wskazują dwa różne kierunki prowadzące do tego samego miejsca docelowego. Którą drogę należy więc wybrać? Czytelnikowi zależy jedynie na uzyskaniu odpowiedzi na zadane pytanie, ale wyszukiwarka musi wybrać którą stronę należy pokazać w rezultatach wyszukiwania, ponieważ oczywistym jest to, że nie chce ona pokazywać dwukrotnie tej samej treści.
Załóżmy, że artykuł dotyczący „słowa kluczowego x” pojawia się pod adresemi:
Taka sytuacja nie jest fikcją i zdarza się bardzo często w systemach zarządzania treścią CMS.
Następnie załóżmy, że artykuł został wybrany przez wielu blogerów i część z nich linkuje do pierwszego adresu URL, podczas gdy pozostali linkują do drugiego. W tym momencie problem wyszukiwarki pokazuje swoją prawdziwą naturę.
Powielona treść jest problemem, ponieważ wspomniane linki promują różne adresy URL. Gdyby wszystkie linki prowadziły do tego samego URL, wówczas wzrosłyby szanse na pozycjonowanie na frazę „słowo kluczowe X”.
Różne typy duplikacji treści
Istnieją dwa typy duplikacji treści:
- wewnętrzna duplikacja treści – występuje wtedy, gdy jedna główna domena tworzy powieloną treść w wielu wewnętrznych adresach URL (na tej samej stronie internetowej).
- Zewnętrzna duplikacja treści – znana również jako duplikacja między domenami, występuje wtedy, gdy dwie lub więcej różnych domen posiadają taką samą kopię strony zaindeksowaną przez wyszukiwarki internetowe.
Zarówno wewnętrzna, jak i zewnętrzna duplikacja treści może występować w formie dokładnej lub zbliżonej.
Dlaczego należy zapobiegać duplikacji treści na stronie?
Duplikacja treści wpływa negatywnie na ranking. Wyszukiwarki nie wiedzą bowiem, którą stronę zasugerować użytkownikom. Skutkiem tego wszystkie strony widziane przez wyszukiwarki jako duplikaty są w najlepszym przypadku zagrożone spadkiem pozycji w rankingu.
Jeśli problemy z duplikacją treści są bardzo poważne, na przykład tylko mała ilość własnej treści idzie w parze z treściami kopiowanymi słowo w słowo, wówczas można nawet spodziewać się działań ze strony Google w związku z próbą oszukania użytkowników. Jeśli treść ma osiągać wysoką pozycję, istotne jest upewnienie się, że każda strona oferuje odpowiednią ilość unikalnego contentu.
Nie jest to tylko problem wyszukiwarek. Jeśli użytkownicy poszukują określonej strony, może być frustrującym dla nich to, że nie mogą znaleźć to, czego szukają. W związku z tym, podobnie jak w wielu innych aspektach SEO, istotne jest zadbanie o rozwiązanie problemów z duplikacją treści po to, aby doświadczenia użytkowników były pozytywne.
Czy duplikacja treści jest niekorzystna pod względem SEO?
Oficjalnie Google nie nakłada kar za duplikację treści. Wyszukiwarka jednak filtruje identyczne treści o takim samym znaczeniu. Efektem tego może być pogorszenie pozycji stron w rankingu Google (pozycje w SERP-ie).
Duplikacja treści dezorientuje Google i zmusza wyszukiwarkę, którą z identycznych stron powinno się pozycjonować w czołowych rezultatach. Niezależnie od tego kto stworzył treść, istnieje duże prawdopodobieństwo, że oryginalna, pierwsza strona nie zostanie wybrana do pokazania w czołowych rezultatach.
Jest to jeden z powodów, dla których duplikacja treści jest zła pod względem SEO. Istnieją pewne inne oczywiste powody dlaczego powielona treść jest zła.
Jak sprawdzać stronę pod kątem duplikacji treści?
W przypadku posiadania stron bogatych w treść, które nie znajdują się wysoko w rankingach wyszukiwania, należy sprawdzić czy treść nie została skopiowana i wykorzystana na innej stronie internetowej. Można to zrobić na kilka sposobów.
Wyszukiwanie Exact Match
Kopiowanie kilku zdań treści z jednej ze swoich stron internetowych, które następnie należy opatrzyć w cudzysłów i wyszukać w Google. Stosując cudzysłów wskazuje się Google, że chce się otrzymać dokładnie taki tekst. Jeśli pojawia się wiele rezultatów, oznacza to, że ktoś skopiował daną treść.
Copyscape
Copyscape to darmowe narzędzie sprawdzające treść na stronie pod kątem jej powielenia na innych domenach. Jeśli tekst ze strony został skopiowany, wówczas naruszający ją adres URL pojawi się w rezultatach.
Identyfikacja problemów z duplikacją treści
Nie zawsze można mieć świadomość istnienia duplikacji na stronie lub w treści. Użycie Google jest jednym z najprostszych sposobów wykrywania powielonej treści.
Istnieje wiele operatorów wyszukiwania, które są pomocne w takich sytuacjach. Chcąc znaleźć wszystkie adresu URL swojej strony, które zawierają artykuł ze słowem kluczowym X, należy wpisać następujące hasło wyszukiwania w Google:
site:example.com intitle:”Słowo kluczowe X”
Google następnie pokaże podstrony na stronie example.com, które zawierają takie słowo kluczowe. Im bardziej konkretna będzie część intitle zapytania, tym łatwiej będzie odsiać powieloną treść. Tej samej metody można użyć do sprawdzenia duplikacji treści w sieci. Załóżmy, że tytułem artykułu było „Słowo kluczowe X – dlaczego jest doskonałe”. W takim przypadku należy szukać:
intitle:”Słowo kluczowe X – dlaczego jest doskonałe”
Google przedstawi wszystkie strony pasujące do tego tytułu. Czasami warto nawet sprawdzać strony pod kątem jednego lub dwóch pełnych zdań z artykułu, ponieważ niektórzy kopiujący mogą zmienić tytuł. W pewnych przypadkach, robiąc takie poszukiwania, Google może wyświetlić powiadomienie na ostatniej stronie z rezultatami.
Praktyczne rozwiązania w zakresie duplikacji treści
Po zdecydowaniu, który adres URL jest kanonicznym URL treści, należy rozpocząć ten proces. Oznacza to, że należy poinformować wyszukiwarki o kanonicznej wersji strony i pozwolić im jak najszybciej ją znaleźć.
Unikanie duplikacji treści
Niektóre z powyższych przyczyn można dość łatwo naprawić:
- Czy w adresach URL znajdują się ID sesji?
Są one zwykle wyświetlane w ustawieniach systemu.
- Czy stosowana jest paginacja komentarzy w WordPress?
Należy dezaktywować tę funkcję.
- Czy pojawiają się problemy związane z prefiksem WWW i jego brakiem?
Należy wybrać jedną z opcji i trzymać się jej poprzez przekierowanie.
- Czy w serwisie zablokowana jest indeksacja adresów z query stringiem?
Warto nieindeksować adresów związanych z filtrowaniem, sortowaniem czy wewnętrzną wyszukiwarką. Chyba, że mamy jakiś konkretny cel, aby taki twór istniał w indeksie.