Was bedeutet „Duplicated Content“? Wie wird er von Google bewertet? Und was hat es mit dieser ominösen „Canonical URL“ auf sich? Diesen Fragen bin ich einmal intensiv nachgegangen und möchte euch das Ergebnis meines internen Denkprozesses nicht vorenthalten.
Zuerst einmal muss man wissen: Google ist nicht böse. Google will nur alles wissen, denn Google möchte dem jeweiligen Suchenden das für ihn bestmögliche, also relevanteste Ergebnis präsentieren.
Happy User, happy Google
Es ist die Aufgabe jedes Redakteurs und Website-Admin, Google bei der Entscheidungsfindung, was denn nun das beste Suchergebnis für den Nutzer ist, zu unterstützen. Deshalb ist es unabdingbar, dass man sich mit SEO (Search Engine Optimization) und SRO (Smart Relevance Optimzation) beschäftigt. Denn nur damit kann ich Google sagen:
„Hey Google, nimm doch meine Website, die passt wunderbar auf die Suchanfrage des Nutzers“
Und genau hier muss man sich auch mit doppeltem Inhalt, also Duplicated Content beschäftigen. Denn dieser verwirrt Google, weil es nicht weiß, welche Seite nun besser zum Nutzer passt: A oder B oder C. Nun, im Zweifelsfalls denkt sich der Suchmaschinenriese: „Gar keine, denn wenn ich es schon nicht weiß, wie soll es dann der Nutzer wissen“ und straft die Seiten mit kopiertem Inhalt einfach ab.
Das wäre dann Tor D und für den Webseitenbetreiber der Zonk.
Also muss man tunlichst Sorge dafür tragen, dass die Suchmaschine gar nicht erst ins Zweifeln kommt, sondern eindeutige Signale aussenden, die Klarheit schaffen.
Doch fangen wir erst einmal bei der Definition von doppelten Inhalten an.
Erklärung zu duplicated Content?
„Mit doppelten Inhalten ist gemeint, dass Inhalte gefunden wurden, die über mehrere URLs erreichbar sind. Dieser sog. Duplicate Content sollte unbedingt vermieden werden. Der Inhalt einer Seite darf immer nur über eine eindeutige URL erreichbar sein. Ansonsten stellt man Google vor das Problem, welche der URLs in den Rankings angezeigt werden soll und welche positiven Rankingsignale welcher URL zugeordnet werden.“, sagt Sistrix.
Damit sind aber weder Zitate noch zitierte Textpassagen gemeint, solange diese korrekt semantisch ausgezeichnet sind. Es geht um identische Inhalte auf mehreren Seiten, der somit auch über mehrere URLs gefunden werden kann. „Viele Wege führen nach Rom“ ist in dem Fall eher ein zweischneidiges Schwert, weil es nur einen Weg geben darf.
Sowohl bei komplett identischen Inhalten auf mehreren Webseiten als auch bei nahezu identischen Inhalten ist das der Fall (Near Duplicate Content). Es gibt dabei zwei Varianten:
- Eine einzige Website ist über mehrere URLs erreichbar, z.B. bei Online Shops
- Der Inhalt einer Website ist auf mehreren Seiten identisch, z.B. bei einer Seite für die Desktop-Anzeige und einer identischen für die mobile Anzeige oder auch bei Druckversionen einer Website.
In beiden Fällen verweisen unterschiedliche URL auf den gleichen Inhalt. Dieses Phänomen kann sich sowohl zwischen Seiten derselben Domain (Interner Duplicated Contet) als auch zwischen Websites unterschiedlicher Domain (Externer Duplicated Content) abspielen. Das macht für die Suchmaschinen keinen Unterschied, solange die Seiten indexiert sind und im Index landen.
Soweit so gut. Nur wie mache ich Google klar, welches die Kopie und welches die originale Seite ist?
Die Canonical URL
Canonical = kanonisch = vorrangig
Mit dieser Auszeichnung sage ich der Suchmaschine, welches die Original-URL ist. Damit kann Google nun einschätzen, welche Seite besser platziert sein muss, denn die Kopie darf nie besser gestellt sein als das Original.
Im Regelfall setzt man diesen „Tag“ ein, wenn zwingend getrennte Seiten erforderlich sind.
Sehr einfach geht das über das ultimative SEO Plugin von Yoast, welches ich generell für das beste SEO-Plugin für WordPress halte:
Wird die Nutzung verschiedener URL für ein und denselben Inhalt jedoch vom Server verlangt oder hat strukturelle Hintergründe, dann kann man sich auch mit einer permanenten Weiterleitung (301) behelfen. Wie das geht, ist vielerorts beschrieben, z.B. bei seo-summary.de
Beispiele:
Erreichbarkeit unter https / http / www / ohne www
Verwendung von Kategorien und TagClouds
Produktseiten in Online Shops
- http://www.onlineshop-domain.com/kategorie/produktseite/produktdetailseite
- http://www.onlineshop-domain.com/produktdetailseite
(Quelle: Sistrix)
Nun werdet ihr euch fragen, ob man denn nun jede Seite einzeln kontrollieren muss? Ein ganz klares „Jein“ dazu J denn es gibt wie überall Tools, die einem die Arbeit abnehmen. Auch hier seo-summary.de eine schöne Übersicht zusammengestellt, denn man muss nicht immer für Tools bezahlen: Übersicht SEO Tools
Ich habe das beispielsweise mal mit Seobility gemacht und siehe da, ich muss auch auf 6 Seiten aktiv werden.
Mit ein wenig Aufwand und etwas Konsequenz kann man also dem Duplizier-Wahn Herr werden!
Weitere interessante Quellen zu dem Thema:
https://support.google.com/webmasters/answer/66359?hl=de
http://www.seo-trainee.de/was-ihr-ueber-duplicate-content-wissen-muesst/
https://moz.com/learn/seo/duplicate-content