Was ist Duplicate Content?
Mit Duplicate Content oder doppeltem Inhalt wird in der Suchmaschinenoptimierung Content bezeichnet, der identisch auf mehr als einer Internetseite vorkommt. Wenn diese gleichen Inhalte über unterschiedliche URLs erreichbar sind, dann kann dies Google und die betreffenden Seitenbetreiber vor große Probleme stellen.
- Gleiche Inhalte sind über verschiedene URLs erreichbar und indexiert
- Wirkt sich meist negativ auf das SERP Ranking aus
- Sollte vom Seitenbetreiber unbedingt vermieden werden
Duplicate Content – Gefahren und Vermeidung
Duplicate Content ist ein wichtiges Thema für die Suchmaschinenoptimierung. Die Indexierung von Seiten mit doppeltem Inhalt kann sich auf das SERP Ranking negativ auswirken. Der Inhalt einer Webseite sollte stets nur über eine eindeutige Internetadresse erreichbar sein. Mehrfache Inhalte stellen Google und andere Suchmaschinen vor das große Problem, welche URL angezeigt werden soll und welche Rankingsignale welcher Adresse zugeordnet werden. Daher erweist sich Duplicate Content für die Webseitenbetreiber als gefährlich. Dabei sprechen wir nicht unbedingt nur von kopierten Texten, sondern auch über komplett identische Einzelseiten. Damit Websites keine Rankingprobleme bekommen, müssen sie ausreichend Unique Content haben, also Inhalte, die ausschließlich für diese eine Seite erzeugt wurden und auch nur auf dieser erscheinen. Es wird darüber hinaus noch unterschieden zwischen internem und externem Duplicate Content. Ersteres bedeutet, der gleiche Content ist auf einer Domain. Letzteres bedeutet, dass die entsprechenden Inhalte auf mehreren Domains existieren. Wenn Suchmaschinen auf Duplicate Content stoßen, gibt es Probleme. Denn dadurch werden Inhalte der jeweiligen Seite schlechter aufgefunden oder sogar ganz herausgefiltert. Googlebot & Co. mögen also keinen Duplicate Content. Erst recht, wenn davon zu viel auf Domains gefunden wird: Die Folgen sind in der Regel Abstrafungen wie das Zurücksetzungen im Ranking. Google muss sich schließlich entscheiden können, welche Webseite relevanter ist. Angestrebt wird für eine suchmaschinenoptimierte Seite der perfekte Score von 100% Unique Content, was in der Praxis natürlich nicht immer gelingt. Zur Vermeidung kann man am einfachsten einfach nach Textbausteinen suchen, um sicherzugehen. Doch selbst sehr ähnliche Seiten („Near Duplicate Content“) können gefährlich sein, auch wenn sie in der Regel ungewollt sind. Die grundlegendste Strategie in Bezug auf Vermeidung von Duplicate Content, ist diese doppelten Inhalte gar nicht erst entstehen zu lassen. Dies beginnt schon mit einer sauberen Crawlingsteuerung. Doppelte Inhalte gar nicht erst nicht verlinken, damit die Suchmaschinen wie Google sich nicht mit diesen herumschlagen müssen.
Duplicate Content in der Praxis
Wenn der doppelte Content aber bereits da ist, dann sollte im Idealfall per „301“ auf die gewollte Original URL direkt weiterleitet werden, womit die Webseite auch schlank und gesund bleibt. Duplicate Content hat übrigens viele Gesichter: Über Klein- und Großschreibung erreichbare URLs, zusätzliche PDFs mit Produktinfos, Produktdetailseiten, Parameter für Affiliate-URLs sowie vieles mehr. Oft ist es Duplicate Content, der für die User einen Nutzen hat. Solche Seiten können beibehalten werden, sollten jedoch auf die Original-URL per Canonical Link verweisen. Wer Duplicate Content hat, die über die Suche gleichermaßen auffindbar sein soll, individualisiert diese Inhalte am besten. Dies gilt zum Beispiel für Produktbeschreibungen in Online Shops oder Serviceangebote, die sich immer wiederholen. Was wiederkehrende Textbausteine betrifft: Am besten minimieren! Kurze Zusammenfassungen mit Links zu detaillierteren Informationen sind hier die beste Lösung. Denn selbst einzelne kleinere Absätze, die auf vielen Seiten identisch vorkommen, sind für Google eine Art von Duplicate Content. Versandinformationen beispielsweise und ähnliche Dinge sind auch Duplicate Content, worauf Suchmaschinen empfindlich reagieren können. Externer Duplicate Content stellt Google vor die Entscheidung, was als Original angesehen werden soll, wenn gleiche Inhalten auf diversen Domains vorkommen. In der Regel ist dies die Webseite, auf welcher der Bot zuerst den jeweiligen Inhalt gefunden hat. Auch Quellenlinks und andere Signale können für Google & Co Indizien darstellen. Am besten und sichersten fährt immer derjenige, der einen Inhalt zuerst veröffentlicht. Dies kann beschleunigt werden, indem man die Indexierung sofort beantragt. Zitate sind kein großes Problem, wenn diese im Quellcode auch als solche gekennzeichnet sind.