Duplicate Content- Teil1: Mehr ist nicht immer besser

Duplicate Content (zu deutsch: doppelter oder duplizierter Inhalt) beschreibt die Problematik, dass identische Textinhalte auf verschiedenen Webseiten zu finden sind. Für Suchmaschinen ist dies gleich aus mehrfacher Sicht ein Dorn im Auge und kann dazu führen, dass die betroffenen Webseiten im Ranking herabgestuft werden.


Duplicate Content im Detail

Grundsätzlich wird Duplicate Content dadurch definiert, dass der gleiche textuelle Seiteninhalt unter mehr als einer URL verfügbar ist. Ein typisches Beispiel dafür sind Webseiten, die sowohl mit als auch ohne die Eingabe von "www." aufrufbar sind (mit-oder-ohne-www-Problematik). Bei vielen Webhostern ist das leider noch standardmäßig der Fall.

Duplicate Content durch www- und nicht-www-Erreichbarkeit 

Duplicate Content betrifft aber nicht nur exakt gleiche Textinhalte, sondern auch solche, die sich in weiten Teilen gleichen.

Beispiel: Würde man einen Artikel von Wikipedia kopieren und diesen auf der eigenen Webseite erneut veröffentlichen, so wäre zwar der Artikel selbst gleich, aber die Navigation, der Header und der Footer (also das Layout) wären unterschiedlich. In diesem Falle läge also kein exaktes Duplikat, sondern nur eine starke Ähnlichkeit vor, die aber dennoch von Google als Duplicate Content erkannt wird. Diesen Sonderfall bezeichnet man auch als Near Duplicate Content.

Near Duplicate Content durch abweichendes Layout 

Auswirkungen

Suchmaschinen versuchen, Duplicate Content weitestgehend zu vermeiden. Das hat zwei Hintergründe:

1. Es ist für einen Suchenden nicht hilfreich, wenn er auf der ersten Ergebnisseite zehn Ergebnisse von unterschiedlichen Webseiten angezeigt bekommt, die jedoch letztendlich alle den gleichen Inhalt haben. Deshalb werden duplizierte Inhalte meist gar nicht in den Index aufgenommen.

2. Duplizierte Inhalte haben wirtschaftliche Nachteile für Suchmaschinen. Suchmaschinen crawlen das Internet mit ihren Webcrawlern und müssen dazu riesige Serverfarmen unterhalten. Auch duplizierte Inhalte müssen zunächst gecrawlt werden, obwohl sie letztendlich gar nicht in den Index aufgenommen werden. Für Suchmaschinen werden dadurch wertvolle Ressourcen verschwendet.

In Folge dessen kann es dazu kommen, dass Webseiten, die zu einem großen Teil aus duplizierten Inhalten bestehen, von Suchmaschinen abgestraft werden. Das kann sich zum Beispiel darin äußern, dass Google die Crawling-Frequenz herabsetzt (neue Seiten also nicht mehr oder nur noch sehr langsam in den Index aufgenommen werden) oder dass es generell zu Rückstufungen in den Suchmaschinenergebnissen kommt.


Typische Fälle von Duplicate Content

Neben der bereits erwähnten mit-oder-ohne-www-Problematik haben sich verschiedene Fälle von Duplicate Content "etabliert", die immer wieder auftreten. Die häufigsten werden im Anschluss kurz angeführt.


Druckversionen und Versionen für mobile Geräte

Eine Webseite ist nur bedingt für den Druck geeignet, da sie häufig für den Druck unnötige Informationen enthält (Navigation, Footer, etc.). Aus Usability-Sicht ist es deshalb sinnvoll, eine gesonderte Druckversion bereitzustellen. Diese muss aufrufbar sein und demnach eine eigene URL besitzen. Letztendlich hat sie aber den gleichen Inhalt wie die Nicht-Druckversion, sodass eine Near- Duplicate Content Situation entsteht. Das gleiche Problem ergibt sich bei Homepages, die spezielle, für mobile Endgeräte optimierte Versionen einer Webseite zur Verfügung stellen, sofern diese den gleichen Inhalt wie die Web-Versionen besitzen.


Navigationsstrukturen

Bei Webseiten mit mehrdimensionalen Navigationsstrukturen gibt es oft das Problem, dass eine Seite über unterschiedliche Pfade erreichbar ist. Insbesondere größere Online-Shops sind davon häufig betroffen. Ein Beispiel dazu:

http://www.example.com/shop/moebel/holztisch.html

http://www.example.com/shop/material/holz/holztisch.html

Der Usability-Gedanke steht hier im Vordergrund, da das Produkt “Holztisch” verschiedenen Kategorien zugeordnet ist und auch auf den unterschiedlichen Übersichtsseiten der Kategorien gelistet werden sollte. Dennoch handelt es sich letztendlich um die gleiche Unterseite, die lediglich auf verschiedenen Wegen zu erreichen ist.


Aggregierende Seiten

Viele Webseiten nutzen zur Organisationen ihrer Inhalte die Möglichkeit, Artikel in passenden Kategorien abzulegen. Dazu gibt es meist auch eine Kategorieübersichtsseite, in der alle Artikel aufgelistet werden. Diese Übersichtsseite besteht dann aber letztendlich nur aus Inhalten, die eigentlich zu eigenen Artikeln gehören. Dadurch entsteht wiederum eine Near-Duplicate Content- Situation.


Parameterübergaben

Einer URL können nach der Angabe des Pfades, eingeleitet durch ein Fragezeichen, Parameter übergeben werden. URLs mit gleichen Pfaden aber unterschiedlichen Parametern werden von Suchmaschinen trotzdem als eigenständige URLs gewertet.

Beispiel: Parameter werden zum Beispiel zur Identifizierung von sogenannten Sessions benutzt. Bei Benutzern, die Cookies deaktivieren, wird dabei die Session ID automatisch an jeden internen Link auf einer Webseite angehangen. Dadurch entstehen URLs wie beispielhaft in der folgenden Liste dargestellt:

- http://www.example.com/?sid=0011e714c078160254e7374a476ab188
- http://www.example.com/?sid=be30908222d1a60fd8cf7800cfcaa7c7
- http://www.example.com/?sid=e6948c99d871291d0abd4bdbf4d5c7eb

Jede dieser unterschiedlichen URLs hat den gleichen Inhalt, sodass Duplicate Content entsteht.


Zusammenfassung: Duplicate Content-Problem erkannt

In diesem Artikel wurde die Problematik von Duplicate Content vorgestellt. Neben der Definition des Begriffes wurde außerdem erläutert, warum Suchmaschinen Duplicate Content vermeiden wollen und welche Auswirkungen betroffene Webseiten erwarten könnten. Abschließend wurden diverse, häufig auftretende Fälle von Duplicate Content-Problemen exemplarisch vorgestellt.

In der nächsten Ausgabe wird an dieser Stelle angeknüpft. Es werden verschiedene Lösungsmöglichkeiten für Duplicate Content-Probleme im Detail erläutert und auf die hier aufgeführten Probleme bezogen.

 

 

 


 

Pascal LandauPascal Landau
Online-Marketing-Consultant bei TRG - The Reach Group. Er berät Kunden
mit dem Schwerpunkt Search Engine Optimization. Innerhalb der
Beratungstätigkeit entwickelt er Strategien für die Optimierung von
reichweitenstarken Webseiten im Onpage- und Offpage-Bereich. An der
Dualen Hochschule Baden-Württemberg studierte er Angewandte Informatik
und erwarb den akademischen Grad des Bachelor of Science. Weiterhin
betreibt er mit MySEOSolution.de seit 2010 eine erfolgreiche Webseite zum
Thema SEO, auf der er regelmäßig über Neuigkeiten aus dem Bereich der
Suchmaschinenoptimierung berichtet.
www.trg.de

 

 

Duplicate Content- Teil1: Mehr ist nicht immer besser

Jetzt Gratis Leseprobe anfordern

Sie bekommen die Leseprobe direkt per E-Mail zugesendet

und können sofort erste Insider-Tipps nutzen.

Gratis Leseprobe anfordern

Top-Themen der Ausgabe 05/2012

Seite 04: Guerilla-Marketing - Kreative Werbestrategien mit Low-Budget-Ideen

Seite 04: Guerilla-Marketing - Kreative Werbestrategien mit Low-Budget-Ideen

Ohne ein überzeugendes Werbekonzept ist es im Online-Handel kaum möglich, erfolgreich zu sein. Entsprechende Kampagnen sind allerdings meist kostspielig und dadurch den großen Anbietern vorbehalten. Ganz anders ist das beim sogenannten Guerilla-Marketing, denn hier zählt vor allem Kreativität. INTERNETHANDEL stellt Strategien und Kampagnen vor, bei denen auch mit kleinem Budget garantiert große Werbewirkung erzielt wird.

Seite 33: Duplicate Content- Teil 1: Mehr ist nicht immer besser

Seite 33: Duplicate Content- Teil 1: Mehr ist nicht immer besser

SEO-Experte Pascal Landau befasst sich in der Mai-Ausgabe INTERNETHANDEL mit der Problematik des Duplicate Content. Für Suchmaschinen sind identische Textinhalte auf verscheidenen Websites natürlich ein Dorn im Auge, daher können betroffene Seiten entsprechende Herabstufungen erwarten. Die genaue Definition, sowie häufig auftretende Fälle von Duplicate Content-Problemen werden hier detailliert vorgestellt.

Seite 37: Uhrenhandel - Tradition trifft Moderne

Seite 37: Uhrenhandel - Tradition trifft Moderne

Die Kombination von einem stationären Ladengeschäft und einem innovativen Web-Shop gehört im E-Commerce zu den ausgewiesenen Erfolgsmodellen. Die Firma Uhren-Klitsch-Schmuck OHG ist seit 1887 am Markt vertreten und hat seit 2006 auch das Internet erobert. INTERNETHANDEL hat mit Geschäftsführer Thomas Gäbe über das unternehmerische Konzept und die Erfolgsfaktoren gesprochen.

Seite 39: Von zuhause arbeiten: Online-Handel mit Uhren & Schmuck

Seite 39: Von zuhause arbeiten: Online-Handel mit Uhren & Schmuck

Viele Existenzgründungen basieren auf dem Wunsch, selbständig von zuhause aus zu arbeiten. Mit ihrem Internet-Angebot „Order and Smile“ stellt Claudia Bendfeld unter Beweis, dass dieses Konzept aufgeht, wenn man mit genügend Engagement ans Werk geht und seinen Prinzipien treu bleibt. Im Gespräch mit INTERNETHANDEL spricht die Unternehmerin über die Erfolgsfaktoren und die Zukunft ihres Unternehmens und wirft einen kritischen Blick auf eBay.

Seite 43: E-Commerce- und Fulfillment-Leistungen aus einer Hand

Seite 43: E-Commerce- und Fulfillment-Leistungen aus einer Hand

Selber abwickeln oder professionell auslagern? Diese Frage stellt sich in Bezug auf Fulfillment, IT-Strukturen und E-Payments für jeden Online-Händler. Qualifizierte Dienstleister haben sich auf Serviceleistungen für Internetunternehmer spezialisiert. Wir stellen ein führendes Unternehmen vor, das selbst für Zalando und brands4friends viele Arbeiten übernimmt.

Gratis Leseprobe anfordern