Was ist Duplicate Content? Definition & Bedeutung
Duplicate Content zählt zu den verbreiteten Problemen bei den Website-Betreibern. Dazu gehören alle doppelten oder auffallend ähnlichen Inhalte, die auf zwei und mehr Seiten im Internet auftauchen. Duplicate Content kann durch eine schlechtere Platzierung in den Suchergebnissen bei Google und Co. zu Nachteilen für dich führen. Deren Maschinen versuchen, ihren Nutzern stets einzigartige Texte zu bieten. Grundsätzlich unterscheidest du zwischen internem Duplicate Content, der auf einer Domain zu finden ist, und externen doppelten Inhalten auf verschiedenen Webseiten. Dabei handelt es sich keineswegs nur um bewusst kopierte Texte oder Textbausteine.
Wie kommt es zu Duplicate Content auf deiner Seite?
Die Ursachen für duplizierte Inhalte auf deiner eigenen Domain liegen häufig in der Organisation der Website. Interner Duplicate Content kommt dort beispielsweise zustande durch
- die Erreichbarkeit der Webseite über verschiedene URLs wie „http://beispiel.de“, „https://beispiel.de“, „https://www.beispiel.de“ oder „http://www.beispiel.de/“,
- inhaltlich gleiche Seiten zu Kategorien, deren Produkte sich lediglich in Farbe, Größe und Ausstattung unterscheiden,
- die Existenz weiterer Versionen deiner Seiten als Druckansicht mit eigenen URLs und
- automatisch durch vom verwendeten Content Management System (CMS) erstellte Archive oder von der Suchmaschine generierte Tag-Seiten.
Durch diese und zahlreiche weitere Gründe erhältst du auf beinahe jeder Domain doppelten Content in irgendeiner Form.
Externer Duplicate Content
Bei vom Urheber nicht genehmigten, bewusst duplizierten Inhalten in Form von Texten, Bildern oder Quellcodes droht dir rechtlicher Ärger. Obwohl sich die Strafverfolgung insbesondere bei im Ausland registrierten Domains vielfach als schwierig erweist, begibst du dich damit auf juristisches Glatteis. Daher solltest du Zitate von anderen Verfassern unbedingt kenntlich machen und die Herkunft der Fotos angeben.
Einige Autoren stellen ihre Inhalte anderen Webseitenbetreibern freiwillig zur Verfügung. So gelangen etwa deine Pressemitteilungen auf verschiedenen Portalen als externer Duplicate Content in den Umlauf. Als moderne Form des Newsletters verteilen zahlreiche Blogger ihre Textschnipsel über sogenannte RSS-Feeds im Netz. Schließlich nutzen Portale die aus deinem Onlineshop bereitgestellten Produktdaten für ihren Preisvergleich. Dadurch produzieren sie ebenfalls doppelte Inhalte.
Wie gehen Google und Co. mit Duplicate Content um?
Mithilfe moderner Programme, den sogenannten Webcrawlern wie Googlebot, durchforsten Suchmaschinen das gesamte Netz. Dabei erkennen sie auch doppelte Inhalte. Ein gewisses Maß an Duplicate Content akzeptieren sie grundsätzlich. In der Regel als unproblematisch erweisen sich beispielsweise häufig in Seitenleisten oder Fußzeilen verwendete und notwendige Textbausteine. Versuchst du dir allerdings mit Manipulationen Vorteile durch bessere Platzierungen zu verschaffen und anderen zu schaden, riskierst du eine Rückstufung beim Ranking. Schlimmstenfalls zeigt Google bei gezielten Verstößen deine komplette Seite nicht mehr an. Meist erkennen die ausgeklügelten Algorithmen der Suchmaschinen den eigentlichen Urheber der Inhalte. Probleme bereiten dir Google und andere allerdings, wenn sie immer wieder auf Duplicate Content stoßen. Häufig bevorzugen sie dann die Seiten mit einzigartigen Inhalten (Unique Content).
Wie erkennst du Duplicate Content auf deiner Seite?
Duplicate Content findest du auf unterschiedlichen Wegen. So warnt dich beispielsweise die Google Search Console im Webmaster bei Verdacht auf doppelte Inhalte. Die dort durchgeführte Analyse zeigt dir außerdem die vom Webcrawler automatisch erfassten Seiten deiner Domain. Übersteigen sie die eigentlich erwartete Anzahl, liegt der Verdacht von gleichen Inhalten mit unterschiedlichen URLs nahe. Die Eingabe von Keywords oder Teilen der Texte in die Suchmaske von Google hilft ebenfalls weiter. Befinden sich deine Inhalte auch auf anderen Domains, hast du Duplicate Content. Zusätzlich gibt es eine ganze Reihe von speziell zur Suchmaschinenoptimierung eingesetzten Programmen, die dir Dopplungen aufzeigen.
Was kannst du gegen Duplicate Content unternehmen?
Im Idealfall verzichtest du weitgehend auf duplizierte Inhalte und löschst sie gegebenenfalls. Das Umschreiben oder Neuformulieren von Texten erfordert jedoch mitunter einen erheblichen Aufwand. Wo es nicht möglich beziehungsweise sinnvoll ist, lässt sich die betreffende Adresse über eine 301-Weiterleitung auf die Original-URL umsteuern. Damit hältst du deine Seiten schlank und ersparst dem jeweiligen Crawler „unnötige Wege“. Das erfreut den Googlebot und stimmt ihn gnädig.
Als weitere Alternative ermöglicht dir ein als „Canonical“ bezeichneter Link, den Suchmaschinen mitzuteilen, wenn eine URL nicht bei den Ergebnissen erscheinen soll. Mit dem Meta-Tag „noindex,follow“ schließt du die jeweiligen Seiten ebenfalls von der Suche aus.