Seitenindexierung und Duplicate Content
Was bedeutet Duplicate Content eigentlich und wie beeinflusst er die Seitenindexierung und Dein Ranking in den Suchmaschinen? Und was kannst Du tun, um ihn zu vermeiden?
Was ist Duplicate Content?
Duplicate Content bedeutet, dass derselbe Inhalt auf verschiedenen Seiten Deiner Website oder auf verschiedenen Websites im Internet vorhanden ist. Dies kann versehentlich geschehen, zum Beispiel durch das Kopieren von Inhalten von anderen Websites oder durch das Veröffentlichen ähnlicher Inhalte auf verschiedenen Seiten. Es kann aber auch absichtlich geschehen, z. B. durch die Erstellung von Inhalten, die sich nur geringfügig voneinander unterscheiden, um das Ranking in Suchmaschinen zu verbessern.
Technischer Duplicate Content
Die Search Console hilft durch Fehlermeldungen, die Dir Hinweise zu geben, warum eine Seite zum Beispiel nicht indexiert ist. Manchmal ist es schwer die Hintergründe zu verstehen, da die Meldungen oft technisch sind und die Formulierungen durch Fachbegriffe nicht intuitiv begreifbar sind. Nicht immer sind die Meldungen auch klar und eindeutig. Deshalb gehe ich heute auf diese Hintergründe ein.
Bevor ich auf einzelne Fehlermeldungen eingehe, etwas zu den technischen Hintergründen: Eine Webseite und insbesondere die Startseite kann oft über mehrere Art und Weisen aufgerufen werden. Das hat u.a. damit etwas zu tun, dass z.B. der Aufruf einer Webseite mit www oder ohne www für die Browser unterschiedliche Domains sind. Wer das genauer wissen möchte, kann im Beitrag 'Technisches SEO' meinen Exkurs zum Thema „Die richtige Property wählen“ nachlesen.
Wichtig: Wähle in der Search Console als Property eine Variante aus und leite die anderen Varianten per 301 Weiterleitung auf diese um!
Warum gibt es bei Webseiten eine Indexdatei?
Die Indexdatei einer Website ist normalerweise eine Standarddatei, die von Webservern verwendet wird, um eine Standardseite aufzurufen, wenn der Name der URL nicht angegeben wird. Der Hintergrund ist technischer Art, weil der Server immer eine Datei aufrufen muss. Beim Aufruf der URL https://example.com weiß der Server nicht welche Datei er anzeigen soll und sucht deshalb nach der Indexdatei. Wenn also jemand die URL https://example.com/ aufruft, wird standardmäßig die Indexdatei angezeigt.
Wenn https://example.com/ und https://example.com/index.html aufgerufen werden kann, gibt es von manchen SEO-Tools dann einen Warnhinweis, dass dadurch Duplicate Content entsteht.
Fehlermeldung: Duplikat – vom Nutzer nicht als kanonisch festgelegt
Der Begriff ‚kanonisch‘ ist erstmal nicht selbsterklärend. Google definiert das so: „Eine kanonische URL ist die URL der Seite, von der Google annimmt, dass sie die repräsentativste von mehreren duplizierten Seiten auf Deiner Webseite ist.“
Das heißt, dass auch Google bei Duplicate Content überlegt, welche Seite die maßgebliche ist. Aber Du kannst das auch selbst festlegen, indem Du das Canonical-Tag verwenden, um zu verhindern, dass Google die Index-Datei als Duplicate Content identifiziert.Hier ist ein Beispiel-Code, wie Du das Canonical-Tag in Deine Index-Datei im Head-Bereich einfügen kannst:
<head>
...
<link rel="canonical" href="https://example.com">
...
< /head>
Das ist der klassische Weg, diese Form des Duplicate Content zu vermeiden und diese Arten von Fehlermeldungen zu verhindern.
Nach meiner Erfahrung kann Google aber auch sehr gut damit umgehen, wenn man nichts tut. Einen Nachteil beim Ranking hat man dadurch anscheinend nicht.
Wenn man das aber ‚sauber‘ löst, kommt nach mehreren Wochen die folgende Meldung:
Alternative Seite mit richtigem kanonischen Tag
Das bedeutet, dass Google das jetzt richtig identifiziert hat und weiß, dass die beiden Seite gleich sind und nur eine davon indexiert werden soll. Eigentlich eine Information, dass jetzt alles richtig ist; wenn diese Meldung nicht mit der Überschrift: „Neue Probleme vom Typ Seitenindexierung“ verschickt und durch einen Button ‚Fehlerbehebung überprüfen‘ ergänzt würde.
Das ist ein bisschen unglücklich formuliert. Da nutzt man anscheinend denselben Meldetyp, der auch für tatsächliche Fehler genutzt wird. Du kannst das einfach ignorieren und die Meldung als Info werten! In dem verlinkten Hilfetext schreibt Google dann richtigerweise:
„Die Seite verweist korrekt auf die indexierte kanonische Seite. Sie müssen nichts weiter unternehmen.“
Wie wirkt sich Duplicate Content auf SEO und Ranking aus?
Duplicate Content kann sich negativ auf das Ranking in Suchmaschinen auswirken. Suchmaschinen wie Google möchten ihren Nutzern nur die relevante und einzigartige Ergebnisse präsentieren. Wenn es jedoch mehrere Versionen des gleichen Inhalts gibt, weiß die Suchmaschine nicht, welche Version sie bevorzugen soll.
Häufig liest man, dass dies dazu führen kann, dass Deine Website im Ranking abrutscht oder sogar ganz aus den Suchergebnissen verschwindet. Das ist in der Regel nicht der Fall. Es gibt auch keine Penalty oder Strafe für Duplicate Content für die gesamte Webseite. Es kann jedoch sein, dass der doppelte Inhalt selbst nicht indexiert wird und damit kein Ranking hat, da Google in der Regel dann eine Version bevorzugt. Wenn auf Deiner Seite überwiegend Duplicate Content ist, kann sich das auch negativ auf die gesamte Webseite auswirken.
Welche Maßnahmen kannst Du ergreifen, um Duplicate Content zu vermeiden?
Es gibt verschiedene Maßnahmen, die Du ergreifen kannst, um Duplicate Content zu vermeiden und Dein Ranking in den Suchmaschinen zu verbessern. Hier sind einige Beispiele:
- Unique Content
Erstelle einzigartige Inhalte, die es sonst nirgendwo gibt. Vermeide es, Inhalte von anderen Websites zu kopieren oder ähnliche Inhalte auf verschiedenen Seiten zu veröffentlichen. - Verwende kanonische Tags
Damit teilst Du der Suchmaschine mit, welche Version einer Seite bevorzugt wird. Dies ist besonders wichtig, wenn es mehrere Versionen einer Seite gibt, zum Beispiel eine Desktop-Version und eine mobile Version. - Verwende das "noindex" Meta-Tag
Mit der Verwendung dieses Tag, kannst Du Seiten von der Indexierung durch Suchmaschinen ausschließen. Dies ist besonders wichtig, wenn du Seiten hast, die für die Suchergebnisse nicht relevant sind, wie zum Beispiel Datenschutzrichtlinien oder Nutzungsbedingungen. - Vermeide das Duplizieren von Inhalten auf Deiner Website
Wenn Du z. B. ein Produkt in mehreren Kategorien anbietest, erstelle eine einzige Produktbeschreibung und verweise von den verschiedenen Kategorien aus darauf.
Fazit
Duplicate Content ist nicht wirklich nützlich für die Entwicklung Deiner Webseite. Die Angst vor einer Penalty ist zwar übertrieben, insbesondere durch die technischen Aspekte eines Duplicate Content, mit denen Google inzwischen sehr gut umgehen kann. Aber unique, für die Nutzer Deiner Webseite relevanter Content ist immer noch der Schlüssel für eine erfolgreiche Entwicklung.
Wenn Du dich fragst, ob Du Duplicate Content hast, dann stellst Du Dir wahrscheinlich die falsche Frage. Frage Dich stattdessen, wie Du einzigartige, wertvolle und relevante Inhalte für Deine Nutzer erstellen kannst!
Über den Autor
Michael Dilger-Hassel aka Milanex
Seit 2011 habe ich mich als Publisher mit allen Aspekten erfolgreicher Webseiten befasst und bin seit 2015 unter dem Nickname 'Milanex' in mehreren Support Foren zum Thema AdSense und Webmaster aktiv.
Als Google Produktexperte 'Platin' unterstütze ich seit Jahren andere Webmaster ehrenamtlich zu allen Fragen rund um die Google Suche.
In diesem Blog greife ich Fragen aus den Foren auf und nutze meine Erfahrungen für Tipps und Tricks. Einzelne Themen stelle ich ausführlich und vertieft dar, um eine optimale Nutzung Search Console zu ermöglichen, andere Beiträge sind auch für Anfänger:innen geeignet, deren Webseite in der Google Suche gefunden werden soll.
Zur Vita
Bei Anregungen, Kommentaren oder Vorschlägen zum Blogbeitrag: Bitte meldet Euch perE-Mail. Ich freue mich über Rückmeldungen!