Canonicals sind ein recht simples Mittel zur Vermeidung von Duplicate Content. Dieser entsteht, wenn zwei Seiten identischen (oder fast identischen) Inhalt besitzen und dadurch kaum voneinander zu unterscheiden sind. Mit Canonicals kann man dem Crawler zeigen, dass nur eine der beiden Seiten das Original ist (und die andere nur eine Kopie). Die Kopie wird dann aus dem Index genommen und kann sich nicht mehr negativ auf die Gesamtbewertung auswirken. Doch bei einer falschen Nutzung wird nicht die kopierte Seite, sondern u. U. gleich die gesamte Domain aus dem Index ausgeschlossen.
Canonicals gehören zum technischen Bereich des SEO. Man merkt die Auswirkungen dieser Faktoren meist erst wenn es bereits zu spät ist und Abstrafungen passiert sind. Um diese vorzubeugen haben wir die wichtigsten Faktoren (von Google Inc. empfohlen) für eine korrekte Nutzung der Canonicals zusammengefasst und in diesem Artikel erläutert.
Canonicals sollten nicht auf Seite 1 der Paginierung stehen
Nehmen wir an, jemand hat eine Kategorieseite, der über mehrere Unterseiten geht. Die Seiten könnten dann so aussehen:
- meinshop.com/kategorie/
- meinshop.com/kategorie/?seite=2
- meinshop.com/kategorie/?seite=3
- meinshop.com/kategorie/?seite=4
Es wäre in diesem Falle falsch, den Canonical auf Seite 2 (oder später) zu setzen um Seite 1 zu “stärken”. Seite 2 und Co. sind keineswegs identisch mit Seite 1 und benötigen kein Canonical Tag. In diesem Falle würde sogar der gesamte Inhalt der Seite NICHT indexiert und alle enthaltenen Links würden auch ignoriert werden. Seite 1 wäre damit völlig nutzlos und könnte nicht mehr zum Ranking der Domain beitragen.
Stattdessen sollte man bei paginierten Seiten den Canonical Tag auf eine Seite zeigen lassen, die alle Informationen noch einmal bündelt (also auch kopiert und nur falls vorhanden). Beim oben genannten Fall wäre es sinnvoll, nichts zu tun. Auch Google empfiehlt, bei unproblematischen Situationen (also ohne Duplicate Content) einfach nichts zu tun, da man mehr kaputt als besser machen kann.
Canonicals werden nur mit absoluten URLs benutzt
Canonicals funktionieren eigentlich mit absoluten und realtiven URLs. Das kann allerdings zu Missverständnissen führen, da sich relative URLs in verschiedenen Verzeichnissen befinden können.
<link rel=”canonical” href=”beispiel.de/meinkuchen.html“>
Dieser Code würde dazu führen, dass der Rest der URL (also der Teil vor dem angegebenen Link) falsch zusannebgesetzt wird und die falsche URL mit dem Canonical anvisiert wird. Beispielsweise könnte die oben genannte Seite in folgender Weise vorkommen:
https://beispiel.de/verzeichnis/beispiel.de/meinkuchen.html
Aber der Canonical Tag könnte irrtümlicherweise die Seite an einer anderen Stelle finden und auf diese zeigen:
https://www.beispiel.de/beispiel.de/meinkuchen.html
Im besten Fall wird die ganze URL angegeben, damit “Missverständnisse” von vornerein ausgeschlossen sind. Ihr könnt auch die absolute Adresse des Dokuments angeben, so wie hier:
<link rel=”canonical” href=”/meinkuchen.html“>
Immer nur ein Canonical setzen
Bei selbst programmierten Webseiten, Shops und CMS kommt es oft vor, dass durch mehrere Scripts und Funktionen Canonicals mehrmals gesetzt werden. Das ist gefährlich, denn Google wird eine solche Seite so behandeln, als hätte sie keine Canonicals.
Canonicals dienen nicht zur Weitergabe von Linkjuice
Nachdem das PageRank Sculpting mit internen nofollow Links nicht mehr funktioniert haben pfiffige Webmaster versucht, mit dem Canonical Element den Linkjuice Flow zu manipulieren. Dabei soll die Linkkraft von einigen unwichtigen Seiten mit vielen Links (Impressum, AGB, Datenschutz) auf relevantere Landingpages geleitet werden. Doch der Canonical ist nur für Seiten da, die fast identisch im Aufbau sind. Da die anderen Seiten in diesem Fall nicht identisch sind wird der Canonical keine Wirkung zeigen. Im Gegenteil: Es besteht die Gefahr, dass Google einfach alle Canonicals ignoriert.
Der Canonical wird nicht im <body> benutzt
Canonicals werden nur im <head> Tag benutzt. Canonicals, die in anderen Teilen des HTML Dokuments stehen, werden vom Google Crawler einfach ignoriert.
Canonicals werden nicht bei URL Parametern verwendet
Canonicals sollten mit der exakten URL angegeben werden, die am Ende auch angezeigt wird (am besten ruft Ihr die Zielseite einmal auf und kopiert dann die URL aus der oberen Leiste). Es können nämlich Probleme durch Tracker und andere Hintergrundabläufe vorkommen, bei denen die URL künstlich verlängert wird. Diese zusätzlichen Teile können dafür sorgen, dass ein Canonical gleich für mehrere Dokumente gilt und im Ernstfall sogar für Duplicate Content sorgt.
Canonicals müssen auch auf der mobilen Version gesetzt werden
Der Mobile Trend schreitet unaufhaltbar voran und viele Webmaster stelle sich darauf ein, indem sie eine mobile Version ihrer Seite erstellen. Da die mobile Version denselben Content hat, besteht die Gefahr des Duplicate Contents. Deswegen darf man nicht vergessen, von der mobilen Version auf die Desktop Version mit einem Canonical zu zeigen, um die Originalität der Desktop Version sicherzustellen.
<link rel=”canonical” href=”http://www.webpage.de”>
Zusatz: Vergisst dabei aber nicht, von der Desktop Version auf die mobile Version mittels rel=”alternate” zu verweisen:
<link rel=”alternate” media=”only screen and (max-width: 500px)” href=”http://www.m.webpage.de“>
Diese Praxis wir auch von Google empfohlen.
Bonus: Wann werden Canonicals eingesetzt?
Im oben genannten Blogeintrag der Google Webmasters wird der Einsatz von Canonicals in folgender Weise vorgegeben:
- Stets nur EINEN Canonical Tag nutzen, da ansonsten ALLE ignoriert werden
- Den Canonical nur im <head> oder im HTTP Antwort Header einsetzen
- Die Originale Seite (=kanonische Seite) darf kein “noindex” im Robots Meta Tag beinhalten
- Canonical Tags werden NICHT benutzt, wenn zwei Seiten thematisch ähnlich sind, sondern nur, wenn sie im Wortlaut übereinstimmen
Welche Seiten in den Index gehören (und welche nicht)
Um sich für Google und Nutzer so gut wie möglich zu platzieren ist die richtige Indexierung unabdingbar. Um zu entscheiden, welche URL im Index stehen soll und welche überflüssig ist, kann man sich an einigen Faustregeln orientieren. Hinweis: Hier wird nicht mit Canonicals gearbeitet, da die Seiten nicht im Wortlaut gleich/ähnlich sind. Dennoch ist dieser Punkt für das allgemeine Verständnis der Indexierung wichtig und verhindert (indirekt) Rankingverluste.
“Jede URL muss die Antwort auf eine Frage sein, die der Nutzer stellen könnte”.
Falls eine Seite diesen Mehrwert nicht bietet und auf keine andere Weise seinen Nutzen herausstellt (z.B. durch Unterhaltung wie Spiele, Videos, Katzenbilder, etc.), kann sie aus Sicht von Google nicht für einen Nutzer relevant sein. Als Folge werden sich diese Seiten negativ auf die Qualität der Domain auswirken und die Sichtbarkeit der anderen URLs senken.
“Jedes Thema darf nur in einer URL gefunden werden”.
Wenn gleiche Informationen auf unterschiedlichen Seiten zu finden sind, ist dies für den Nutzer unvorteilhaft, da dieser für die gesamten Infos auf beiden URLs nachschauen müsste. Google aber möchte, dass die Informationen nur auf einer Seite stehen und unnötiges Vergleichen vermieden wird. Zwei Seiten, die ähnlichen Content beinhalten, sind zwar kein Duplicate Content, können aber zu URL Switches führen (mehr Infos zu URL Switches).