Canonical Tag

In den Augen der Suchmaschine ist jede URL einzigartig. Eine andere Schreibweise oder eine kleine Erweiterung der URL sorgt dafür, dass sie als eine neue und eigene URL angesehen wird.

Die folgenden URLs stellen jeweils alle eine individuelle URL dar.

http://www.beispielseite.de/kategorie
http://www.beispielseite.de/kategorie/
http://www.beispielseite.de/kategorie.pdf
http://beispielseite.de/kategorie (kein www.)
https://www.beispielseite.de/kategorie
http://www.beispielseite.de/Kategorie

Bieten diese URLs einen ähnlichen (Near-Duplicate Content) oder identischen Inhalt (Duplicate Content), werden diese in den Suchergebnisanzeigen nicht auftauchen, da Suchmaschinen Seiten mit doppelten Inhalt filtern. Das Canonical Tag (auch Canonical Attribut, Canonical Link) wird vom Webseitenbetreiber genutzt, um der Suchmaschine die URL zu zeigen, die als Standardressource gewertet werden soll. Alle ähnlichen Seiten weisen auf die repräsentative URL hin. Diese URL wird in den SERPs (Suchergebnissen) zu dem behandelten Thema angezeigt.

Beispiel wie man das Canonical setzt

Auf News-Portalen sind Artikel teilweise auf verschiedenen Wegen erreichbar. Ein Artikel über Unfälle beim Sport kann beispielsweise in der Rubrik Sport und in der Rubrik Gesundheit abgelegt sein. Der gleiche Artikel ist somit unter zwei verschiedenen URLs zu erreichen.
Um von einer Seite A auf eine andere Seite B zu verweisen, wird das Canonical Tag in den Head-Bereich der Seite A geschrieben. Dieses enthält den Verweis auf die Seite B, die als Standardressource gelten soll. Die Standardressource wird von den Suchmaschinen bevorzugt und in den Index aufgenommen.

Seite A: http://www.beispielseite.de/seite-a
Seite B: http://www.beispielseite.de/seite-b

Seite A soll auf Seite B verweisen. In den Head Bereich von Seite A wird folgender Link geschrieben: <link rel=“canonical“ href=“http://www.beispielseite.de/seite-b“ />

Seite B weist auf sich selber: <link rel=“canonical“ href=“http://www.beispielseite.de/seite-b“ />

 

Wann nutzt man das Canonical Tag?

Um falschen Verlinkungen vorzubeugen sollte grundsätzlich in den Quellcode jeder Seite das Canonical Tag eingebaut werden, sodass jede Seite ohne Duplikat auf sich selbst verweist.
Das Canonical Tag nutzt man, wenn eine oder mehrere der folgenden Punkte auf eine Webseite zutreffen:

  • Die Webseite ist mit und ohne www aufrufbar
    http://www.beispiel.de
    http://beispiel.de
  • Die Webseite ist mit und ohne Trailing Slashes erreichbar
    http://www.beispiel.de
    http://www.beispiel.de/
  • Die Webseite ist mit http und https aufrufbar
    http://www.beispiel.de
    https://www.beispiel.de
  • Identische Inhalte sind in verschiedenen Ansichten (Druckansicht, PDF) mit verschiedenen URLs aufrufbar
  • Die Webseite ist mit Groß- und Kleinschreibung erreichbar (Case sensitivity)
    http://www.beispiel.de/basteltipps
    http://www.beispiel.de/BastelTipps
  • Durch das Rewriting der URL ist eine Webseite unter zwei Adressen erreichbar
  • Webseite ist auch mit Tracking-Parametern aufrufbar:
    http://www.beispiel.de/alleartikel.html
    http://www.beispiel.de/alleartikel.html?tracking_id=34
  • Auf externen Webseiten ist der gleiche Inhalt
    http://www.beispiel.de/basteltipps
    http://www.bastelecke.de/basteltipps
  • Webseite ist auch mit Session-IDs erreichbar:
    http://www.beispiel.de/alleartikel.html
    http://www.beispiel.de/alleartikel.html?session_id=56
  • Webseite ist mit dargestellter Index-Datei und ohne diese aufrufbar:
    http://www.beispiel.de/
    http://www.beispiel.de/index.php

 

Man sollte sich vor jedem Canonical Tag überlegen, ob die Inhalte der Seiten sich wirklich ähneln. Es ist zum Beispiel kein Duplicate Content, wenn eine Webseite in mehreren Sprachen indexiert ist. Auch Webseiten für Desktop-Besucher und Mobile-Besucher sind trotz gleichem Inhalt dann kein Duplicate Content, solange eine mobile Sitemap vorhanden ist, die der Suchmaschine zeigt, dass zwei unterschiedliche Webseiten-Versionen existieren.
Pro Webseite wird nur ein Canonical-Tag benutzt, da diese sonst von der Suchmaschine ganz ignoriert werden.

Wie behandelt der Suchmaschinen-Crawler das Canonical Tag?

Das Canonical Tag wird wie eine 301-Weiterleitung behandelt. Der Pagerank, bzw. die Linkpopularität aller URLs, die auf die Standardressource verweisen, vererbt sich auf diese. Diese Vorgehensweise wird von allen Suchmaschinen unterstützt.
Die URL, auf die man mit dem Canonical verweist, sollte immer sicher erreichbar sein, alle ähnlichen oder identischen repräsentieren und eine schnelle Ladezeit haben. Zudem sehen es Suchmaschinen nicht gerne, wenn Seiten mit Canonical Tags mit „noindex“, „disallow“ oder „nofollow“ kombiniert werden. Das „disallow“ verhindert das Crawlen der Seite und das „noindex“ würde dafür sorgen, dass die Suchmaschine das Canonical nicht wahrnimmt. Wenn das Canonical Tag im Body statt im Header steht, wird es ebenfalls nicht gewertet.

 

Wo wird das Canonical Tag gesetzt?

Das Canonical kann im Head-Bereich der HTML oder im HTTP-Header platziert werden. Das Attribut wird mit dem Link-Element im <head> des Quellcodes geschrieben. Es ergänzt die Meta-Angaben des Dokuments.

<!DOCTYPE>
<html>
<head>

<link rel=“canonical“ href=“http://www.beispiel.de” />

</head>
<body>…</body>
</html>

Wenn eine PDF aufgrund verschiedener URLs mehrmals existiert, kann man in den HTTP-Header das rel=“canonical“ verwenden. Mit dieser gibt man der Suchmaschine die kanonische URL der PDF-Datei an.

Link: <http://www.beispiel.pdf>; rel=”canonical”