Sitemaps

Eine Sitemap beinhaltet alle oder einen Teil der Webadressen (URLs) einer Webseite. Sie entstanden in der Anfangszeit der Suchmaschinen und waren wichtig, damit jede Seite/URL vom Crawler erfasst und indexiert werden konnte. Heutzutage sind Sitemaps für den Crawler nicht mehr zwingend erforderlich, da die Suchmaschinen-Crawler jede Seite indexieren können, solange jede Seite über die internen Verlinkungen (Informationsarchitektur der Webseite) vom Crawler erreichbar ist. Eine Sitemap sollte nach dem Veröffentlichen von neuen Inhalten stets aktualisiert, bzw. geupdatet werden. Dies kann man manuell machen oder mit Plugins automatisieren. Eine automatisierte Sitemap-Generierung bietet sich bei täglichen Änderungen, wie in einem Blog, an.

Das Ranking einer Webseite kann mit einer Sitemap nur verbessert werden

Eine strukturierte Sitemap listet im Idealfall nicht nur alle URLs, sondern spiegelt die hierarchische Struktur (Verknüpfungsstruktur) der Webseite wieder. Zusätzlich können sie wichtige Metadaten beinhalten, die Informationen über die Aktualität, Veränderungen und die Seitenhierarchie liefern. So kann man der Suchmaschine bei der URL zu einem Video mitteilen, in welche Kategorie das Video fällt, welche Laufzeit es beträgt und für welches Alter es gedacht ist. Wenn man die URLs der Bilder in der Sitemap listet, können Informationen zur Thematik, Format und Lizenzrechten ergänzt werden.

Eine Sitemap ist zu empfehlen, wenn

  • Die Webseite sehr umfangreich ist
  • Keine oder wenige interne Links vorhanden sind
  • Die Webseite neu ist und nur wenige externe Links auf sie verweisen
  • Die Webseite in Google News angezeigt wird
  • Viele Media-Inhalte vorweist (Videos, Bilder, News)

 

HTML- und XML-Sitemaps

Es gibt XML- und HTML-Sitemaps. Die HTML-Sitemaps dienen hauptsächlich dem Nutzer und steigern die Benutzerfreundlichkeit der Webseite. Die Nutzer können durch diese mit wenigen Klicks auf die gewünschte Unterseite gelangen. Sie unterstützen den Crawling-Prozess der Suchmaschine und internen Verlinkungen. Besonders auf großen Websites mit viel Content und verschachtelten Pfaden sind HTML-Sitemaps sinnvoll. Auf solchen Webseiten hilft eine strukturierte XML-Sitemap den Suchmaschinen jede Seite zu erfassen. In eine XML-Sitemap können mehr Informationen zu den URLs hinterlegt werden. Daher sind sowohl eine XML- als auch eine HTML-Sitemap zu empfehlen.

Beispiel einer XML-Sitemap, die eine URL enthält:

 

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset >   <url>

      <loc>http://www.beispiel.com/</loc>

      <lastmod>2005-01-01</lastmod>

      <changefreq>monthly</changefreq>

      <priority>0.8</priority>

   </url>

</urlset>

Beispiel für einer XML-Sitemap, die zwei Sitemaps aufführt:

<?xml version=”1.0″ encoding=”UTF-8″?>

<sitemapindex >   <sitemap>

      <loc>http://www.beispiel.com/sitemap1.xml.gz</loc>

      <lastmod>2004-10-01T18:23:17+00:00</lastmod>

   </sitemap>

   <sitemap>

      <loc>http://www.beispiel.com/sitemap2.xml.gz</loc>

      <lastmod>2005-01-01</lastmod>

   </sitemap>

</sitemapindex>

Sitemaps anmelden

In der Datei robots.txt kann auf die Sitemap für den Crawler verwiesen werden.

Sitemap: Speicherort der Datei

Ebenso kann man die Sitemap im Web verlinken und in den Webmaster-Tools der Suchmaschine anmelden. Im Google Webmaster Tool reicht man dafür unter Crawling à Sitemaps die Sitemap einfach ein und kann sie dort ebenfalls testen.

 

Wichtige Informationen zu Sitemaps

Strukturiert und hierarchisch aufgebaut
Pro Sitemap nicht mehr als 50.000 URLs

 

Maximale Dateigröße: 10 MByte à im .gz-Dateiformat reduzierbar

 

Keine URLs eintragen, die nicht indexiert werden sollen

 

Keine URLs mit einem Canonical Tag eintragen

 

Eine Sitemap muss nicht alle URLs der Webseite beinhalten

 

Eigene Bilder- oder Video-Sitemaps erstellen

 

Sitemaps mit z.B. 20.000 URLs in kleine Sitemaps einteilen und diese in eine Sitemap verlinken