Eine Sitemap beinhaltet alle oder einen Teil der Webadressen (URLs) einer Webseite. Sie entstanden in der Anfangszeit der Suchmaschinen und waren wichtig, damit jede Seite/URL vom Crawler erfasst und indexiert werden konnte. Heutzutage sind Sitemaps für den Crawler nicht mehr zwingend erforderlich, da die Suchmaschinen-Crawler jede Seite indexieren können, solange jede Seite über die internen Verlinkungen (Informationsarchitektur der Webseite) vom Crawler erreichbar ist. Eine Sitemap sollte nach dem Veröffentlichen von neuen Inhalten stets aktualisiert, bzw. geupdatet werden. Dies kann man manuell machen oder mit Plugins automatisieren. Eine automatisierte Sitemap-Generierung bietet sich bei täglichen Änderungen, wie in einem Blog, an.
Das Ranking einer Webseite kann mit einer Sitemap nur verbessert werden
Eine strukturierte Sitemap listet im Idealfall nicht nur alle URLs, sondern spiegelt die hierarchische Struktur (Verknüpfungsstruktur) der Webseite wieder. Zusätzlich können sie wichtige Metadaten beinhalten, die Informationen über die Aktualität, Veränderungen und die Seitenhierarchie liefern. So kann man der Suchmaschine bei der URL zu einem Video mitteilen, in welche Kategorie das Video fällt, welche Laufzeit es beträgt und für welches Alter es gedacht ist. Wenn man die URLs der Bilder in der Sitemap listet, können Informationen zur Thematik, Format und Lizenzrechten ergänzt werden.
Eine Sitemap ist zu empfehlen, wenn
- Die Webseite sehr umfangreich ist
- Keine oder wenige interne Links vorhanden sind
- Die Webseite neu ist und nur wenige externe Links auf sie verweisen
- Die Webseite in Google News angezeigt wird
- Viele Media-Inhalte vorweist (Videos, Bilder, News)
HTML- und XML-Sitemaps
Es gibt XML- und HTML-Sitemaps. Die HTML-Sitemaps dienen hauptsächlich dem Nutzer und steigern die Benutzerfreundlichkeit der Webseite. Die Nutzer können durch diese mit wenigen Klicks auf die gewünschte Unterseite gelangen. Sie unterstützen den Crawling-Prozess der Suchmaschine und internen Verlinkungen. Besonders auf großen Websites mit viel Content und verschachtelten Pfaden sind HTML-Sitemaps sinnvoll. Auf solchen Webseiten hilft eine strukturierte XML-Sitemap den Suchmaschinen jede Seite zu erfassen. In eine XML-Sitemap können mehr Informationen zu den URLs hinterlegt werden. Daher sind sowohl eine XML- als auch eine HTML-Sitemap zu empfehlen.
Beispiel einer XML-Sitemap, die eine URL enthält:
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset > <url>
<loc>http://www.beispiel.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Beispiel für einer XML-Sitemap, die zwei Sitemaps aufführt:
<?xml version=”1.0″ encoding=”UTF-8″?>
<sitemapindex > <sitemap>
<loc>http://www.beispiel.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.beispiel.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>
Sitemaps anmelden
In der Datei robots.txt kann auf die Sitemap für den Crawler verwiesen werden.
Sitemap: Speicherort der Datei
Ebenso kann man die Sitemap im Web verlinken und in den Webmaster-Tools der Suchmaschine anmelden. Im Google Webmaster Tool reicht man dafür unter Crawling à Sitemaps die Sitemap einfach ein und kann sie dort ebenfalls testen.
Wichtige Informationen zu Sitemaps
√ | Strukturiert und hierarchisch aufgebaut |
√ | Pro Sitemap nicht mehr als 50.000 URLs
|
√ | Maximale Dateigröße: 10 MByte à im .gz-Dateiformat reduzierbar
|
√ | Keine URLs eintragen, die nicht indexiert werden sollen
|
√ | Keine URLs mit einem Canonical Tag eintragen
|
√ | Eine Sitemap muss nicht alle URLs der Webseite beinhalten
|
√ | Eigene Bilder- oder Video-Sitemaps erstellen
|
√ | Sitemaps mit z.B. 20.000 URLs in kleine Sitemaps einteilen und diese in eine Sitemap verlinken
|