Googlebot

Als Googlebot wird der Crawler von Google bezeichnet, der so gut wie alle öffentlich zugänglichen Inhalte bzw. Dokumente des Word Wide Web sammelt, speichert und indexiert. Diese gesammelten Daten nutzt Google, um Suchanfragen mit den entsprechenden Ergebnissen zu beantworten. Wird der Zugriff des Googlebots durch die Webseite nicht verweigert bzw. eingeschränkt, lädt der Googlebot die entsprechende Webseite runter und lädt sie in den Google Index. Hat der Googlebot die Daten gesammelt und gespeichert, dauert es in der Regel ein paar Tage, bis der Google Index aktualisiert wurde.

Die Arbeitsweise des Googlebots

Damit der Googlebot das World Wide Web indexieren kann, greift er auf einen bestimmten Algorithmus zurück. Dieser Algorithmus hilft dem Googlebot dabei, sich innerhalb von Webseiten mit Hilfe interner Verweise zu bewegen und sich somit ein Bild über die Struktur der Webseite zu machen. Der Googlebot folgt aber nicht nur internen, sondern auch externen Verweisen (auch externe Links oder Backlinks genannt). Durch diese Struktur (Seite A verlinkt auf Seite B, Seite B verlinkt auf Seite C usw.) entsteht ein in sich geschlossenes Netz, welches das gesamte Web abbildet.

In welchem Intervall der Googlebot die verschiedenen Webseiten indexiert, hängt von verschiedenen Faktoren ab. Ein Faktor ist beispielsweise die Häufigkeit der Aktualisierung einer Webseite. Crawlt der Googlebot eine Webseite und er stellt fest, dass sich im Vergleich zum letzten Crawling keine Veränderung ergeben hat, vergrößert er tendenziell sein Crawlingintervall. Stellt der Googlebot hingegen fest, dass seit dem letzten Crawlingvorgang weitere Inhalte hinzugekommen sind, ist das für den Googlebot ein positives Signal und er crawlt die Seite zukünftig in einem kürzeren Intervall.

Um eine Webseite durch häufige Zugriffe seitens des Googlebots zu bewahren, speichert der Google nach einem erfolgreichen Crawlingvorgang die gesamten Daten im Cache aller anderen Googlebots. Das hat den Vorteil, dass ein anderer Googlebot der die entsprechende Webseite crawlen möchte, zunächst auf den Cache zurückgreifen kann. Das hat den Vorteil, dass der Webseitenserver nicht belastet und die Ressourcen geschont werden.

Googlebot und SEO

Die Absicht hinter der Suchmaschinenoptimierung ist in der Regel immer die Gleiche, man möchte über Suchmaschinen gefunden werden. Die Grundbedingung dafür ist, dass die entsprechende Webseite bei Google im Index gespeichert wurde. Den Grundstein dafür legt der Googlebot, der Tag für Tag das gesamte Web nach neuen bzw. aktualisierten Inhalten durchforstet.

Möchte man als Webseitenbetreiber verhindern, dass der Googlebot die Webseite indexiert, kann man den Zugriff verweigern. Aber nicht nur dem Googlebot kann der Zugriff verwährt werden, sondern auch Bots anderer Suchmaschinen. Möchte man den Googlebot oder aber auch Bots anderer Suchmaschinen den Zugang zur Webseite verwehren, kommt dazu beispielsweise die Robots.txt in Betracht. Dazu müssen in der Robots.txt zwei Dinge angegeben werden. Neben “User-agent: *” muss auch das Attribut “Disallow: /” angegeben werden.

Möchte man dem Googlebot den Zugriff auf die Webseite ausdrücklich erlauben, hat man über die Google Search Console die Möglichkeit, ihn dazu aufzufordern, die Webseite zu besuchen. Das wäre z.B. dann sinnvoll, wenn eine Webseite erstmals online geht oder einzelne Bereiche einer Webseite erweitert oder ergänzt wurden. Nach jedem Update einer Seite sollte die Möglichkeit in Anspruch genommen werden, damit die Indexierung schneller vonstatten geht.

ALT-Attribut

Das ALT-Attribut (Alternativtext) wird für Grafiken auf einer Webseite verwendet. Der Alternativtext wird dann im Browser angezeigt, wenn das Bild aus einem bestimmten Grund nicht

Weiterlesen >>

Ankertext

Unter Ankertext (englisch: Anchortext) versteht man den farblich hervorgehobenen, klickbaren Text eines Hyperlinks (Links). Ein Link muss nicht zwingend auf die eigene, sondern kann auch

Weiterlesen >>

Broken Link

Ein Broken Link (deutsch: Gebrochener Verweis), auch Defekter Link oder Toter Link genannt, ist ein Link, der auf eine nicht existierende Zielseite oder Datei verweist.  Anstelle der

Weiterlesen >>

Klick

Ein Klick (englisch: Click) gibt an, wie oft ein Link oder eine URL angeklickt wurde. Durch die Gesamtzahl der Klicks lässt sich der Erfolg einer

Weiterlesen >>

Algorithmus

Ein Algorithmus ist eine eindeutige Vorschrift (Handlungsvorschrift), die zum Ziel hat, ein in der Regel technisches bzw. mathematisches Problem zu beheben. Algorithmen sind somit ein

Weiterlesen >>

Freshness

Freshness nennt sich ein Update, welches Google Im Jahr 2011 umgesetzt hat, mit dem Ziel, die Qualität der angezeigten Suchergebnisse zu verbessern. Der Name des

Weiterlesen >>