Googlebot

Als Googlebot wird der Crawler von Google bezeichnet, der so gut wie alle öffentlich zugänglichen Inhalte bzw. Dokumente des Word Wide Web sammelt, speichert und indexiert. Diese gesammelten Daten nutzt Google, um Suchanfragen mit den entsprechenden Ergebnissen zu beantworten. Wird der Zugriff des Googlebots durch die Webseite nicht verweigert bzw. eingeschränkt, lädt der Googlebot die entsprechende Webseite runter und lädt sie in den Google Index. Hat der Googlebot die Daten gesammelt und gespeichert, dauert es in der Regel ein paar Tage, bis der Google Index aktualisiert wurde.

Die Arbeitsweise des Googlebots

Damit der Googlebot das World Wide Web indexieren kann, greift er auf einen bestimmten Algorithmus zurück. Dieser Algorithmus hilft dem Googlebot dabei, sich innerhalb von Webseiten mit Hilfe interner Verweise zu bewegen und sich somit ein Bild über die Struktur der Webseite zu machen. Der Googlebot folgt aber nicht nur internen, sondern auch externen Verweisen (auch externe Links oder Backlinks genannt). Durch diese Struktur (Seite A verlinkt auf Seite B, Seite B verlinkt auf Seite C usw.) entsteht ein in sich geschlossenes Netz, welches das gesamte Web abbildet.

In welchem Intervall der Googlebot die verschiedenen Webseiten indexiert, hängt von verschiedenen Faktoren ab. Ein Faktor ist beispielsweise die Häufigkeit der Aktualisierung einer Webseite. Crawlt der Googlebot eine Webseite und er stellt fest, dass sich im Vergleich zum letzten Crawling keine Veränderung ergeben hat, vergrößert er tendenziell sein Crawlingintervall. Stellt der Googlebot hingegen fest, dass seit dem letzten Crawlingvorgang weitere Inhalte hinzugekommen sind, ist das für den Googlebot ein positives Signal und er crawlt die Seite zukünftig in einem kürzeren Intervall.

Um eine Webseite durch häufige Zugriffe seitens des Googlebots zu bewahren, speichert der Google nach einem erfolgreichen Crawlingvorgang die gesamten Daten im Cache aller anderen Googlebots. Das hat den Vorteil, dass ein anderer Googlebot der die entsprechende Webseite crawlen möchte, zunächst auf den Cache zurückgreifen kann. Das hat den Vorteil, dass der Webseitenserver nicht belastet und die Ressourcen geschont werden.

Googlebot und SEO

Die Absicht hinter der Suchmaschinenoptimierung ist in der Regel immer die Gleiche, man möchte über Suchmaschinen gefunden werden. Die Grundbedingung dafür ist, dass die entsprechende Webseite bei Google im Index gespeichert wurde. Den Grundstein dafür legt der Googlebot, der Tag für Tag das gesamte Web nach neuen bzw. aktualisierten Inhalten durchforstet.

Möchte man als Webseitenbetreiber verhindern, dass der Googlebot die Webseite indexiert, kann man den Zugriff verweigern. Aber nicht nur dem Googlebot kann der Zugriff verwährt werden, sondern auch Bots anderer Suchmaschinen. Möchte man den Googlebot oder aber auch Bots anderer Suchmaschinen den Zugang zur Webseite verwehren, kommt dazu beispielsweise die Robots.txt in Betracht. Dazu müssen in der Robots.txt zwei Dinge angegeben werden. Neben “User-agent: *” muss auch das Attribut “Disallow: /” angegeben werden.

Möchte man dem Googlebot den Zugriff auf die Webseite ausdrücklich erlauben, hat man über die Google Search Console die Möglichkeit, ihn dazu aufzufordern, die Webseite zu besuchen. Das wäre z.B. dann sinnvoll, wenn eine Webseite erstmals online geht oder einzelne Bereiche einer Webseite erweitert oder ergänzt wurden. Nach jedem Update einer Seite sollte die Möglichkeit in Anspruch genommen werden, damit die Indexierung schneller vonstatten geht.

Cloaking

Der Begriff “Cloaking” kommt aus dem Englischen und stammt ab von dem Verb “to cloak”. Ins Deutsche übersetzt bedeutet es so viel wie “verhüllen“. Wer

Weiterlesen >>

Negative SEO

Mit Negative SEO werden Maßnahmen bezeichnet, deren Ziel das genau Gegenteil der eigentlichen Suchmaschinenoptimierung ist. Möchte man mit der Suchmaschinenoptimierung seine Webseite erfolgreicher machen, tritt

Weiterlesen >>

Dynamische Webseite

Eine dynamische Webseite wird vom Server erst im Moment des Seitenaufrufs erstellt und dem Nutzer angezeigt. Das hat den Vorteil, dass dem Nutzer aktuelle und

Weiterlesen >>

Hidden Content

Als “Hidden Content” werden Inhalte einer Webseite bezeichnet, die für den Nutzer nicht zu sehen sind. Das Besondere an Hidden Content aber ist, dass dieser,

Weiterlesen >>

Suchergebnis

Unter Suchergebnis versteht man das Ergebnis, welches passend zur Suchanfrage an eine Suchmaschine wie Google, dem Nutzer angezeigt wird. Ein Suchergebnis wird auf den SERPs

Weiterlesen >>