Googlebot

Als Googlebot wird der Crawler von Google bezeichnet, der so gut wie alle öffentlich zugänglichen Inhalte bzw. Dokumente des Word Wide Web sammelt, speichert und indexiert. Diese gesammelten Daten nutzt Google, um Suchanfragen mit den entsprechenden Ergebnissen zu beantworten. Wird der Zugriff des Googlebots durch die Webseite nicht verweigert bzw. eingeschränkt, lädt der Googlebot die entsprechende Webseite runter und lädt sie in den Google Index. Hat der Googlebot die Daten gesammelt und gespeichert, dauert es in der Regel ein paar Tage, bis der Google Index aktualisiert wurde.

Die Arbeitsweise des Googlebots

Damit der Googlebot das World Wide Web indexieren kann, greift er auf einen bestimmten Algorithmus zurück. Dieser Algorithmus hilft dem Googlebot dabei, sich innerhalb von Webseiten mit Hilfe interner Verweise zu bewegen und sich somit ein Bild über die Struktur der Webseite zu machen. Der Googlebot folgt aber nicht nur internen, sondern auch externen Verweisen (auch externe Links oder Backlinks genannt). Durch diese Struktur (Seite A verlinkt auf Seite B, Seite B verlinkt auf Seite C usw.) entsteht ein in sich geschlossenes Netz, welches das gesamte Web abbildet.

In welchem Intervall der Googlebot die verschiedenen Webseiten indexiert, hängt von verschiedenen Faktoren ab. Ein Faktor ist beispielsweise die Häufigkeit der Aktualisierung einer Webseite. Crawlt der Googlebot eine Webseite und er stellt fest, dass sich im Vergleich zum letzten Crawling keine Veränderung ergeben hat, vergrößert er tendenziell sein Crawlingintervall. Stellt der Googlebot hingegen fest, dass seit dem letzten Crawlingvorgang weitere Inhalte hinzugekommen sind, ist das für den Googlebot ein positives Signal und er crawlt die Seite zukünftig in einem kürzeren Intervall.

Um eine Webseite durch häufige Zugriffe seitens des Googlebots zu bewahren, speichert der Google nach einem erfolgreichen Crawlingvorgang die gesamten Daten im Cache aller anderen Googlebots. Das hat den Vorteil, dass ein anderer Googlebot der die entsprechende Webseite crawlen möchte, zunächst auf den Cache zurückgreifen kann. Das hat den Vorteil, dass der Webseitenserver nicht belastet und die Ressourcen geschont werden.

Googlebot und SEO

Die Absicht hinter der Suchmaschinenoptimierung ist in der Regel immer die Gleiche, man möchte über Suchmaschinen gefunden werden. Die Grundbedingung dafür ist, dass die entsprechende Webseite bei Google im Index gespeichert wurde. Den Grundstein dafür legt der Googlebot, der Tag für Tag das gesamte Web nach neuen bzw. aktualisierten Inhalten durchforstet.

Möchte man als Webseitenbetreiber verhindern, dass der Googlebot die Webseite indexiert, kann man den Zugriff verweigern. Aber nicht nur dem Googlebot kann der Zugriff verwährt werden, sondern auch Bots anderer Suchmaschinen. Möchte man den Googlebot oder aber auch Bots anderer Suchmaschinen den Zugang zur Webseite verwehren, kommt dazu beispielsweise die Robots.txt in Betracht. Dazu müssen in der Robots.txt zwei Dinge angegeben werden. Neben “User-agent: *” muss auch das Attribut “Disallow: /” angegeben werden.

Möchte man dem Googlebot den Zugriff auf die Webseite ausdrücklich erlauben, hat man über die Google Search Console die Möglichkeit, ihn dazu aufzufordern, die Webseite zu besuchen. Das wäre z.B. dann sinnvoll, wenn eine Webseite erstmals online geht oder einzelne Bereiche einer Webseite erweitert oder ergänzt wurden. Nach jedem Update einer Seite sollte die Möglichkeit in Anspruch genommen werden, damit die Indexierung schneller vonstatten geht.

Pay per View

Pay per View (abgekürzt: PPV) ist ein Zahlungsmodell bzw. eine Vergütungsmethode, welche sehr häufig im Bereich Online-Marketing zur Anwendung kommt. Übersetzt ins Deutsche bedeutet Pay

Weiterlesen >>

Linktausch

Der Linktausch ist eine geplante Aktion von mindestens zwei Webseitenbetreibern, die von jeweils der eigenen Webseite einen Link auf die jeweils andere Webseite setzen. Hiervon

Weiterlesen >>

Footer

Der Begriff „Footer“ kommt aus dem Englischen und bedeutet ins Deutsche übersetzt „Fußzeile“. Grundsätzlich erfolgt eine strikte Trennung zwischen Inhalt des Dokuments und Inhalt des

Weiterlesen >>

Freshness

Freshness nennt sich ein Update, welches Google Im Jahr 2011 umgesetzt hat, mit dem Ziel, die Qualität der angezeigten Suchergebnisse zu verbessern. Der Name des

Weiterlesen >>

Mouse Tracking

Als Mouse Tracking wird eine Methode bezeichnet, mit der die Mausbewegung und Interaktionen des Nutzers mit dem Computer bzw. der Webseite aufgezeichnet werden. Anhand dieser

Weiterlesen >>

Sedo

Sedo ist ein Unternehmen mit Sitz in Köln und handelt als Tochtergesellschaft der United Internet AG im Internet mit Domains bzw. Webadressen. Unter der gleichnamigen Domain

Weiterlesen >>