Googlebot

Als Googlebot wird der Crawler von Google bezeichnet, der so gut wie alle öffentlich zugänglichen Inhalte bzw. Dokumente des Word Wide Web sammelt, speichert und indexiert. Diese gesammelten Daten nutzt Google, um Suchanfragen mit den entsprechenden Ergebnissen zu beantworten. Wird der Zugriff des Googlebots durch die Webseite nicht verweigert bzw. eingeschränkt, lädt der Googlebot die entsprechende Webseite runter und lädt sie in den Google Index. Hat der Googlebot die Daten gesammelt und gespeichert, dauert es in der Regel ein paar Tage, bis der Google Index aktualisiert wurde.

Die Arbeitsweise des Googlebots

Damit der Googlebot das World Wide Web indexieren kann, greift er auf einen bestimmten Algorithmus zurück. Dieser Algorithmus hilft dem Googlebot dabei, sich innerhalb von Webseiten mit Hilfe interner Verweise zu bewegen und sich somit ein Bild über die Struktur der Webseite zu machen. Der Googlebot folgt aber nicht nur internen, sondern auch externen Verweisen (auch externe Links oder Backlinks genannt). Durch diese Struktur (Seite A verlinkt auf Seite B, Seite B verlinkt auf Seite C usw.) entsteht ein in sich geschlossenes Netz, welches das gesamte Web abbildet.

In welchem Intervall der Googlebot die verschiedenen Webseiten indexiert, hängt von verschiedenen Faktoren ab. Ein Faktor ist beispielsweise die Häufigkeit der Aktualisierung einer Webseite. Crawlt der Googlebot eine Webseite und er stellt fest, dass sich im Vergleich zum letzten Crawling keine Veränderung ergeben hat, vergrößert er tendenziell sein Crawlingintervall. Stellt der Googlebot hingegen fest, dass seit dem letzten Crawlingvorgang weitere Inhalte hinzugekommen sind, ist das für den Googlebot ein positives Signal und er crawlt die Seite zukünftig in einem kürzeren Intervall.

Um eine Webseite durch häufige Zugriffe seitens des Googlebots zu bewahren, speichert der Google nach einem erfolgreichen Crawlingvorgang die gesamten Daten im Cache aller anderen Googlebots. Das hat den Vorteil, dass ein anderer Googlebot der die entsprechende Webseite crawlen möchte, zunächst auf den Cache zurückgreifen kann. Das hat den Vorteil, dass der Webseitenserver nicht belastet und die Ressourcen geschont werden.

Googlebot und SEO

Die Absicht hinter der Suchmaschinenoptimierung ist in der Regel immer die Gleiche, man möchte über Suchmaschinen gefunden werden. Die Grundbedingung dafür ist, dass die entsprechende Webseite bei Google im Index gespeichert wurde. Den Grundstein dafür legt der Googlebot, der Tag für Tag das gesamte Web nach neuen bzw. aktualisierten Inhalten durchforstet.

Möchte man als Webseitenbetreiber verhindern, dass der Googlebot die Webseite indexiert, kann man den Zugriff verweigern. Aber nicht nur dem Googlebot kann der Zugriff verwährt werden, sondern auch Bots anderer Suchmaschinen. Möchte man den Googlebot oder aber auch Bots anderer Suchmaschinen den Zugang zur Webseite verwehren, kommt dazu beispielsweise die Robots.txt in Betracht. Dazu müssen in der Robots.txt zwei Dinge angegeben werden. Neben “User-agent: *” muss auch das Attribut “Disallow: /” angegeben werden.

Möchte man dem Googlebot den Zugriff auf die Webseite ausdrücklich erlauben, hat man über die Google Search Console die Möglichkeit, ihn dazu aufzufordern, die Webseite zu besuchen. Das wäre z.B. dann sinnvoll, wenn eine Webseite erstmals online geht oder einzelne Bereiche einer Webseite erweitert oder ergänzt wurden. Nach jedem Update einer Seite sollte die Möglichkeit in Anspruch genommen werden, damit die Indexierung schneller vonstatten geht.

Datenschutz

Der Begriff “Datenschutz” ist ein Sammelbegriff und soll wie der Name schon sagt, Daten schützen. Genauer gesagt soll der Datenschutz dafür sorgen, dass das Individuum

Weiterlesen >>

Content Marketing

Content Marketing ist eine Form des Marketings, bei dem hochwertigeren Inhalt im Vordergrund steht. Es geht weniger darum, die Eigenschaften seiner Produkte darzustellen. Vielmehr wird

Weiterlesen >>

Satelliten-Domain

Mit einer Satelliten-Domain (englisch: satellite domain) bezeichnet man Domains, die primär dazu eingesetzt werden, die Hauptseite durch das Setzen eines Backlink zu stärken. Eine Satelliten-Domain

Weiterlesen >>

Keyword

Ein Keyword (englisch: Schlüsselwort) bezeichnet im Onlinemarketing ein Schlagwort, nachdem Nutzer in Form einer Suchanfrage innerhalb einer Suchmaschine suchen. Häufig werden Webseiten so aufbereitet, dass

Weiterlesen >>

Sedo

Sedo ist ein Unternehmen mit Sitz in Köln und handelt als Tochtergesellschaft der United Internet AG im Internet mit Domains bzw. Webadressen. Unter der gleichnamigen Domain

Weiterlesen >>

Cross-Linking

Cross-Linking bezeichnet die Verlinkung von Webseiten untereinander. Hierbei spielt es keine Rolle, ob es sich nur um zwei oder mehrere Webseiten handelt. Ins Deutsche übersetzt

Weiterlesen >>

Anlysiere jetzt kostenlos deine Webseite!

PageRangers ist eine professionelle Seo-Toolbox, welche dich bei der Analyse, Optimierung und Wartung deiner Webseite unterstützt. Nutze unser kostenloses Angebot und analysiere jetzt deine Webseite!