Indexierung

Als Indexierung bezeichnet man eine Methode zur Erfassung von Informationen. Bei der Indexierung werden beispielsweise Inhalte von Dokumenten mit Hilfe von Stich- und Schlagewörtern gesammelt. Die so gesammelten Daten, werden in einem Index dargestellt. Mit Hilfe des Indexes wird gewährleistet, dass die in ihm gespeicherten Informationen, auch zu einem späteren Zeitpunkt wiedergefunden werden können. Wird nach einem bestimmten Stich- bzw. Schlagwort gesucht, werden die unter diesem Stich- bzw. Schlagwort im Index gespeicherten Inhalte dargestellt. Der Vorteil für den Nutzer besteht darin, dass ihm immer der Suchanfrage entsprechende Inhalte angezeigt werden. Suchmaschinen wie z. B. Google verwenden genau diese Methode. Hierbei werden zu bestimmten Keywords die passenden Inhalte sortiert und gespeichert. Durch die Speicherung der Informationen, können die Daten auch für zukünftige Suchanfragen verfügbar gemacht werden. Das bedeutet aber auch, dass Inhalte, die von einer Suchmaschine noch nicht gefunden und indexiert wurden, nicht in den SERPs (Suchergebnisseiten) dargestellt werden können.

Eine Indexierung kann für diverse Arten von Dokumenten erfolgen. Primär und damit am häufigsten indexiert, werden allerdings Textdokumente. Mögliche andere Dokumente, die indexiert werden können sind z. B. Video- oder Bilddateien.

Warum die Indexierung von Webinhalten sinnvoll ist

Suchmaschinen wie der europäische Marktführer Google, aber auch andere Suchmaschinen (z. B. Bing) nutzen für die Indexierung von Webinhalten bestimmte Crawler. Suchmaschinencrawler stehen vor einer großen Herausforderung, denn das Internet bietet eine extrem große Datenfülle. Durch das erfolgreiche Indexieren dieser Daten, bietet sich dem Nutzer die Möglichkeit, Informationen auch zu einem späteren Zeitpunkt wiederzufinden. In diesem Zusammenhang sind die sog. Meta-Daten wichtig. Meta-Daten sind Informationen, die einem Dokument angehängt werden und der Suchmaschine dabei helfen, die Inhalte effizienter zu bestimmen. Auch wenn diese Daten von den Suchmaschinen ausgelesen werden können, sind sie für den normalen Nutzer in den meisten Fällen nicht sichtbar. Suchmaschinen hingegen sind in der Lage, die Meta-Daten auszuwerten und zu interpretieren. Hierdurch wird dem Nutzer, dass bestmögliche, immer der Suchanfrage entsprechende Suchergebnis, angezeigt. Grundsätzlich gilt, dass nur die Informationen von Suchmaschinen ausgegeben werden können, die auch tatsächlich indexiert wurden.

Der ohnehin sehr aufwändige Prozess vom Indexieren der Daten wird zusätzlich dadurch erschwert, wichtige und relevante Inhalte von irrelevanten Inhalten zu trennen. Bei diesem Prozess spricht man vom Data Mining. Die gesammelten Inhalte werden sortiert und in den Suchergebnissen, passend zur Suchanfrage, ausgegeben. Hierbei wird eine bestimmte Hierarchie berücksichtig, um die Ergebnisse in einer bestimmten und nicht zufälligen Reihenfolge anzuzeigen. Um die Qualität der Suchergebnisse zu steigern, wird der Indexierungsprozess bei den gängigen Suchmaschinen immer wieder verbessert und an aktuelle Erkenntnisse angepasst. Durch diesen Anpassungsprozess schafft es beispielsweise Google, dass fast immer das vom Nutzer gewünschte und erwartete Ergebnis ganz bzw. weit oben in den SERPs zu finden ist.

Die Indexierung aus Sicht der Suchmaschinenoptimierung

Suchmaschinenoptimierer wollen immer eins: Mit der Webseite (besser) gefunden werden! Aus diesem Grund ist eine erfolgreiche Indexierung der Webseite aus Sicht von SEOs sozusagen der erste Schritt und damit unabdingbar. Der Betreiber einer Webseite hat an dieser Stelle mehrere Möglichkeiten.

Soll eine Webseite in den Index einer Suchmaschine mit aufgenommen werden, muss zunächst eine wichtige Voraussetzung geschaffen werden. Die Webseite muss für den Crawler erreichbar sein. Damit eine Indexierung der Webseite möglichst effizient und vor allem schnell erfolgen kann, kann die entsprechende Webseite mittels eines Formulars bei der gewünschten Suchmaschine eingetragen werden. Eine Suchmaschinenanmeldung über ein solches Formular ist bei Google notwendig, da Google eigenständig in der Lage ist, neue Webseiten zu erkennen und zu indexieren. Mit Hilfe der Meta-Daten kann die Suchmaschinen bei der Erkennung bzw. Indexierung der Inhalte unterstützt werden. Meta-Daten werden eingesetzt, um Inhalte einer Webseite besser zu beschreiben.

Möchte man das Indexieren einer bestimmten Seite durch den Crawler unterbinden, können auch hier Meta-Tags verwendet werden. Möchte man den aktuellen Indexierungsstatus einer Seite abfragen, bietet Google mit der Google Search Console eine ideale Möglichkeit. Allerdings setzt das ein paar wenige Schritte voraus. So muss zunächst eine Anmeldung erfolgen, dann muss eine Property erstellt und bestätigt werden. Sind diese Schritte erfolgt, kann in der Search Console eingesehen werden, welche URLs bereits durch den Crawler indexiert wurden. Möchte man Google bei der Indexierung der Webseite behilflich sein, sollte die Sitemap der betreffenden Webseite über die Search Console hochgeladen werden.

CSV-Datei

CSV ist ein Dateiformat, mit dessen Hilfe der Aufbau einer Textdatei beschrieben wird. Das CSV Dateiformat ist in der Lage, größere Datenmengen (strukturierte Daten) zu

Weiterlesen >>

Google Hummingbird Update

Nach dem Penguin Update im April 2012 folgt nun das Hummingbird Update im September 2013. Hummingbird („Kolibri“) soll laut Google daraufhin weisen, dass Ergebnisse präziser

Weiterlesen >>

Domain Popularity

Die Domain Popularity (deutsch: Domainpopularität oder Domainbeliebtheit) gibt an, auf wie vielen verschiedenen Domains eine Webseite verlinkt wurde. Dabei ist nicht die Anzahl der Links

Weiterlesen >>

Spyware

Spyware bezeichnet eine Software, die einzig und allein darauf ausgelegt ist, bestimmte Dinge auszuspionieren. Daher auch der Name Spyware (engl. Spy: Spion). Mit Hilfe dieser

Weiterlesen >>

SERP

Die Abkürzung SERP kommt aus dem Englischen und steht für Search Engine Result Pages (deutsch: Suchergebnisseiten), also die angezeigten Suchergebnisseiten bei Suchmaschinen wie Google. SERPs

Weiterlesen >>