Google Webmaster Central

Webmaster können sich jetzt von Google informieren lassen, wie oft ihre Seite vom GoogleBot besucht wurde. Das wird in einer anschaulichen Statistik dargestellt und lässt sich über Monate (die letzten 90 Tage) zurückverfolgen.

Aktivitäten des GoogleBot

Die Intensität des Crawl-Vorganges lässt sich ebenfalls beeinflussen. Sollten die GoogleBots eine zu hohe Serverlast erzeugen, können Nutzer der Google Webmaster Tools mit der Option “slower” das Temperament der Bots zügeln. Die Frequenz der Seitenzugriffe wird herabgesetzt. Nach jeweils 90 Tagen muss diese Option erneuert werden.

Erweiterte Bildersuche
Website-Betreiber, die ihre Zustimmung zur erweiterten Bildersuche geben, stimmen der Auszeichung der Bilder durch Labels zu. Über den Google Image Labeler können beliebige Personen, auf freiwilliger Basis, Bilder kennzeichnen. Nach freier gedanklicher Vorstellung der beteiligten Personen, werden zufällig eingeblendeten Bildern beliebige Worte (sogenannte Tags) zugeordnet. Diese Worte sollen die Qualität der Google-Bildersuche erhöhen.

Anzahl der URL in einer Sitemap
Damit Nutzer wissen, ob alle URL einer Sitemap von den GoogleBots erfasst werden, gibt Google die Zahl der URL wieder, welche in einer Sitemap gefunden wurden.
Nach meiner Auffassung wäre es praktischer, wenn die Zahl der tatsächlich erfassten Seiten übermittelt würde.

Nachfolgend noch einige Informationen, die bereits zu früheren Zeitpunkten im Google Webmaster Central Blog veröffentlicht wurden.

Gründe für unterschiedliche Suchergebnisse

Akzentzeichen
Die Eingabe von Worten mit Betonungszeichen wie z.B. México gibt Treffer mit und ohne Akzentzeichen wieder. Ergebnisse enthalten México oder Mexico. Ebenso werden umgekehrt, für die Schreibweise ohne Akzentzeichen, beide Schreibvarianten in der Ergebnisliste ausgegeben. Die Ergebnislisten sind für die beiden unterschiedlichen Anfragen zwar ähnlich, aber nicht identisch. Es enstehen geringfügig andere Sortierungen.

Umlaute
Obige Schilderung trifft für deutsche Umlaute ebenfalls zu. Die Anzahl der Resultate für überlingen und ueberlingen ist identisch. Die Reihenfolge der Treffer unterscheidet sich. Für uberlingen sind die Resultate ähnlich, es werden jedoch einige Treffer weniger gefunden.

Sprache der Bedienoberfläche
Die Bedienoberfläche für deutschsprachige Nutzer finden wir in deutscher Sprache vor, die Bedienoberfläche für spanischsprachige Nutzer in Spanisch. Die Oberfläche hat direkten Einfluss auf die Sortierung der Treffer der Ergebnisliste. Treffer mit Betonungszeichen oder Umlauten werden bevorzugt in den Ländern wiedergegeben, wo sie im Sprachgebrauch genutzt werden. Dokumente in deutscher Sprache werden bevorzugt, wenn Nutzer die deutschsprachige Oberfläche verwenden. Doch selbst wenn Nutzer aus Deutschland ( oder Österreich, Schweiz,..) zu Google.com wechseln, finden sie nicht die Reihung der Treffer vor, wie sie ein Nutzer aus den USA zu sehen bekommt. Google weiss selbst dann, dass mit hoher Wahrscheinlichkeit ein deutschsprachiger Nutzer die Abfrage stellt.
Anhand der IP-Adresse lässt sich sehr genau lokalisieren, welchem (grösserem) Ort der vom Nutzer verwendete Einwahlknoten zuzuordnen ist. Nutzer welche die personalisierte Startseite von Google gewählt haben (eingeloggt) erhalten wiederum andere Ergebnisse. Diese Ergebnisse sind vom bisherigen Suchverhalten des Nutzers beinflusst.

Indentifizierung von Google Bots

Da es leicht ist, als GoogleBot daherzukommen, ohne GoogleBot zu sein, wünschen Webmaster eine Möglichkeit, echte GoogleBots identifizieren zu können. Im Google Webmaster Blog wurde folgende Möglichkeit publiziert:

Zunächst sollte mit einem “reverse DNS lookup” sichergestellt werden, dass der Name zur googlebot.com Domain gehört. Anschliessend sollte diese Feststellung über ein “forward DNS->IP” lookup abgesichert werden:

> host 66.249.66.1
1.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.

> host crawl-66-249-66-1.googlebot.com
crawl-66-249-66-1.googlebot.com has address 66.249.66.1

Allein die Abfrage des “reverse DNS lookup” wird nicht für ausreichend gehalten, weil die Angaben per Spoofing gefälscht sein könnten.

Official Google Webmaster Central Blog: Learn more about Googlebot’s crawl of your site and more!


Posted

in

by

Tags: