Yahoo! – Patent für aktuellere Suchergebnisse

Am 27.06.2006 wurde ein von Yahoo! eingereichtes Patent genehmigt, das sich mit der Verbesserung von Suchergebnissen beschäftigt. Speziell geht es darum, andere Verfahren als das Crawlen von Web-Seiten einzubeziehen um möglichst aktuelle und relevante Ergebnisse zu erhalten.

Der immer noch gängige Weg zum erfassen von Web-Seiten besteht darin, mit einem Crawler die Website zu besuchen und einzelne Seiten zu crawlen. Die Suchmaschine muss bestimmen, wie häufig eine Seite wieder besucht wird, um deren Inhalte aktuell zu halten. Probleme werden insbesondere für Seiten gesehen, deren Haltbarkeitsdatum nur einige Stunden oder Tage betragen können. Dazu gehören Anbietern von Auktionsseiten wie eBay, aber auch Jobbörsen, Nachrichtenseiten, Kleinanzeigenmärkte usw.. Es passiert häufig, dass die Seiten in der Suchmaschine zu finden sind, obwohl ein Angebot bereits abgelaufen ist. Die Besucher bekommen nicht mehr die Inhalte geboten, die sie laut Ergebnisliste erwarten könnten.

Bessere Ergebnisse verspricht man sich von einer direkten Abfrage der Server des Anbieters. Über ein Programmierschnittstelle (API) erhält der Suchmaschinenbetreiber beim Anbieter direkten Zugriff auf die Datenbanken. Über bestimmte Schlüssel lässt sich definieren, wann welche Seiten abgelaufen sind. Das könnten Namen von Shops, spezielle Kategorie-ID und andere Erkennungsmerkmale sein. Durch diese Indentifizierung soll eine besseres partielles Update möglich sein. Nur Seiten, deren Inhalte sich wirklich geändert haben, werden aktualisiert. Direkt aus der Datenbank, nicht über die ausgelieferten Web-Seiten!
Im Ergebnis können aktuellere Inhalte in der Ergebnisliste der Suchmaschine geliefert werden. Die Belastung der Systeme von Suchmaschinenbetreiber und Anbieter der Inhalte lässt sich durch diese gezielte Erfassung senken.

United States Patent Application: 0060167852


Posted

in

by

Tags:

Comments

One response to “Yahoo! – Patent für aktuellere Suchergebnisse”

  1. Mario Avatar

    Hmmm… Erinnert mich irgendwie an “Sitemaps” von Google. Wünscheswert wäre allerdings nicht ein Patent hier, eine API dort und eine XML-Datei da hinten, sondern endlich einen Standard, damit geplagte Websitebetreiber nicht ständig ein neues System installieren (und sich einarbeiten !!) müssen.

    Gott sei Dank gibt es in DIESER Hinsicht nicht so viel zu machen, weil es außer Gurgel und Yahuu eigentlich keinen erwähnenswerten Suchmaschinen gibt (vom Traffic her und aus deutscher Sicht gesehen). Das kann sich aber durchaus ändern und dann wird das ein ähnliches Problem wie bei den Browsern. Grrr……