Neueres PageRank Patent bestätigt

Am 6. Juni 2006 wurde eine neuere Version des PageRank Patentes bestätigt. Der PageRank ist ein Kriterium für die Bewertung von Web-Seiten durch Suchmaschinen. Für die Bewertung des PageRank werden Seiten im Web herangezogen, welche auf eine Seite verweisen, diese “zitieren”. Die beschriebene Methode soll besonders Suchmaschinen für verlinkte Medien mit sehr grossen Qualitätsunterschieden von Seiten, (wie sie im WWW zu finden sind), bessere Möglichkeiten zur Bewertung von Dokumenten bieten.

Für die Ermittlung des PageRank werden nicht nur die verweisenden Seiten und deren Wert ermittelt. Zusätzlich werden alle Seiten ermittelt, welche auf die verweisenden Seiten verweisen und es wird ebenfalls deren Wert ermittelt. Somit entsteht praktisch ein zweistufiges Bewertungssystem.

Es werden im Patent einige zusätzliche Methoden aufgelistet, die dafür sorgen können, exaktere Ergebnisse zu liefern.

  • Nach der Anfrage eines Nutzers wird eine Menge von Dokumenten die zur Suchanfrage passen, ermittelt. Die Links zu diesen Dokumenten von korrespondierenden, verweisenden Dokumenten werden ermittelt und auf Basis der Anzahl und Bedeutung der Links zu diesen korrespondierenden Dokumenten bewertet und daraus das Ranking gebildet.
  • Um die künstliche Beeinflussung von Links zu minimieren, können lokale Links einer Domain unberücksichtigt bleiben. Ebenso können Links von einem Webserver weniger stark bewertet werden, als Links von anderen Webservern. Zusätzlich können Internet Domains und Gewichtungen der Link-Distanz berücksichtigt werden.
  • Der Rank kann für Dokumente höher bewertet werden, die von unterschiedlichen Institutionen, Autoren und geografischen Standorten stammen. Ebenso können Links von bedeutenden Seiten, wie der Startseite einer Domain, höher bewertet werden.
  • Links können nach deren relativen Bedeutung innerhalb eines Dokumentes bewertet werden. Gut sichtbare Links im oberen Bereich eines Dokumentes können beispielsweise höher bewertet werden. Ebenso Links, die mit grossen Schriftarten ausgezeichnet sind oder auf andere Art hervorgehoben werden.
  • Links von Seiten die kürzlich modifiziert wurden, können höher bewertet werden, da es unwahrscheinlicher ist, dass diese veraltet sind.
  • Echte Nutzungsdaten können, wenn verfügbar, als Ausgangspunkt für das Ranking Model genutzt werden. Auch wenn diese nicht den aktuellen Traffic wiederspiegeln, wird dennoch zu einem bestimmten Grad ermittelt, wie häufig ein Dokument im Web erscheint.
  • Die Bedeutung der Ankertexte wird hervorgehoben. So können selbst Dokumente bewertet werden, die nicht gecrawlt wurden. Oder bestimmte Dokumenttypen, die selbst keinen Text enthalten wie Bilder, Programm-Dateien, usw.
  • Wenn der Suchbegriff mit dem Ankertext oder dem Seitentitel von verweisenden Seiten übereinstimmt, kann das Dokument als passend eingestuft werden, sogar wenn im Dokument selbst der Suchbegriff nicht vorkommt.

Die Bestätigung dieses Patentes liegt erst wenige Tage zurück. Der Zeitpunkt der Einreichung jedoch 5 Jahre. Das ist im Internet eine sehr lange Zeit. Einige der beschriebenen Methoden können bereits angewendet werden, andere nicht zum Einsatz kommen. Sicherlich gibt es bereits weitere, hier nicht beschriebene Kriterien die zum Ranking herangezogen werden. Der Google-PageRank Algorithmus, der die Bedeutung einer Seite untersucht, überwacht mehr als 200 verschiedene Signale.

Das Patent:
Method for node ranking in a linked database

Das Patent wird als Fortführung des ursprünglichen PageRank Patentes ausgewiesen.


Posted

in

,

by