MSN Suche mit RankNet

Aus der Microsoft Forschungsabteilung erhielt die MSN Suchmaschine einen neuen Algorithmus zur Berechnung der passenden Treffer. Ein neurales Netz ist für die neueren Ergebnisse der MSN-Suchmaschine zuständig. Lernende Algorithmen sorgen dafür, dass schrittweise zutreffendere Ergebnisse erzielt werden. Das ist ganz klar der Weg, den Suchmaschinen gehen müssen und gehen werden. Ich bin fest überzeugt, dass Google schon längere Zeit mit lernenden Algorithmen arbeitet. Offiziell gibt es von Google keine Erklärungen dazu. Doch allein die Art und Weise wie Updates gefahren werden, sind deutliche Hinweise auf die Verwendung lernender Algorithmen. Klar ist bei diesen Prozessen, dass die “gewünschten” Treffer nicht in jedem Fall kontinuierlich auf vordere Plätze wandern. Lernen heisst immer auch Irrtum bei der Anwendung. Deshalb fallen mitunter gute Seiten weiter zurück als bei der Konzeption der Algorithmen beabsichtigt.
Das neurale Netz wird bei Microsoft das RankNet genannt.
Neurale oder auch neuronale Netze gibts es bereits seit vielen Jahren. Es ist jedoch ein Unterschied ob diese Netze für eher begrenzte Aufgaben auf wenigen Computern laufen, oder einen Umfang von mehren Milliarden Webseiten verarbeiten.

Zusätzlich wurden neue Suchoperatoren eingeführt.
FileType: Wird eingesetzt um andere Dateitypen als nur HTML zu finden.
InAnchor: Findet Linktext zu einer bestimmten Seite
InURL: Beschränkt die Suche auf die Internetadresse (URL)
InTitle: Sucht nur im Seitentitel
InBody: Sucht nur im sichtbaren Seitentext
LinkDomain: Findet alle externen Links zu einer kompletten Domain
Contains: Ist ein experimeteller Operator. Soll Dokumente anzeigen, die Verweise auf einen bestimmten Dokumenttypen enthalten. Contains:PDF soll z.B. Webseiten finden, die auf PDF-Dateien verweisen.

MSN Search’s WebLog : Local, Relevance, and Japan!

Forschungspapier zum Neuralen Netz (PDF-Datei): Learning to Rank using Gradient Descent


Posted

in

by

Tags: