ImageRank – Visueller PageRank für Bilder

Das auf der WWW-Tagung 2008 vorgestellte Verfahren zum Ranking von Bildern ist zunächst für die Google Produktsuche angewendet worden. Die Anwendung visueller Signale unterscheidet sich wesentlich von kommerziellen Ranking-Anwendungen die einer sehr grossen Skalierbarkeit unterliegen.
Kommerzielle Suchmaschinen nehmen derzeit lediglich den Text um das Bild herum und ignorieren den Inhalt des Bildes als Rankingsignal. Das Verfahren wurde in einer Produktsuchmaschine für die 2000 häufigsten Anfragen Suchanfragen nach Produkten optimiert. Mit einem Team von 150 freiwillig beteiligten Google-Beschäftigten wurde ein Punktesystem für Bildrelevanz erstellt. Im Ergebnis wurden 83% weniger Bilder unter den ersten zehn Treffer gerankt, die nicht relevant zur Abfrage sind.

ImageRank basiert auf Methoden zur Bilderkennung. Algorithmische Bilderkennung befindet sich jedoch in einem sehr frühen Stadium, und ist alleine nicht in der Lage die Inhalte eines Bildes wirklich zu erkennen. Gewisse Strukturen, Formen und Farben werden erkannt. Daraus lassen sich nur bedingt Rückschlüsse auf den Bildinhalt ziehen. Die Erkennung von Gesichtern und CD-Cover hat beachtliche Fortschritte gemacht. Die allgemeine Erkennung von Objekten in Bildern bleibt ungelöst. Deshalb ist es immer noch zwingend notwendig, Texte auszuwerten, die sich in der Umgebung des Bildes befinden und dieses vermutlich beschreiben. Selbst für die oben genannten akzeptablen Möglichkeiten der Bilderkennung, ist eine immense Rechenleistung notwendig. Diese steigt immens mit der zunehmenden Bildgrösse der veröffentlichter Bilder im Internet. Die notwendige Rechenleistung um alle erfassten Bilder im Googleindex zu analaysieren überfordert die Anforderungen effektiver Verfahren für die Bearbeitung eines weltweiten Indexes.

Im vorgestellten ImageRank-Verfahren werden die visuellen Ähnlichkeiten zwischen Bildern untersucht. Es genügt jedoch nicht, diese Ähnlichkeit mit Punkten zu bewerten. Zwischen den Bildern werden automatisch Graphen entwickelt, die auf der Ähnlichkeit der Bilder beruhen. Diese Graphen werden zur Berechnung mit einem iterativen Verfahren, das vergleichbar mit der Berechnung des PageRank ist, herangezogen.

Zwischen einer Gruppe von Bildern kann eine “visuelle Linkstruktur” analysiert werden. Diese “Linkstruktur” wird in einem interativen Verfahren berechnet, so wie das für die Berechnung des PageRank gehandhabt wird. Jedes Bild bekommt einen numerischen Wert zugeordnet. Dieser Wert bestimmt seine relative Relevanz, während eines Suchlaufs und wird mit den Werten anderer Bilder verglichen. Das läuft natürlich nicht ohne Probleme. Bestimmte Suchanfragen müssen eigentlich mit einer Vielfalt von Erläuterungen beantwortet werden. Als Beispiel wird Nemo genannt. Sehr viele Menschen erwarten, einen kleinen bunten Fisch zu sehen, der in dem Filmstreifen “Findet Nemo” den Hauptakteur darstellte. Laut Wikipedia bezeichnet Nemo (lat. Niemand) ua. folgendes: Decknamen von Odysseus, einen Vulkan, eine Stadt, einen Asteroid, eine Musikband, eine Musiksingle, einen Neutrinodedektor, ein Wissenschaftsmuseum, usw.
Die Entwickler des ImageRank Verfahren beschränken sich darauf, Bilder wiederzugeben, die vermutlich den Erwartungen der Mehrzahl der Nutzer entspricht. Für “nemo” ist das also der kleine bunte Fisch aus dem Kinofilm.

Ganz klar zu unterscheiden ist: Das PageRank Verfahren berücksichtigt Verweise zwischen Dokumenten.
Im ImageRank Verfahren werden “visuelle Hyperlinks” als eine Funktion der visuellen Ähnlichkeit zwischen den Bildern betrachtet. Gleich ist lediglich das Verfahren zur Analyse der Graphen.

Die Algorithmen sollen durch ein nachgeordnetes Ranking die Qualität der Google Bildersuche erhöhen. Das Verfahren selbst ist zu aufwendig um für den kompletten Bilderindex von Google verwendet zu werden. Deshalb werden die Bilder zunächst in Cluster zusammengefasst, basierend auf Text, Ankertext und themenverwandschaft der Websites auf denen die Bilder gefunden wurden. Zusammenfassungen von Begriffen wie “Paris”, “Eiffelturm” und “Arc de Triomphe” haben mit höherer Wahrscheinlichkeit eine Beziehung zueinander als zufällig ausgewählte Bilder. Für jede Gruppe dieser Art kann bereits ein Ranking vorberechnet werden. Diese Vorberechnung wurde für 2000 der populärsten Anfragen der Google Produktsuche durchgeführt. Nutzer haben für diese Fragen meist sehr konkrete Vorstellungen wie “iPod”, “xobx” und “Picasso”. Die Bilder wurden direkt aus dem Web gewonnen. Für optisch ähnliche Bilder ergeben sich mit der Errechnung des Image-Rank sehr brauchbare Ergebnisse. Hier eine Beispiel für Mona Lisa, das die ersten tausend Treffer für diese Anfrage verwendet:
image rank

1000 Anfragen von 2000 wurden als geeignet empfunden, durch den Image Rank optimiert zu werden. Für diese 1000 Anfragen wurden die ersten tausend Treffer der Google Bildersuche ausgewertet, unter Verwendung des Kinderschutzfilters (Sichere Suche). Für 762 Anfragen konnten bessere Ergebnisse erzielt werden, als sie Google liefert. Für 70 Anfragen produzierte die Standard-Google Bildersuche bessere Ergebnisse.

Die Autoren vermitteln, dass die Nutzererfahrung nicht allein mit Relevanz zu bedienen ist. Unter anderem sei eine Vielfalt der Bilder gefordert. Zukünftige Untersuchungen sollen die Problematik nahezu identischer Bilder lösen, die eher eine Gleichartigkeit der Treffer suggerieren.

PageRank for Produkt Image Search


Posted

in

by

Tags:

Comments

One response to “ImageRank – Visueller PageRank für Bilder”

  1. SEOnaut Avatar

    Heisst das jetzt, dass ich mit langen Beinen, großen Brüsten und HotChicks nichts mehr reizen kann ;-). Aber Spaß bei Seite. Das ganze ist doch so in Anfängen, dass an einen echte algorithmische Umsetzung kaum gedacht werden kann.