Microsoft Suchmaschine jagt Spammer

Strider Search Defender heisst das automatische System zur Erkennung von Suchmaschinen-Spam. Entwickelt vom Microsoft Forschungsteam im Strider Projekt. Interessant ist, es wird keine Analyse der Inhalte durchgeführt.

Zur effektiven Erkennung werden Spam-Seiten als dynamische Programme betrachtet, nicht als dynamische HTML-Seiten. Spam-Seiten enthalten häufig Code (JavaScript, serverseitige Programme usw.) der ein bestimmtes Verhalten veranlasst. Z.B. die Weiterleitung auf eine andere Seite. Dafür werden unter anderem Techniken wie Doorwaypages und Cloaking verwendet. Die Ausführung des Codes wird für menschliche Besucher wirksam, nicht für Suchmaschinen. Um diesen Unterschied feststellen zu können, wird jede Seite mit der aktuellen Version eines Webbrowsers besucht, das Programm kann vollständig ausgeführt werden.

Neben den genannten Methoden wird für das Spamming Kommentar-Spam in Foren und Blogs genutzt. Erfolgreiche Spammer haben in der Regel sehr viele weiterleitende Einstiegsseiten (Doorwaypages) geschaffen. Das System beschäftigt sich mit der Erkennung der Domains, auf denen eine hohe Anzahl Doorwaypages abgelegt wurde, einschliesslich der Ziel-Domains, auf die weitergeleitet wird.

Search Defender arbeitet in zwei Schritten:

1. Aus einer ursprünglichen Liste als Spam identifizierter Seiten, werden von einem Programm, mit dem Namen “Spam Hunter”, Begriffe herausgezogen, die von Spammern üblicherweise verwendet werden. In Suchmaschinen wird mit diesen Begriffen nach Foren und Blogs gesucht, die gespammt werden. Aus den Ergebnislisten der Suchmaschinen werden weitere URL herausgezogen. Dieser Vorgang wird in einem Näherungsverfahren (iterativ) mehrfach wiederholt, bis eine gewisse Sättigung eingetreten ist, nur noch wenige neue URL hinzukommen.

2. Diese so gewonnene Liste ist zunächst nur eine Liste potentieller Spam-URL. Darunter befinden sich URL, die Spammern nicht zuzurechnen sind. Kommentarfelder in Blogs, Gästebüchern usw. werden schliesslich auch zum eigentlichen Zweck von ganz normalen Besuchern genutzt, um Kommentare abzugeben. Mit dem Strider URL Tracer, der als eigenständiges Programm für den Internetexplorer 6 (Windows XP), seit April 2006 der Öffentlichkeit zur Verfügung steht, werden Domains herausgefiltert, die nicht zur Spam-Szene zu zählen sind. Dazu werden zunächst alle URL besucht, die eine Weiterleitung verursachen. Die URL auf die weitergeleitet wird, kommen in eine Liste potentieller Spam-URL. Diese Liste wird mit einer sogenannten Whitelist abgeglichen. Die Whitelist enthält unter anderem legale Empfänger von Weiterleitungs-Traffic, wie etwa Domains von Google Ads usw.

Strider Search Defender bekämpft Spammer mit ihren eigenen Waffen. Je intensiver sie eine Domain per Spam-Seiten “bewerben”, je leichter wird es, den Spam zu indentifizieren. Der Spam Hunter nutzt die Zeitverzögerung zwischen der Veröffentlichung von Spamseiten und deren Erscheinen in den Ergebnissen der Suchmaschinen. Bei frühzeitiger Erkennung in Foren, Blogs usw. kann das Auftauchen von Spam-Seiten an die Suchmaschinen gemeldet werden, bevor Spam-Seiten auf vorderen Plätzen gelistet sind.

Im Report zum Strider Search Defender werden Vorschläge zur Spam-Bekämpfung unterbreitet:

– Betreiber von Anzeigennetzwerken können potentielle Spammer erkennen, wenn während der Beobachtung eine grosse Anzahl unterschiedlicher URL auf einem Kontobetreiber zurückzuführen sind. Den Autoren des Strider-Reportes erscheint es unwahrscheinlich, dass jemand in sehr grossem Umfang qualifizierte Inhalte erstellen kann.

– Die Betreiber der Ziel-Domains mögen nicht direkt in die Spam-Aktivitäten verwickelt sein, weil es deren Affiliates sind, die Spam-Aktivitäten verursachen. Die Betreiber der Affiliate-Netzwerke sollten jedoch strengere Regeln anwenden, welche den Affiliates Spam-Techniken verbieten.

– Obwohl der Inhalt von einigen Spam-Seiten eine gewisse Relevanz haben kann, sollen Betreiber von Suchmaschinen solche Seiten zur Löschung erwägen um das Spamming nicht zu fördern.

– Betreiber öffentlicher Foren, Gästebücher usw. wird geraten, eine lokale Suche (innerhalb des Forums usw.) nach Begriffen wie “blogspot.com” (Blogservice von Google) und anderen potenziellen Spam-Domains durchzuführen um zu sehen, ob das Forum dagegen geschützt ist.

Strider Search Defender wird momentan mit menschlichem Zutun betrieben, um Spam-Domains sicher einstufen zu können. Zukünftig soll der Prozess vollautomatisch ablaufen.

Selbst die menschliche Bearbeitung scheint nicht auszuschliessen, dass unbeteiligte Domains auf die Blacklist der Spammerdomains gesetzt werden. MSNDude, offizieller MSN-Vertreter in der Webmasterworld, fragt aktive Webmaster im Forum, ob deren Seiten unverschuldet betroffen sein könnten. Bleibt die Frage, wie können sich Webmaster, die nicht einschlägige Foren und Publikationen lesen, vor unbeabsichtigtem Blacklisting schützen, bzw. überhaupt davon erfahren, dass sie einem “Missgeschick” zum Opfer gefallen sind?

Strider Search Defender

Kommentar von MSNDude in der Webmaster World(4. Beitrag):
Microsoft: MSN – Strider Search Defender


Posted

in

,

by

Comments

One response to “Microsoft Suchmaschine jagt Spammer”

  1. […] uli 2006 – 23:47 Uhr
    MSN – Strider Search Defender

    Ganz interessant was bei at-Web über den MSN Strider Search Defender zu lesen ist. Dieser soll […]