Quality Rater und Spam Bewertung - Google

Richtlinien für Google Quality Rater – Stand März 2011

Suchmaschinen benötigen trotz ausgefeilter Algorithmen menschliche Bewerter der Suchresultate. Ein ziemlich aktueller Leitfaden vom März 2011 erklärt, wie Quality Rater gegen Spam vorgehen sollen und die Nützlichkeit von Webseiten einschätzen.

Falls eine Seite nur dafür existiert Geld zu machen, ist die Seite Spam.

.

Die PDF-Datei der Rating Guidelines ist mit dem Datum 30.März 2011 und der Versionsnummer 3.18 versehen. An keiner Stelle des Dokumentes gibt es ein Google Logo oder Schriftzüge, die das Dokument als Produkt von Google ausweisen.

Es gibt Stellen an denen man sich fragt, ob das Dokument ausschliesslich für die Arbeit mit Google-Suchtreffern geschaffen wurde. Auf Seite 55 wird eine Suchergebnisseite von Google abgebildet. Direkt darunter ein Shopping-Ergebnis von Bing. Auf der nächsten Seite noch einmal: Video-Ergebnisseite von Google, Bilder Ergebnisseite von Bing.

Auf Seite 63 werden Evaluators von Leapforce und  LionBridge Raters erwähnt. Die Firma LionBridge nimmt für sich in Anspruch, über ein globales Rater-Team von mehr als 4 500 Personen zu verfügen. Eine LionBridge Ausschreibung für Deutschland findet sich hier:
Internet Assessor (DE). Die Stelle ist als Heimarbeit für 10 bis 20 Stunden pro Woche ausgeschrieben.

Das Dokument verweist auf zahlreiche Bildschirmfotos die Spam an praktischen Beispielen wie etwa Keywordstuffing darstellen. Die URL der Screenshots beginnen alle so:
https://google.com/evaluation/portal/

Für mich kein eindeutiger Beweis, dass Google Verfasser des Dokumentes ist. Die Vermutung, dass die oben genannten Firmen im Auftrag von Google arbeiten liegt jedoch nahe.

Diese Qualitätsrichtlinie deckt nur einen Typ der Qualitätsbewertung für die Suche ab:  URL Rating. Neben dem URL-Rating erwähnt die Anleitung “Side-by-Side” und “Display Block” Projekte.

Quality Rating ist Teamarbeit

Quality Rater sind nicht auf sich allein gestellt. Jede Meinung eines Quality Raters wird von anderen Ratern zusätzlich bewertet. Möglicherweise entstehen gegensätzliche Auffassungen, die geklärt werden müssen.

Die Qualitätsbewertung von Seiten ist ein Vorgang der erlernt werden muss. Die Rater müssen sich dafür in die Situtaion der Nutzer versetzen. Sie haben zu entscheiden welche Absicht wohl dahinter steckt, wenn in englischer Sprache nach apple gesucht wird. Ein Beispiel legt nahe, dass vorrangig das Unternehmen Apple gesucht wird, nicht die Frucht.

Stufen der Qualitätsbewertung und Spambewertung

Die vielen Lernbeispiele zeigen, Quality Rater müssen sich im Arbeitsprozess qualifizieren. Fehler in der Einschätzung sind nicht ausgeschlossen. Oftmals hängt die Bewertung von Spam von subjektiver Sichtweise ab. Es gibt folgende Stufen für die “objektive” Qualitätsbewertung:

 

  • Vital – Eindeutig, dass eine bekannte Seite wie die New York Times oder bekannte Personen gesucht werden.
  • Useful – Hilfreich für die meisten Nutzer.
  • Relevant – Hilfreich für viele oder einige Nutzer.
  • Slightly Relevant – Nicht hilfreich für die meisten Nutzer aber ein bisschen verwandt mit der Suchanfrage. Einige wenige Nutzer würden die Seite als nützlich empfinden.
  • Off Topic or Useless – Hilfreich für sehr wenige oder gar keine Nutzer.
  • Unratable – Seite kann nicht bewertet werden.

Webseiten, die als Spam klassifiziert werden, können folgende Flags bekommen:

  • Kein Spam
  • Vielleicht Spam
  • Spam
  • Porno
  • Malicious – Schädlich

 

Die differenzierte Bewertung zeigt, dass Rater die Frage wirklich verstanden haben müssen. Ebenso müssen Rater in der Lage sein, die wirklich relevanten Antworten zu bewerten. Im Guide wird ausdrücklich darauf hingewiesen, dass hohe Bewertungen nicht einfach deshalb vergeben werden sollen, weil ein Treffer an der Spitze der Suchergebnisse erscheint.

 Suchergebnisse interpretieren

Fragen haben mitunter mehrfache Bedeutungen, verlangen mehrfache Antworten. Die Frage nach windows in englischer Sprache verlangt vorrangig nach dem gleichnamigen Betriebssystem von Microsoft, suggeriert die Anleitung. Die Antwort soll sich nicht mit Fenstern beschäftigen, obwohl windows genau das sind: Fenster. Diese Auslegung der Suchanfrage wird dominante Interpretation genannt.

Für die Frage nach mercury (Merkur, Quecksilber) werden Antworten zu einem Auto, Planeten oder chemischen Element gesucht. Die Notwendigkeit mehrere Antworten zu liefern wird Common Interpretations, allgemeine Interpretationen, genannt.

Minor Interpretations sind Varianten der Antworten die nicht allgemein üblich sind. Für mercury werden die Beispiele Mercury Marine Insurance und San Jose Mercury News genannt.

Quality Rater müssen die Absichten der Nutzer erkennen

Folgende Aktionsmöglichkeiten der Nutzer werden unterschieden

Do –  Der Nutzer möchte etwas tun. Einen Einkauf tätigen, Musik hören oder ein Video ansehen. Eine Software downloaden, Blumen online versenden, ein Spiel spielen, lesen usw.

Know– Es wird nach Wissen gesucht. Wegbeschreibungen, Anleitungen, Erläuterungen usw.

Go – Fragen dienen der Navigation. Nutzer wollen an ein bestimmtes Ziel im Internet gelangen. Die Menükarte eines bestimmten Restaurants, die Login-Seite eines Sozialen Netzwerkes, Das Impressum einer bestimmten Firma usw.

 

Erkennbar ist die Vielfalt, wie ein Treffer bewertet werden kann. Unmöglich, dies in der Hand von einer Person zu lassen. Deshalb arbeiten Quality Rater, wie oben beschrieben in Teams. Mehrere Bewertungen sind notwendig um ein möglichst einheitliches Bewertungsbild aufstellen zu können.

Spambewertung durch Quality Raters

Jede Seite, die täuschende Techniken einsetzt, soll als Spam markiert werden. Unabhägig davon, wie nützlich diese Seite ist. Die Ursachen für Spamming fallen nach diesem Guide in zwei Kategorien:

Geld verdienen mit

  • Pay-per-Klick Anzeigen – Durch Klick auf die Anzeigen wird Geld verdient.  Seiten mit PPC-Anzeigen sollen nur dann als Spam gekennzeichnet werden, wenn sie ausschliesslich zum Geldverdienen angelegt und nicht nützlich für Besucher sind.
  • Dünne Affiliates – Werbung für Produkte von Händlern bringt Geld, nachdem Produkte beim Händler gekauft wurden.

Einige Spamtechniken haben nicht direkten Gelderwerb als Ziel. Diese Spamseiten sind dafür ausgelegt, das Ranking in Suchmaschinen zu ändern oder Nutzer auf Seiten mit betrügerischen Downloads zu leiten.

Werkzeug zur Spamerkennung

Die Quality Rater sollen ausschliesslich mit dem Webbrowser Firefox arbeiten. Zusätzlich hilft das Add-On Web Developer, Spam-Techniken aufzudecken.

Spam Techniken

Unsichtbarer Text und unsichtbare Links

Unsichtbar für das menschliche Auge. Gleiche oder sehr ähnliche Farbe wie der Hintergrund, sehr, sehr kleine Formatierung. Platzierung ausserhalb der normalen Sichtzone. JavaScript kann Text unsichtbar machen.

Keyword Stuffing

Der Begriff wird viele Male auf der Seite wiederholt. Mitunter finden sich auch viele Falschschreibungen des Wortes auf der Seite. Wörter, die in Beziehung zum Keyword stehen, werden viele Male auf der Seite wiederholt.

Mitunter ist es schwierig Keyword Stuffing zu bewerten. Ein Spam-Flag soll gesetzt werden, wenn der Gebrauch des Keywords übertrieben und belästigend und störend erscheint. Belästigt die Zahl der Keywords nicht die Nutzer, soll kein Spam-Flag gesetzt werden.

Wird ausschliesslich der Meta-Tag Keywords mit Begriffen zugestopft, soll die Seite nicht als Spam gekennzeichnet werden.

Cloaking

Weiterleitungen per JavaScript sowie Framesites, mit 100% Frame werden als Spam benannt.

URL Keyword Stuffing

Im Gegensatz zu Texten, wo sich Keywordstuffing auf die übermässige Verwendung des gleichen Keywords bezieht, geht hier der Bezug auf sehr lange URL, insbesondere lange Domain-Namen. Die Verwendung vieler Bindestriche wird als Spam-Signal angesehen.
Ein Beispiel könnte so aussehen:
http://brasilianisches-model-moechte-liebhaber.moechteliebe.cn/brasilianisches-modell-lima.html
Diese URL habe ich frei übersetzt nach der englischen URL im Quality Rater Handbuch.

 Sneaky Redirects

Betrügerische Weiterleitungen mit Spam-Absichten. Nur Weiterleitungen zwischen unterschiedlichen Domains können als betrügerisch gelten. Weiterleitungen auf der gleichen Domain gelten nicht als betrügerisch. Spam Absichten werden vor allem dann unterstellt, wenn Suchmaschinen nur die weiterleitende URL zu “sehen” bekommen, nicht die URL auf welche die Besucher weiter geleitet werden.  Zu den betrügerischen Weiterleitungen gehören auch Weiterleitungen per Java-Script.

Kopierte Texte und PPC-Anzeigen

Werden Texte von anderen Websites kopiert, teilweise mittels sogenannte Scraper-Software und gemeinsam mit Anzeigen präsentiert, so sind diese als Spam einzustufen. Selbst wenn es sich um Texte von Wikipedia oder dem Open Directory Projekt (ODP) handelt. Diese Texte zu kopieren ist ( unter entsprechenden Voraussetzungen) nicht illegal. Häufig sind diese Texte jedoch veraltet und somit nicht ausreichend vertrauenswürdig.

Feeds und PPC-Anzeigen

Werden frei verfügbare RSS oder XML-Feeds gemischt und mit Anzeigen versehen angeboten, so werden diese als Spam eingestuft.

Doorway Pages

Eine Serie von Seiten, welche für Suchmaschinen erstellt wird, die Nutzer zu einer allgemeinen Zielseite führt.

 

Phishing ist kein Spam

Auf Seite 108 des Dokumentes unter dem Punkt 6.0 werden Phishingseiten erklärt. Am Beispiel einer Seite die das Bankpasswort und die PIN des Nutzers abfragen. Diese Art von Seiten sollen die Quality Rater weder als Spam noch als Malicious (boshaft) bewerten. Es gibt an dieser Stelle auch keinen Hinweis darauf, wie Google Nutzer vor solchen Webseiten schützen möchte.

Vermutlich kein Spam

Sind sich Rater unsicher ob eine Seite als Spam einzustufen ist, sollten folgende Fragen beantwortet werden:

  • Werden die Nutzer mit einem guten Sucherlebnis versorgt?
  • Enthält die Seite originale Inhalte die nützlich für die Besucher sind?
  • Soll die Seite in Suchresultaten erscheinen?
  • Ist die Seite für Nutzer gestaltet? Gibt es ein menschliches Element in der Seite?
  • Gibt es nützliche Elemente, wenn PPC-Anzeigen und kopierte Texte von der Seite entfernt werden?

Werden alle Fragen mit Ja beantwortet, ist die Seite vermutlich kein Spam.

 

Search Engine Land -Beitrag mit Download-Link:
Download The Latest Google Search Quality Rating Guidelines


Posted

in

,

by

Comments

4 responses to “Richtlinien für Google Quality Rater – Stand März 2011”

  1. Nico Avatar

    hab ich gestern Abend im Original auf englisch durchgeackert das Dokument. Im Prinzip nix Neues drin, mich hat allerdings gewundert, dass die Rater das Thema Linkverkauf und Linkmietean keiner Stelle zu beachten haben und auch keine Meldung dazu machen sollen…. 😉

  2. Holger Avatar
    Holger

    Danke, gute Zusammenfassung!

    Ich kann mir vorstellen, dass das Thema Linkkauf und Linkmiete in gesonderten “Abteilungen” beziehungsweise grundsätzlich inhouse abgearbeitet wird.

    Ein Hinweis ist, dass es für bezahlte Links ein gesondertes Melde Tool gibt. Ebenso wie für Phishing, wofür den QRs ja auch keine Angabe zum Vorgehen gemacht wird.

    Was steht dazu genau drin, sollen phishing url´s gemeldet werden? Oder wird nur erklärt was eine phishing seite ist und das wars?

  3. Klaus Patzwaldt Avatar
    Klaus Patzwaldt

    Ich bin mir ziemlich sicher, dass es andere Abteilungen gibt, die sich mit “unnatürlichen” Verlinkungen beschäftigen. Wie oben beschrieben behandelt das Dokument nur URL-Rating.

    Nein, Phishing-Seiten sollen nicht gemeldet werden. Auf Seite 108 heisst es nach der konkreten Nennung einer Phishing-URL:

    Das beunruhigendste an dieser Seite ist, dass sie Bank-Passwort und PIN-Nummer der Nutzer abfragt.
    Obwohl wir mit dieser Seite nicht interagieren wollen, diese Art von Phishing verstösst nicht gegen die Webspam-Richtlinien und soll nicht als Spam oder schädlich gekennzeichnet werden.

    Bitte kennzeiche nur Seiten die in eine der Spamkategorien, die in diesem Guide beschrieben werden, fallen.

    Einige Phishing-Seiten mögen Spam sein. Diese ist es nicht.

  4. Marc Avatar

    Ich gehe auch davon aus, dass es zweifellos eine andere Autorität für spamhaftes Link Building und “schlechte” Backlinks geben muss, ansonsten kämen diese Praktiken ja ungestraft davon.