Suchmaschinen decken nur einen Teil des Internet ab. Im Wettkampf um den weltgrössten
Index gibt es zwar immer neue Rekorde, doch das Web wächst unaufhörlich,
die Kluft zwischen erfassten Webseiten und Suchmaschinenindizies wird immer grösser.
Die Indizies von Suchmaschinen sind nicht deckungsgleich.
Wie aus nachstehender Illustration zu ersehen ist, werden nur Teile des Webs gleichzeitig
von mehreren Suchmaschinen erfasst. Das kann jeder Websitebtreiber nachvollziehen,
der weiss, dass nicht alle seiner Seiten in allen Suchdiensten erfasst ist. Die
Listung von Webseiten hängt beispielsweise davon ab, ob Seiten angemeldet
wurden, wie oft Suchmaschinen Seiten neu indexieren, wie tief sie indexieren,
ob alle Seiten mit Links untereinander verbunden sind,...
Die Illustration stellt keine korrekten Grössenverhältnisse im WWW
dar. Sie dient nur zur besseren Veranschaulichung der unterschiedlichen Erfassungsbereiche
von Suchmaschinen.
Eine grössere Abdeckung können Meta-Suchmaschinen realisieren. Durch
die Abfrage mehrerer Suchdienste wird ein grösserer Datenpool abgefragt.
Im obigen Beispiel die Menge aller 3 Suchmaschinen.
Abgefragte Quellen
In der Regel werden Suchmaschinen und Webverzeichnisse abgefragt. Es bietet sich
jedoch an, weitere Quellen wie Enzyklopädien, Wörterbücher, Newsgroups,...
in die Abfrage einzubeziehen. Das sind in der Regel dynamische
Webangebote die von Suchmaschinen gar nicht abgefragt werden.
Die Qualität der Ergebnisse kann in Abhängigkeit vom Suchbegriff gegenüber
reinen Suchmaschinen erhöht werden.
Einfluss der Seitengestaltung
In den Ergebnislisten von Suchmaschinen werden nur Teile einer Webseite angezeigt.
Das sind der Seitentitel und ein Kurztext. Der Kurztext wird generiert aus:
1. Dem Meta-Tag Description oder
2. Die ersten sichtbaren (ca. 180 bis 250) Zeichen des Seitentextes oder
3. Direkt aus dem Volltext, einige Worte vor und nach dem Suchbegriff (Beispiel:
Google)
Nur Titel und Beschreibung stehen den Meta-Suchmaschinen zur Verfügung, um
in akzeptabler Zeit eine eigene Liste zu erstellen.
Anfrage übersetzen
Suchdienste starten mit unterschiedlicher Syntax, Abfragen werden so übersetzt,
dass sie von allen beteiligten Suchdiensten gleichermassen interpretiert werden.
Mehr Infos zur unterschiedlichen Syntax im Grundlagenartikel: Suchoptionen
Einfluss der Abfragezeit
Jeder Suchdienst hat eine interne Abfragezeit bis er die Ergebnisse für eine
Anfrage bereitstellen kann.
Damit sich diese Zeiten nicht addieren, muss eine Metasuchmaschine parallel, also
zeitgleiche abfragen können. Je mehr Ergebnisse abgefragt werden um so länger
dauert die Verarbeitung dieser Daten.
Viele einfache Metasuchmaschinen liefern deshalb nur eine begrenzte Anzahl Treffer,
es könnte sonst sein, dass die Nutzer vor Ungeduld auf den nächsten
Suchdienst ausweichen. Gute Meta-Suchmaschinen können solange Ergebnisse
liefern wie die abgefragten Suchdienste das können.
Ergebnisse sortieren
Nach der Abfrage müssen alle Ergebnisse in einer Liste zusammengefasst werden.
Unterschiedliche Formate der Ergebnisliste sind dabei auf ein einheitliches Look
and Feel zu bringen.
Dazu gehört auch die Anzeige der Fundstelle. Gute Anzeigen geben auch die
jeweiligen Platzierungen in den abgefragten Suchdiensten mit aus.
Ranking der Ergebnisse
In der generierten Liste muss die Platzierung neu bestimmt werden. Das sollte
in Abhängigkeit der Häufigkeit des Vorkommens in anderen Suchdiensten
und den dortigen Platzierungen erfolgen.
Aussortieren doppelter Ergebnisse
Bei der Abfrage mehrerer Suchdienste können natürlich Ergebnisse mehrfach
vorkommen. Diese müssen zusammengefasst und in ihrer Gesamtheit gewertet
werden. Ist beispielsweise eine Seite in drei Suchdiensten auf Platz eins, dann
soll sie trotzdem nur einmal angezeigt werden.
Aussortieren toter Links
Diese Aufgabe kann die Metasuchmaschine zwar theoretisch übernehmen, dieser
Vorgang benötigt in der Praxis sehr viel Zeit.
Eine zusätzliche Option in der Ergebnisliste erscheint hierfür sinvoll.
Beschreibungstexte übernehmen
Alle Angaben der Originalsuchmaschine sollen in der einheitlichen Ergebnisliste
der Meta-Suchmaschine erscheinen.
Wichtig ist, Angaben über den Bieterpreis wie etwa von Overture mit zu übernehmen. Die Nutzern sollen selbst entscheiden können, ob
sie Ranking gegen Bezahlung als relevant erachten.