Die Suchmaschine HotBot wurde 1996 von Hotwired und Inktomi gestartet. Als
amerikanischer Dienst ist die Suchmaschine offen für andere Sprachen.
HotBot gehört(e) zu den Global Playern
der Suchmaschinen. Der Volltext-Index wird von Inktomi
erstellt.
HotBot ist Bestandteil der Lycos-Unternehmensgruppe.
Inktomi gehört seit Ende 2002 dem Yahoo! Unternehmen.
Anzahl erfasster Webseiten: 2 Milliarden, September 2002
500 Mill. (Stand Dezember 2000)
Eintrag der Index-Software(ins Logfile):
Name: Slurp
Eintrag: Slurp.so/1.0
Slurp kann dynamische Webseiten und Links verfolgen, wird es in der Regel aber
nicht tun: Es wird eine unendliche Menge an Daten hinter dynamischen Seiten vermutet.
Dynamische Links könnten auf Inhalte verweisen, die ständigen Änderungen
unterworfen sind. Diese sind nicht geeignet in einen Index aufgenommen zu werden.
Recherche
Einfache Suche:
Voreinstellung ist die UND-Suche "all the words". Alle Worte müssen
gefunden werden.
Weitere Suchoptionen:
all the words
UND-Suche. Alle Worte müssen gefunden
werden
any of the words
ODER-Suche. Mindestens eines der Worte muss
gefunden werden
exact phrase
Phrasensuche. Genau diese Wortfolge wird gefunden. Auch Eingabe
in Anführungszeichen "" möglich.
the page titel
Worte müssen im Seitentitel enthalten sein
the person
Suche nach einer bestimmten Person. Schränkt die Anzahl
der Treffer gegenüber der Textsuche erheblich ein.
links to this URL
Prüfung wieviel Links auf die angegebene Seite verweisen
Boolean phrase
Mögliche boolesche Operatoren: AND- UND-Verknüpfung.
Alle Worte finden OR - ODER-Verknüpfung. Mindestens eins der Worte
finden NOT- NICHT Verknüpfung. Nachfolgendes Wort ausschliessen
*, ?
Wildcards werden als Platzhalter eingesetzt um nach Wortstämmen
zu suchen. Können im Wort oder am Wortende verwendet werden.
* ersetzt mehrere Zeichen
Beispiel:
auto* findet automat, autobahn, atomobil,...
? ersetzt genau ein Zeichen
auto? findet autor, autos, ...
Date: Einschränken des Suchergebnisses auf einen bestimmten Zeitraum.
anytime - keine Einschränkung. Zeiträume zwischen einer Woche und zwei
Jahre können für das max. Alter der Webdokumente im Pull-Down-Menü
angegeben werden. Language: Es werden nur Ergebnisse in der ausgewählten Sprache angezeigt.
any language - keine Spracheinschränkung. Folgende Sprachen können gewählt
werden:
Holländisch, Englisch, Finnisch, Französich, Deutsch, Italienisch, Portugiesisch,
Spanisch. Page must include: Multimedia Elemente müssen enthalten sein:
Image (Bilder), MP3 (Musik), Video, JavaScript.
Erweitertete Suche:
Verschiedene Pulldown Felder machen die Bedienung auch für ungeübte
Sucher relativ leicht.
Zusätzlich zu den in der einfachen Suche erwähnten Optionen gibt es
weitere Features zum Eingrenzen der Suche.
Word Filter: es können diverse Worte benannt werden die entweder
must contain in die Suche einbezogen (AND),
should contain bedingt einbezogen (ODER),
must not contain von der Suche ausgeschlossen (NOT)
werden. Das zugehörige Auswahlfeld erlaubt die Wahl ob der Filter auf Worte,
Personen oder Phrasen angewendet werden soll.
Date: Zusätzliche Einschränkung der Suche auf ein bestimmtes
Datum oder auf einen bestimmten Zeitraum.
Page must include: Gegenüber der einfachen Suche kann vorgegeben werden
dass folgende Elemente auf der Website vorhanden sein müssen:
Shockwave, Java, Javascript, Active X, VRML, Acrobat (PDF-Dateien), VB Script,
Win Media, Real Audio/Video. In das letzte Kästchen kann eine Dateiendung
engegeben werden, beispielsweise .gif
Location/Domain erlaubt die Einschränkung der Suche auf bestimmte
TOP-Level Domain (.com, .org, .edu, .gov, .mil, .net) oder Regionen wie Europa,
Südost-Asien, Indien und Asien, Südamerika, Ozeanien, Afrika, Mittlerer
Osten, Zentralamerika.
Hier können Sie auch eine ganz bestimmte Domain angeben wie
www.at-web.de. Es werden nur die erfassten Webseiten von @-web durchsucht.
Page Depth: Hier kann die Verzeichnistiefe angegeben werden, bis zu der
Webseiten angezeigt werden. Hier wird von der Überlegung ausgegangen, dass
wichtige Seiten nicht in tiefen Verzeichnisstrukturen versteckt sind.
Page Depth 2 bedeutet beispielsweise, dass Webseiten unter http://www.at-web.de/suchmaschinen/unterverzeichnis/
gefunden werden könnten (falls vorhanden), Webseiten im Unterverzeichnis
http://www.at-web.de/suchmaschinen/unterverzeichnis/unter2verzeichnis/ von der
Suche ausgeschlossen werden.
Word Stemming: mit dem Häkchen im nachfolgenden Kästchen wird
erlaubt, ähnliche Begriffe in die Ergebnisliste aufzunehmen.
Ergebnisanzeige:
Bezahlte Einträge:
Zunächst erscheinen (in der Regel 3) Einträge, die als Sponsored Links
ausgewiesen sind. Tatsächlich stammen diese Einträge vom pay-per-click
Vermarkter Overture.
Bei Hotbot ist man der Auffassung, dass mehr als 1000 Ergebnisse auf eine Frage
nicht interessant für den Suchenden sind (Das gilt allerdings auch für
andere Suchmaschinen wie z.B. Google). Es ist also nicht möglich
Ergebnis 1010 anzusehen, selbst wenn 100 000 Treffer zur Anfrage gefunden wurden.
Man sollte dann nicht alle 1000 Ergebnisse durchsehen sondern die Anfrage weiter
eingrenzen.
Folgende Elemente werden im Standardmodus als Ergebnis dargestellt:
- Title der Webseite mit Link unterlegt.
- Inhalt des Meta-Tag Description. Falls Description nicht verwendet wurde
werden die ersten Zeichen des Seitentext verwendet.
- Erstellungsdatum, b.z.w. letzte Aktualisierung
- URL der Webseite
Ergebnisse sortieren:
In der Suchmaske können die Anzahl der Treffer pro Seite (10, 25, 50 oder
100) gewählt werden.
full description - vollständige Anzeige
brief description - kurze Anzeige
URLs only - Nur die URL und der Inhalt des Titel-Tag wird angezeigt
Search Within These Results - Neben der Suchmaske auf der Ergebnisseite kann diese
Checkbox angeklickt werden um die Suche nur in dieser Ergebnisliste fortzusetzen
und damit das Ergebnis zu verfeinern.
See results from this site only - Es werden nur Ergebnisseiten dieser Website
aufgelistet die den Suchbegriff enthalten.
Suchmaschinenanmeldung:
Die kostenfreie Anmeldungen für HotBot ( Inktomi Index) läuft über Yahoo. Das
mag etwas verwirrend klingen, doch so ist es heutzutage. Um die Anmeldung nutzen
zu können, ist eine kostenfreie Mitgliedschaft bei Yahoo! erforderlich. Submit Your Site
Erfassungskriterien:
Metatag description: Nicht länger als 150 Zeichen
keywords: Nicht länger als 75 Zeichen
Seiten die ein Cookie ablegen möchten werden nicht gespidert.
Es muss eine eindeutige Auflösung der Domain-Adresse geben.
Im Zweifelsfalle sollte die IP-Adresse im Anmeldeformular angegeben werden.
Die URL darf keine Zeichen enthalten wie sie bei dynamischen Seiten Verwendung
finden: ?, =, %, &
Rankingkriterien:
Die wichtigsten Kriterien sind:
- Suchwort im Seitentitel
Seiten die das Suchwort im Seitentitel enthalten werden bedeutend höher gewertet
als wenn es nur im Text erscheint.
- Suchwort im Metatag keywords
Das Suchwort im Keywords Metatag wird höher bewertet als wenn es nur im Text
erscheint aber nicht so hoch wie im Seitentitel.
- Die Wortfrequenz im gesamten Dokument
Selten benutzte Worte tragen zu einer höheren Wertung bei als allgemeine
Worte.
- die Länge des Dokumentes. Wenn ein Suchbegriff in einem kürzeren
Dokument häufiger vorkommt, wird dieses höher bewertet als ein langes
Dokument.
Spamming:
Folgende Methoden werden von HotBot als unsauber eingestuft und führen zu
einem deutlich schlechteren Ranking:
- sehr viele Wiederholungen des Suchbegriffes
- Worte in den Metatags die nichts mit dem Seitentext zu tun haben
- kleiner nicht lesbarer Text
- farblich nicht lesbarer Text (Beispiel: weisser Text auf weissem Hintergrund)
Update-Zyklus:
Nach eigenen Angaben wird der Index alle 3-4 Wochen aktualisiert.
Die Aufnahme neuer Seiten in den Index dauert nach meiner Erfahrung derzeit weniger
als 14 Tage. Nach Angaben von HotBot kann die Aufnahme 3-8 Wochen dauern.
Webverzeichnis:
Über die Startseite ist ein Webverzeichnis zugänglich das immer mehr
an Popularität gewinnt. Das Open
Directory Project dient beispielsweise auch der populären Suchmaschine
Google zur Verzeichnissuche.