Eine Revolution,
oder die Wiederentdeckung der Internetsuche. Ein allumfassender Suchmaschinen
- Index, tagaktuell.
Lesen Sie, wie
das nach den Vorstellungen der Californischen Firma "360 Powered" aus
Seattle funktionieren soll.
Eine der ersten Suchmaschinen im Internet enthielt 1994 rund 54 000 Webseiten
im Index. Es wurde nur eine Bruchteil indexiert, hauptsächlich Webseiten.
Weder PDF-Dateien, Postscript-Dateien, dynamische Inhalte. Daran hat sich bis
heute kaum etwas geändert.
Zu den derzeit rund 2,7 Milliarden Webseiten (nach aktuellem Stand des Webseitenzähler
von Cyveillance) kommen
täglich mehr als 7 Millionen neue Webseiten hinzu. Selbst die derzeit grösste
Suchmaschine hat nur einen Teil davon indexiert. Die Kluft zwischen den vorhandenen
Webseiten und dem tatsächlichen Index wird immer grösser.
Damit wächst die Unzulänglichkeit der Ergebnisrelevanz, viele Seiten
werden gar nicht erfasst.
Die bisherigen Erfassungs-Technologien beruhen darauf, dass die Informationen
von Spidern eingesammelt, abgeholt wird.
360 Powered dreht nun diesen Ansatz der Informationsgewinnung mit einer neuen
Technologie um.
Websitebetreiber werden bevollmächtigt Ihren Index im Zyklus von 24 Stunden
zu aktualisieren. Zu diesem Zweck wird auf dem Host ein Agent eingesetzt, der
die automatische Indexierung vornimmt. Die inkrementelle (zunehmende) Erfassung
der Daten erfordert nur die Übertragung der neuen Inhalte an den zentralen,
fairen und offenen Index.
Wirklich interessant wird die neue Technik durch den Aspekt dass dynamische Inhalte,
PDF- und Postscript, WMF,Multimedia,...Dateien erfasst werden.
Diese Push-IndexingT Technologie verspricht eine vollkommen neue Qualität
der Webinhalte.
Tote Links würden nicht länger als einen Tag bestehen, selbst Nachrichten
könnten mit nie dagewesener Aktualität im Suchmaschinenindex enthalten
sein.
Wie sich diese Technologie in der Praxis bewährt, muss sich zeigen. Derzeit
ist kein öffentlicher Probebetrieb möglich. Eine ausgewählte Zahl
von Content Providern, Webhostern und Portalen wird in diesem Monat die Möglichkeit
erhalten, in die Probephase einzusteigen.
Die Grösse des erforderlichen Index ist derzeit sehr schwer abzuschätzen.
Er muss immens gross werden, die erforderliche Soft- und Hardware dürfte
alle bisherigen Dimensionen sprengen.
BrightPlanet ging im Juli diesen Jahres in einer Veröffentlichung von ca.
400- 550 Milliarden Webseiten des Deep Web aus. Das sind dynamisch generierte,
frei und öffentlich zugängliche Webseiten.
Das @-web Verzeichnis der wichtigsten Suchmaschinen mit URL zum Anmelden neuer
Webseiten.
Webverzeichnisse und Metasucher: Suchmaschinenverzeichnis
10.10.2000
Seitenbeginn