Suchmaschine, Webverzeichnisse, Wissensportale, Meta-Suchmaschinen
 
 
 
 

   Suchmaschinen
   Startseite

   Suchmaschinen
   Weblog



 Suchmaschinen:
  deutschsprachig
  international
  Meta-
   Suchdienste

  Spezialisten
  Pay-Search
 Webverzeichnisse:
  Webverzeichnisse

 Weitere Suchquellen:
  Bildersuche
  Deep Web
   Lexika
   communities
   human-answer
   Such-Hilfen
   Touren durchs
   Web


 Basics:
  Grundlagen
  Suchmaschinen -
   Optimierung

  tricky
  Such-
   Technologien

  Domain-Namen

 Informationen:
  Archiv
  Bücher
  Informationen
  Live-Suche
  Recherche

 Hilfsmittel:
  Desktop-
   Suchmaschinen

  Suchagenten
  Suchboard
  Suchdienste-
   Verzeichnis

  Toolbars
  Website- Suche
 Spezial:
  Downloads

  Kontakt

Seitenbeginn








Grub - Open Source Suchmaschine


Mit Grub ensteht die weltweit grösste und aktuellste Suchmaschine.


Probleme hekömmlicher Suchmaschinen sollen mit Grub gelöst werden.

Das Problem
Selbst die weltgrössten Suchmaschinen erfassen nur einen relativ kleinen Teil des Internet. Je mehr Dokumente erfasst werden, je höher wird der Aufwand, die indexierten Dokumente durch wiederholtes crawlen aktuell zu halten. Lange Aktualisierungszeiträume begünstigen das Vorhandensein toter Links in den Ergebnislisten.


Die Lösung
Im Open Source Projekt Grub wird das Indexieren des Internet auf viele 10 000 Computer aufgeteilt.
Jeder Besitzer eines Computer kann an diesem Projekt teilnehmen. Durch die Installation einer Software lassen die freiwilligen Teilnehmer einen Crawler in einem bestimmten Teil des Internet tätig werden.

Der Spider bringt die Daten auf die heimische Festplatte. Die Zusammenfassung des Crawl-Vorgang sendet die Software an den zentralen Index von grub.org.

So trägt jeder der -zigtausend beteiligten Computer dazu bei, einen weltweiten allumfassenden Index zu schaffen. Besonders Systemadministratoren und Webautoren sind aufgefordert sich dieser Initiative anzuschliessen. Der Crawler kann die Websites des Autor / Administrator jede Nacht aktualisieren, dann wenn der Rechner nur sehr wenig belastet ist. Der weltumfassende Index wird somit tagesaktuell gehalten.

Wann gecrawlt wird und welche Systemressourcen dafür zur Verfügung stehen, kann der Nutzer selbst bestimmen.

Der Crawl-Vorgang benötigt verhältnismässig viel Systemressourcen. Durch die Auslagerung des Indexvorganges kann man sich bei grub.org auf die Organisation des zentralen Index und die Beantwortung von Suchanfragen konzentrieren.

Man rechnet bei Grub damit, dass bei einer Beteiligung von 80 000 Rechnern rund 95% des Internet abzudecken wären. Alle 95% des Internet würden jeden 2. Tag komplett neu gecrawlt. Das wäre eine bisher nie gekannte Aktualität der Daten.

Die kommerzielle Seite des Projektes
- Das Projekt wird zunächst eine Website bereitstellen, die mit einer Suchmaske zur Abfrage des Index ausgerüstet ist. Dieser Dienst ist für Benutzer kostenlos.

- Statusinformationen über URL's sollen andere Suchmaschinenbenutzer gegen Bezahlung nutzen können.

- Der Grub-Index wird ähnlich dem Inktomi-Dastenbestand anderen Portal und Suchmaschinenbetreibern zur kostenpflichtigen Nutzung angeboten.

- Die Grub-Software wird Firmen zur Nutzung eines eigenen P2P-Netzwerk angeboten.


Wer kann mitmachen ?
Jeder, der über einen funktionsfähigen Computer verfügt. Zunächst gibt es die Grub-Clients nur für Linux (Unix). Eine Windows-Version wird in einigen Monaten erscheinen.

Risiken für das Projekt
So interessant und überzeugend das Konzept klingt, über wichtige Einzelheiten gibt es keine Informationen.

Die Entwickler planen die Datenbank auf viele Rechner zu verteilen, geben aber zu, mit derartigen Systemen jedoch keine Erfahrungen zu haben.

Konkurrenz für Google ?
Ein möglichst grosser Datenbestand ist wichtig, um gute Suchergebnisse zu liefern.

Nur eine ausgereifte Such- und Rankingsoftware macht die in der Datenbank liegenden Informationen wirklich wertvoll. Wichtig für eine Suchmaschine sind ausgeklügelte Rankingkriterien, die wirklich relevante Ergebnisse liefern. Sollte Grub keine geeigneten Algorhitmen entwickeln, muss sich Google nicht fürchten.

Der umfassende, aktuelle Index könnte jedoch zu einer willkommene Ergänzung für Suchmaschinenbetreiber werden.
Voraussetzung ist zunächst, dass wirklich genügend Freiwillige gefunden werden, die auf Dauer dem Projekt beitreten.

Wieviel Nutzer lassen sich mobilisieren ?
Da die Anzahl der Projekte mit verteiltem Rechnen immer mehr steigt, wird es zukünftig immer schwieriger werden, genügend Freiwillige zu mobilisieren.
Das bekanntes Projekt ist SETI@home, die Suche nach ausserirdischem Leben (SETI = Search for Extraterrestrial Intelligence).

Nachfolgend seien nur zwei weitere Projekte des verteilten Rechnens auf P2P-Basis genannt:

- Projekt der Welt-Gesundheitsorganisation (WHO)zur Erhöhung der Effektivität des Grippeschutz-Impfstoff: Influenza

- Problemlösung zur Entsorgung radioaktiver Stoffe:
Gamma Flux



Ein Starttermin für die offizielle Nutzung von Grub steht noch nicht fest. Der hängt unter anderem davon ab, wieviel Teilnehmer sich für das Vorhaben gewinnen lassen.

Ergänzender Hinweis (18.03.2003): Im Januar 2003 wurde Grub Inc. von LookSmart gekauft. LookSmart verspricht sich eine kostengünstige Lösung für einen aktuelleren Index der ebenfalls zu LookSmart gehörenden Suchmaschine WiseNut.



Website: Grub





Alle Beiträge zu Suchtechnologien:
360 Powered Tagesaktueller Index des gesamten Web
Alert - Project Suche in Internet, TV, Hörfunk, Printmedien
Anacubis Visualisierung der Google Suche und andere, wie Amazon
AudioMining Macht Audio- und Videotexte durchsuchbar
EXTRAKT Suche mit Wortvarianten, linguistischer Server
Fact®Finder Unscharfe Suche
GFS Versteht Zusammenhänge, hinterfragt
Gridpatrol Monitoring des gesamten Internet
Grub Weltweiter, tagesaktueller Index
Guidebeam Echtzeitverzeichnis zur Begriffsfindung
Inktomi Weltweiter Datenbestand für viele Suchdienste
iFinder MPEG-7 für Multimedia Suchmaschinen
iLOR SEARCH Ergänzt Suchmaschinenergebnisse mit zusätzlichen Features
iPhrase Produkt Such-Technologie
Kartoo Eingängige Visualiserung der Ergebnisse im Kartenformat
LexiBot Abfrage riesiger Datenbestände im Deep Web
Music Genome Project Findet Musikmuster nach persönlichen Vorlieben
MySpiders Echtzeit Suchmaschine
Notify! Musiksuchmaschine, findet Töne
Oingo Suchbegriffe präzisieren
OptiQu Visualisierung der Ergebnisse als Thumbnail in Echtzeit
P@noptic Intranet Suchmaschine
Peoplefinder Menschen finden und treffen
Robocast Slideshow durch das Web
SmartSpell Fehlertolerantes Suchen
Singingfish Multimedia Suche
Thebrain Visualisierung von Datenstrukturen
TurboSearch Natural language - Modul
web-lookup Echtzeitvorschau der Suchergebnisse
With1Click Eine Innovation ?
   
Netvention Ein E-Mail Grabber, nennt sich Suchmaschine
miner3D Dreidimensionale Ergebnisanzeige







Das @-web Verzeichnis der wichtigsten Suchmaschinen mit URL zum Anmelden neuer Webseiten.
Webverzeichnisse und Metasucher:
Suchmaschinenverzeichnis

17.05.2001
Letzte Änderung: 18.03.2003


Ihre Meinung, Hinweise, Anregungen:



Seitenbeginn






© copyright @-web 1999-2012
Impressum
@-web



 



Translate
this
page

Hier den kostenlosen
Suchmaschinen
Newsletter
bestellen!