Semantische Suchmaschine Theseus kommt aus Deutschland

Quaero war als deutsch-französisches Gemeinschaftsprojekt geplant. Der Airbus unter den Suchmaschinen sollte Quaero werden. Gelegentlich war auch von einer europäischen Antwort auf Google zu lesen. Wenige Tage vor Weihnachten 2006 wurde klar, das Projekt wird nicht in der geplanten Form starten. Zukünftig gibt es zwei getrennte Projekte. Deutsche und Franzosen fühlen sich nicht in der Lage, das Projekt gemeinsam durchzuführen.

Das Projekt wird zukünftig in nationaler Zuständigkeit bearbeitet. Das heisst, die Franzosen arbeiten weiterhin an einer Suchmaschine die vor allem im multimedialen Bereich stark ist. In Deutschland hingegen wird die Stärke der semantischen Suche beschworen. Deshalb wird Deutschland an einer semantischen Suchmaschine mit dem Namen “Theseus” arbeiten.

Semantische Suchmaschinen erkennen nicht nur einzelne Worte, sondern auch deren Sinnzusammenhang. Eine semantische Suchmaschine kann dem Nutzer aufzeigen, dass “Java” eine indonesiche Insel, ein Brettspiel, eine Kaffeepflanze, ein (ehemaliger) Modetanz, eine Programmiersprache sein kann. Besteht die Eingabe des Nutzer aus mehreren Worten, erkennt die Suchmaschine im Idealfall automatisch, welcher Themenbereich gemeint war. Zumindest erhalten die Nutzer themenbasierte Vorschläge.
Grundlage dafür ist allerdings eine Kennzeichnung der textlichen Zusammenhänge durch die Autoren der Web-Seiten. In einfachster Form wurde eine Kennzeichnung bereits in den frühen Anfängen des Internets eingesetzt. Mit Meta-Tags sollten Website-Autoren die Inhalte beschreiben. Viele Autoren konnten jedoch der Versuchung nicht wiederstehen, die Inhalte der Meta-Tags für ein besseres Ranking zu manipulieren. Suchmaschinen mussten die Bedeutung der Meta-Tags für das Ranking gegen Null setzen. Genau diese Gefahr wächst mit dem Semantic Web erneut heran. Die Klassifizierung der Worte soll bereits im Quelltext der Web-Seiten erfolgen. Das kann recht gut in kontrollierten Umgebungen funktionieren, wie es die Intranets von Firmen darstellen. Dort können Autoren ermittelt und auf ihre Fehler aufmerksam gemacht werden. In den Weiten des frei zugänglichen Internets scheint das unmöglich. Deshalb sollen hierfür zusätzlich existierende Dienste wie Flickr genutzt werden, die bereits zur Klassifizierung von Inhalten beitragen.

Das semantische Web ist heutzutage immer moch eine Vision und eine sehr grosse Herausforderung. Ein Erfolg der semantischen Suchmaschine Theseus würde die Qualität der Web-Suche erheblich verbessern.

Siehe auch:
heise online – IT-Gipfel: Quaero heißt jetzt Theseus


Posted

in

by

Tags:

Comments

One response to “Semantische Suchmaschine Theseus kommt aus Deutschland”

  1. DV-Systeme Avatar
    DV-Systeme

    Ja beitrag war gut. Wann startet das und welche Auswirkungen wird es haben? Wie wird dieser Theseus mit anderen Suchmachinen kommunitiren? Abhängigkeiten?

    http://www.dv-systeme.de