Eine der kühnsten Visionen von Tim Berners Lee ist das Semantische Web. Gegen die vielen Funktionen, die im Semantischen Web möglich werden, mutet das jetzige Internet an, wie ein experimenteller Spielbaukasten gegenüber einer ausgereiften High-Tech Fabrik. Die Qualität der Informationen würde um ein Vielfaches steigen. Die Präzision der Suchmaschinen wäre aus heutiger Sicht überwältigend. Skeptiker bezweifeln jedoch, dass ein Sematisches Web oder gar eine darauf basierende semantische Suche überhaupt möglich wäre. Ein prominenter Skeptiker ist Peter Norvig, Google Direktor für Suche und künstliche Intelligenz.
Norvig widersprach während der in Boston stattfindenden Konferenz zur Künstlichen Intelligenz, dem “Vater” des Internet und Direktor des WWW-Konsortium, Tim Berner Lee.
Berner Lee hielt die Eröffnungsrede zur Künstlichen Intelligenz und dem Semantischen Web. Für das Semantische Web müssen Begriffe zusätzlich kenntlich gemacht werden, um deren Bedeutungen und Beziehungen zu anderen Begriffen für Maschinen verständlich zu machen.
Hinweis: Die Kennzeichnung bleibt für die Nutzer unsichtbar, ebenso wie der HTML-Text für Nutzer von Webbrowsern unsichtbar sind. Web-Seiten die auf HTML-Basis erstellt werden, würden zukünftig strukturierter aufgebaut. Ein Baum würde eindeutig der Pflanzenwelt zugeordnet. Ein Kabelbaum würde als technischer Begriff ausgezeichnet werden und selbst dann nicht der Pflanzenwelt zugeordnet, wenn nur vom Baum die Rede wäre. Durch die Zuordnung von Worten zu Gruppen und Klassen, würden Maschinen wesentlich leichter die Zusammenhänge zwischen den Worten herstellen können. Eine tiefergehende Erläuterung gibt die Wikipedia zum Semantischen Web.
Berners-Lee möchte, dass Web-Seiten schon bald mit zusätzlichen Auszeichnungen versehen werden. Dafür ist die konsequente Anwendung bestehender Konventionen wie URI (Uniform Resource Identifiers) und RDF (Resource Description Framework) notwendig.
An dieser Stelle beginnt die Argumentation von Peter Norvig.
1. Man müsse mit der Inkompetenz der allgemeinen Nutzer rechnen. Millionen von ihnen sind nicht in der Lage einen Webserver zu betreiben, können nicht HMTL schreiben. Es ist schwer für diese Nutzer, den nächsten Schritt zu gehen.
2. Das zweite Problem sieht Norvig im Wettbewerb. Einige kommerzielle Anbieter fühlen sich als Führer und fragen warum sie standardisieren sollen.
3. Die Irreführung ist ein Problem, mit dem sich Google auseinanderzusetzen hat. Täglich gibt es Nutzer die versuchen höher zu ranken. Selbst für Begriffe, nach denen mit dieser Anfrage nicht gesucht wurde, wie z.B. Viagra. Norvig geht davon aus, dass es im Semantischen Web noch leichter ist, in die Irre zu führen.
Berners Lee erklärte, das Semantische Web dient dazu, den Ursprung von Informationen nachvollziehbar zu machen. Es wird erkennbar werden, warum der Information getraut werden kann, nicht nur dem Inhalt der Information. Google ist in der Situation, wunderbare Dinge zu tun. Google kann eine weitere Facette zu den Regeln hinzufügen, welche die Datenquellen testen.
Ich glaube, das erste von Norvig aufgeführte Problem lässt sich lösen. Nicht im vorbeigehen, doch im Laufe der Jahre. So wie es heute Werkzeuge gibt, die das Publizieren im Web ohne HTML-Kenntnisse ermöglichen, wird es zukünftig Werkzeuge geben, die das Publizieren semantischer Informationen unterstützen.
Den zweiten Punkt halte ich ebenfalls für überwindbar. Sobald sich zeigt, wie mächtig die Änderungen im Gepäck des Semantischen Webs sind, wird sich kein Anbieter verschliessen können und wollen.
Die Täuschung der Suchmaschinen erscheint aus meiner Sicht das wirklich grosse Problem. In Bereichen, in denen Geld zu verdienen ist, wird es nicht an Ideen mangeln, das Semantische Web für Tricksereien auszunutzen. Suchmaschinen werden Mechanismen entwicklen müssen, die Angaben zu prüfen und als vertrauenswürdig einzustufen. Das heisst, das Katz-Maus-Spiel geht weiter. Gleichzeitig steigt jedoch die Genauigkeit der Suchergebnisse. Das dürfte für Suchmasschinen Anreiz genug sein, sich mit dem Thema des Semantic Web auseinander zu setzen. Wären die dominierenden Suchmaschinen in der Lage, gemeinsam Standards vorzugeben, nach denen semantisch zu publizieren ist, könnten einfache Varianten des Semantischen Web recht bald durchgesetzt werden. Autoren von Webseiten würden sich sehr schnell an Vorgaben halten, wenn deren Nichteinhaltung bedeutet, in den wichtigsten Suchmaschinen nicht gefunden, bzw. gar nicht aufgenommen zu werden.
Comments
One response to “Google zweifelt am semantischen Web”
Zweifel am semantischen Web
via at-webTim Berners Lee’s letzter großer Traum ist das Semantische Web. Es geht darum, daß die in Webseiten erfaßten Daten nicht in nic …