Soziale Komponente bringt bessere Ergebnisse in Suchmaschinen
Das Internet ist ein unübersichtliches Meer an Informationen. Die Verbindung
der Websites untereinander ist unstrukturiert, dezentral, ohne wirklichen Bezug
zueinander. Das ist eine weit verbreitete Meinung. Eine Studie der NEC-Forschungsinstitutes
in Princeton, USA weist hingegen soziale Strukturen des Web nach.
Millionen von Websitebetreibern aus unterschiedlichen Kulturkreisen, mit unterschiedlichen
Beweggründen und Wissensstand, die völlig unabhängig voneinanander
operieren, lassen sich scheinbar unmöglich in Verbindung zueinander bringen.
Die Studie von NEC weist nach, dass es einen hohen Grad an Strukturierung, basierend
auf der Verlinkung der Webseiten untereinander, gibt. Websites bilden auf Basis
ihrer Linkstruktur Communities, Gemeinschaften gleichgesinnter, soziale Verbindungen.
Linkstruktur der Communities
Allein an der Linkstruktur zwischen Webseiten lassen sich Communites ermitteln,
Gruppen mit gemeinsamen Interessen. Dafür ist es nicht notwendig, die Inhalte
der Websites zu kennen. Webseiten die einer Community angehören werden daran
identifiziert, dass jede "Mitgliederseite" mehr Links auf Webseiten
innerhalb der Community aufweist, als auf Webseiten ausserhalb der Community.
Diese Gemeinschaften enstehen aus einer natürlichen Selbststrukturierung.
Sie sind kollektiv strukturiert durch Verweise unabhängiger Autoren. Die
Selbstorganisation der Communities kristallisiert hoch relevante Seiten heraus.
Unabhängigkeit vom textlichen Inhalt
Bisherige Untersuchungen konnten Gemeinschaften an Hand der Zugehörigkeit
zu einem Thema identifizieren. Bei hochspezialisierten Themen ein schwieriges
Vorhaben, da das Thema bis in alle Einzelheiten bekannt sein muss. Bestimmte Begriffe
denen in verschiedenen Ländern eine unterschiedliche Bedeutung zugewiesen
wurde erschweren das Erkennen von Zusammenhängen. Die am NEC ermittelte Methode
ist unabhängig vom Text und kann sogar Communites erkennen, die vorher gar
nicht bekannt waren.
Anwendungen
Die Identifikation von Communites ist wichtig für praktische Anwendungen
im Web. Automatische Webportale, spezialisierte Suchmaschinen, Filterung von Inhalten
und die Ergänzung texbasierenter Suchanfragen.
Forscher können die interdisziplinären Beziehungen einzelner Forschungsbereiche
untersuchen, oder die Beziehungen einzelner Länder zueinander, weltweit.
Webverzeichnisse wie Yahoo! und das Open
Directory Project (ODP) können schneller
innerhalb bestimmter Themengebiete neue Seiten indentifizieren neue Communities
und damit Trends besser erkennen.
Die Filterung von beispielsweise pornografischen Inhalten kann viel effektiver
erfolgen. Neue und modifizierte Seiten werde automatisch erkannt. Damit sinkt
als Nebeneffekt die Wahrscheinlichkeit, dass Webseiten die lediglich darüber
berichten, ebenfalls gefiltert werden.
Gegenüber der wissenschaftlichen Zeitschrift nature erklärte
Gary Flake, Mitautor der Studie, dass es nicht darum geht, den Marktführer
Google zu verdrängen. Vielmehr
bietet sich ein Weg zur Verbesserung vorhandener Suchdienste.
Webverzeichnisse wie Suchmaschinen profitieren gleichermassen von dieser effektiven
Technologie.
Auf Ihrer Website demonstrieren die Autoren eine automatisch ermittelte Webcommunity,
welche sich mit den Ereignissen des 11. September 2001 beschäftigt.
Man versteht sich
Die Suche speziell in diesen Seiten, gibt Ergebnissen eine sehr viel höhere
Relevanz. Ähnlich wie menschliche Gespräche nicht immer wieder alles
erklären, sondern viel Wissen voraussetzen, können Sie in diesen Ergebnissen,
mit einer gewissen "Nachlässigkeit", Fragen formulieren. Sie können
davon ausgehen, dass Ihre Fragen ausschliesslich an Experten gerichtet sind, die
wissen was Sie meinen. So genügt es "why" zu fragen, Sie erhalten
im Ergebnis Webseiten die Ihnen die Hintergründe der Attentate erklären.
Fragen innerhalb einer ausgewählten Webcommunity zu stellen ist äusserst
angenehm. Es ist beinahe so wie mit Menschen, die sich fast wortlos verstehen,
ein Blick aus dem Augenwinkel genügt ;-)
Webseite der Autoren Gary Flake, Steve Lawrence, C. Lee Giles, Frans Coetzee:
Das @-web Verzeichnis der wichtigsten Suchmaschinen mit URL zum Anmelden neuer
Webseiten.
Webverzeichnisse und Metasucher: Suchmaschinenverzeichnis
13.03.2002
Seitenbeginn