Jon Kleinberg entwickelt Burst Dedection Algorithmus
(20.02.2003) Jon Kleinberg ist Professor an der Cornell Universität
in Ithaka. Anlässlich
des jährlichen Treffens der American Association for the Advancement of
Science (AAAS) in Denver stellte Kleinberg den Burst Dedection Algorithmus vor.
Suchmaschinen ermitteln, wie oft ein Wort auf Webseiten vorkommt. Zukünftig
könnten sie zusätzlich Intervalle ermitteln, in denen Worte besonders
häufig verwendet wurden.
Nachrichtenbeiträge erscheinen besonders geeignet, mit Burst Dedection untersucht
zu werden. Gemeinsam mit E-Mail, Newsgroups und Weblogs haben sie die Eigenschaft,
auf aktuelle Themen zu reagieren. Gesellschaftliche Trends lassen sich mit Kleinbergs
Methode computerbasiert erkennen.
Beispiel
Die Untersuchung der Reden amerikanischer Präsidenten zur Lage der Nation
zwischen 1790 und 2002 spiegelt Trends der Weltgeschichte wieder. Die Ermittlung
der häufigsten Worte einer Zeitperiode zeigen die gesellschaftlichen Trends
auf.
In den frühen Zeiten der USA waren unter anderem "britisch",
"spanisch" und "französisch" beherrschende Worte. Um
die Zeit der Weltwirtschaftskrise 1933 war es das Wort "Depression".
Das Wort "Kommunist" beherrschte die 50-er und 60-er Jahre des 20. Jahrhunderts.
"Afghanistan" beherrschte die 80-er Jahre. Das Wir-Gefühl wird
seit Beginn der 80-er Jahre mit Phrasen wie "we are" und "we have"
und "we will" verstärkt vermittelt. "Job", "Familie"
und "Verbrechen" kennzeichnen die 90-er Jahre.
Diese Art der Analyse könnte nach Ansicht von Jon Kleinberg etwa für
Soziologen hilfreich sein, um gegenwärtige Entwicklungen in sehr grossen
Mengen von Informationen aufzuzeigen.
Für die Websuche könnte der zeitliche Bezug bessere Resultate liefern.
Während Nachrichten aus der jüngsten Zeit zum Wort "sniper"
(Heckenschütze), die Anschläge rund um die US-amerikanische Hauptstadt
Washington beschreiben, charakterisierte dieses Wort in den 60-er Jahren das Attentat
auf John F. Kennedy.
Jon Kleinbergs Erkenntnisse in der Praxis
Vor einigen Jahren erkannte Kleinberg die Möglichkeit, die nützlichsten
Webseiten zu einem Thema anhand ihrer Verlinkung zu erkennen. Seiten auf die von
vielen anderen verwiesen wird sind "Autoritäten", Seiten die zu
vielen anderen Seiten verweisen, sind "Hubs". Die vertrauenswürdigendsten
Seiten eines Themas sind, welche von den meisten aktiven Hubs verlinkt werden.
Eine Variante dieser Idee wurde in der Suchmaschine Google umgesetzt. Eine strengere
Umsetzung wurde mit der Suchmaschine Teoma realisiert.
Jon Kleinberg stellt fest, dass es im scheinbar chaotischen Internet erkennbare
Strukturen gibt. Die Strukturen werden vor allem durch Gemeinschaften geprägt,
die gleiche Interessen vertreten und verbinden.
Die Struktur des Internet vergleicht er mit der als "Milchstrasse" bekannten
Galaxy. Ein sehr dichter Kern mit stark verlinkten Sites ist von weniger dichten
Regionen umgeben. Sogenannte "Nodes", Knotenpunkte ausserhalb des Kerns
lassen sich in drei Kategorien einteilen: Knotenpunkte im "upstream"
verweisen auf den Kern, können von ihm aber nicht erreicht werden. Knotenpunkte
in "downstream" sind vom Kern über Verweise ereichbar, geben aber
keine Links zurück und isolierte "Ranken", die keine direkten Verweise
zum oder vom Kern aufweisen.
Das @-web Verzeichnis der wichtigsten Suchmaschinen mit URL zum Anmelden neuer
Webseiten.
Webverzeichnisse und Metasucher: Suchmaschinenverzeichnis
20.02.2003
Seitenbeginn