Nun soll endlich die rasende Entwicklung der digitalen Informationsflut Ihren
Meister finden. Mit ClassiFire tritt eine intelligente Suchmaschine an, das Chaos
zu beherrschen.
Ein hochkomplexes Netzwerk sprachwissenschaftlicher Zusammenhänge enthält
1,5 Millionen Wörter und Redewendungen, die auf neuronale Weise verflochten
sind.
Was heisst das ?
Übliche Klassifikationen in Webverzeichnissen wie Yahoo!
werden in einem aufwendigen Prozess von Menschen klassifiziert. Das Anlegen neuer
Kategorien und Unterkategorien bedeutet immer wieder neue Entscheidungsprozesse,
die Zeit und menschliche Ressourcen beanspruchen.
Einträge werden in der Regel maximal zwei Kategorien zugeordnet.
ClassiFire basiert auf einem maschinell erstellten, sprachwissenschaftlichem Muster
der Kategorisierung (Taxonomie), das bisher 300 000 MicroTopics verwendet. MicroTopics
sind die kleinsten Elemente der Klassifizierung, ähnlich den untersten Kategorien
eines Webverzeichnisses.
Die Klassifikation
3 Schritte sind zur Klassifikation der Dokumente erforderlich:
Identifikation von Worten und Formulierungen innerhalb des Textes eines vorhandenen
digitalen Dokumentes
Zuordnung der Begriffe und Formulierungen zu Topics innerhalb der bestehenden
Wissensbasis (Taxonomie)
Bestimmung des zentralen Themas eines Dokumentes
Automatisch zuordnen
Bei ClassiFire kann ein Begriff im Prinzip beliebig vielen Topics zugeordnet
werden.
Ein praktisches Beispiel:
Mit dem Begriff "Gerhard Schröder" verbindet das System zunächst,
dass er Bundeskanzler ist. Es "weiss" aber auch, dass er der SPD angehört,
Ministerpräsident in Niedersachsen war, der Autoindustrie zugeneigt ist und
noch viele weitere Zusammenhänge. Auch wenn Gerhard Schröder einmal
nicht mehr Bundeskanzler sein wird, ist das System sehr schnell mit diesem Wissen
ausgerüstet.
Basis für aktuelle Infos ist das Internet, das ständig abgefragt wird.
Das Gedächtnis, immer aktuelle Bezüge finden
Die Sprache befindet sich in einem fliessenden Zustand, Ein Begriff wie Viagra
und sein Bezug zu Potenzstörungen war vor wenigen Jahren noch völlig
unbekannt.
Das Internet wird als sprachlicher Spiegel unserer Gesellschaft benutzt und hilft
aktuelle Zusammenhänge zu erkennen. Dafür sind 40 Millionen Webseiten
erfasst und werden regelmässig aktualisiert.
Dieser Basisbestand an Daten wird mit den Daten der Firma angereichert, bei der
ClassiFire eingesetzt wird. So lassen sich firmeninterne Daten blitzschnell mit
aktuellen Informationen abgleichen.
Soll ein neues Produkt entwickelt werden, findet das System möglicherweise
Zusammenhänge in aktuell veröffentlichten Forschungsberichten , Wirtschaftsnachrichten
u.s.w. Doppelentwicklungen und jahrelange, verfehlte Forschung- oder Projektarbeit
lassen sich so vermeiden.
Analysieren und Zusammenhänge erkennen
Es gibt fast unzählige Möglichkeiten, Worte und deren Bedeutungen
miteinander zu verknüpfen.
Schliesst man dann noch die Bewertung der Relevanz dieser Wörter zueinander
als zusätzliche Aufgabe ein, vergrössern sich die Möglichkeiten
immens.
Zusammenhänge zu analysieren und Relevanzbewertung sind die Stärken
von ClassiFire. Ähnlich wie das menschliche Gehirn kann es, wenn erforderlich,
Bedeutungen neu zuordnen oder ergänzen.
Wenn ein Dokument klassifiziert wurde, weiss das Informations-Management-System
genau mit welchen Themen es sich befasst. Selbst wenn der Suchbegriff nicht direkt
im Dokument vorkommt, findet die Software, dank neuronale Verknüpfung,
die Beziehung zwischen Dokument und Suchbegriff.
Anwendung von ClassiFire
Die Beschreibung von ClassiFire assoziert, dass hier eine ideale Software für
die Suche im Internet entwickelt wurde.
Eigentlich sollte man diese Software jeder Suchmaschine "verordnen".
Das dürfte rein praktisch am Investitionsvermögen der Suchdienste scheitern.
6 Jahre Forschungsarbeit wollen refinanziert werden. Preise werden zwar nicht
veröffentlicht, deren Grössenordnung lassen sich jedoch aus der Zielgruppe
ableiten.
Zielgruppe sind besonders Grossunternehmen, die ein enormes Informationspotential
angesammelt haben. In grossen Netzwerken liegen dort sehr viele Informationen,
die nur für einen kleinen Nutzerkreis zugänglich sind, da eine zentrale
Verwaltung des Wissensbestandes fehlt. Manuelle Verfahren zur Klassifizierung
riesiger unstrukturierter Daten sind in der Regel zu aufwendig und deshalb nicht
vorhanden.
Mehr Infos zu TopicalNet und ClassiFire finden Sie hier: TopicalNet
Europe
Das @-web Verzeichnis der wichtigsten Suchmaschinen mit URL zum Anmelden neuer
Webseiten.
Webverzeichnisse und Metasucher: Suchmaschinenverzeichnis
08.10.2001
Seitenbeginn