FactSpotter von Xerox

FactSpotter von Xerox könnte man als semantische Suchmaschine bezeichnen, da sie die Bedeutung der Worte in ihrem Umfeld erkennt. Fragen werden in gewöhnlicher Alltagssprache akzeptiert und erkannt. Hört sich schon ziemlich perfekt an?

Die linguistische Engine von FactSpotter erkennt die Bedeutung von Worten im textlichen Zusammenhang. FactSpotter untersucht die Bedeutung von Anfrage und auszulieferndem Dokument um komplexere Zusammenhänge erkennen zu können, als es mit der reinen Suche nach Begriffen möglich ist. Diese Technologie erkennt, ob ein Zahn im Gebiss eines Menschen oder am Zahnrad einer Maschine gemeint ist. Als Ergebnis erhalten Nutzer nur “eine Handvoll” Resultate, statt tausender nur bedingt passender Dokumente. Dabei werden auch Dokumente durcchsucht, die den Suchbegriff gar nicht enthalten. Dennoch wird in diesen Dokumenten die genaue Stelle, hervorgehoben, welche zur Suchanfrage die passende Antwort liefert.

An dieser Stelle taucht bei Ihnen vielleicht die Frage auf, warum die grossen Internetsuchmaschinen nicht mit dieser Technologie arbeiten?
Das Problem ist, dass die semantische Zuordnung zunächst von Menschen erfolgen muss. Eine Klassifizierung der Worte in Themenbereiche sowie die Zuordnung zu weiteren Begriffen. Der dafür zu betreibende Aufwand ist bisher nur in thematisch abgegrenzten Themengebieten machbar. Im Internet, mit der unüberschaubaren Themenvielfalt, ist nach jetzigem Stand nur mit Algorithmen der riesiegen Datenmenge beizukommen. Entsprechende Verfahren exisitieren bereits, sind aber zu ungenau um für die breite Öffentlichkeit zufriedenstellende Ergebnisse zu liefern.

FactSpotter ist nicht für die Suche im freien Internet entwickelt. Die Software wird im nächsten Jahr Bestandteil des Xerox Litigation Services, der vorrangig Behörden und Anwälten auf dem Gebiet des öffentlichen Rechts zur Verfügung stehen wird.

Xerox – Surpassing Search: New Xerox Text Mining Software Goes Beyond “Keywords” To Deliver More Relevant Information


Posted

in

by

Tags: