Mehr als die Suche nach Begriffen, wie sie von Suchmaschinen wie Google und Yahoo! verwendet wird, soll eine neue Technologie von IBM beherrschen.
Unstructured Information Management Architecture (UIMA) ist eine Analyse-Software die Text in Dokumenten und anderen Inhaltsquellen verarbeitet. Die Software soll die versteckte Bedeutung, Beziehungen und zugehörige Fakten zu einem Suchbegriff “verstehen”. UIMA arbeitet mit einer Vielfalt an Analysetechniken wie statistische und rollenbasierte Verarbeitung natürlicher Sprache (Natural Language Processing – NLP), Information Retrieval (IR), maschinenbasiertes Lernen, Ontologien und die Verlinkung dieser Prozesse zu strukturierten Informationsservices wie Datenbanken und Suchmaschinen.
UIMA ist keine Fertiglösung. Als Rahmenlösung (Framework) wird UIMA in andere Anwendungen integriert. IBM setzt UIMA in folgenden Produkten ein: IBM WebSphere Information Integrator OmniFind Edition, WebSphere Portal Server und Lotus Work Place.
Die Unstructured Information Management Architecture (UIMA) ist ein Ergebnis vierjähriger Forschungsarbeit.
Bedeutende Unterstützung bekam das Projekt von der Defense Advanced Research Projects Agency (DARPA), der Forschungs- und Entwicklungsorganisation des US-Verteidigungsministerium. Die DARPA war bereits mit bedeutenden Entwicklungen wie dem ARPANet und dem Internet beschäftigt. Ebenso waren zahlreiche Universitäten an der Entwicklung beteiligt. Einige davon, die Carnegie Mellon Universität, Columbia Universität, Stanford Universität und die Universität von Massachusetts Amherst setzen UIMA bereits in Kursen und Forschungsprojekten ein.
UIMA soll nach dem Willen von IBM eine offene Software sein und zum Jahresende bei SourceForge zum Download bereitgestellt werden. Der Download ist bereits jetzt kostenfrei über IBM Alpha Works möglich.
Siehe auch: WebSphere Information Integrator OmniFind Edition