Quaero – Deutsch-Französische Suchmaschine

Quaero wird in der Presse schon gerne mal als Google-Killer gehandelt, doch was wird diese in Entwicklung befindliche Suchmaschine eigentlich leisten?

Quaero (lateinisch – ich suche) ist ein deutsch-französisches Gemeinschaftsprojekt, das im Frühjahr 2005 vom französischen Staatspräsident Jaques Chriac angekündigt wurde und weiterhin unter seiner Schirmherrschaft steht, um ein Gegenstück zu amerikanischen Suchmaschinen wie Google uns Yahoo! zu schaffen. An dem Projekt sind unter anderem der französische Thomson Konzern, Die Deutsche Telekom, France Telekom, Exalead, Betreiber einer leistungsfähigen französisch basierten Suchmaschine, deutsche Forschungseinrichtungen wie die RWTH Aachen (automatische Übersetzung), Universität Karlsruhe (Sprachverarbeitung) und andere Unternehmen beteiligt. Spekulationen ergehen derzeit ob die Bertelsmann-Tochter Empolis ebenfalls in das Projekt eingebunden wird. Laut Computerwoche prüft Empolis derzeit die Mitarbeit am Projekt.

Quaero soll neben der reinen Textsuche auf die multimediale Suche ausgerichtet werden. Das geht aus den programmatischen Stichpunkten hervor, die auf der Website zu finden waren, bevor das Projekt für den öffentliche Zugriff gesperrt wurde. Die Sperrung erfolgte nachdem ein grösseres öffentliches Interesse am Projekt bekannt wurde. Grosses Gewicht wird auf die Audio, Bilder und Video-Suche gelegt. Quaero wird als “Multimedia Content Search Evolution” bezeichnet.

Nachfolgend eine Auflistung technischer Informationen von der Quaero-Website, die wohl als eine Art Aufgabenstellung zu verstehen sind:

Infrastruktur

– Grosse. skalierbare, verteilte Speicherung der Daten
– Abstraktionslayer zur Speicherung und Kommunikation für die Verbindung der Systeme und Hardwarekomponenten
– Prozeduren für den Arbeitsprozess um Inhalte und Metadaten verwalten zu können

Metadaten Aufnahme und Strukturierung
– Fundamentale Formate zum Speichern von Meta-Daten
– Skalierbare Kodierungsformate
– Erweiterung der Metadaten für die Speicherung

Automatische Kommentare
– Sprache zu Text Übersetzung
– Video Aufteilung in Segmente
– Bilderkennung
– Daten Zusammenführung – OCR (OCR- Optische Zeichenerkennung)
– Spracherkennung
– Erkennung der Landessprache
– Zusammenfassung – Übersetzung
– Kategorisieren
– Lokalisieren und erkennen einzelner Textelemente um diese automatisch klassifizieren zu können (Named entity recognition)
– Aufbau Thesaurus (Auflistung sinnverwandter Wörter)

Benutzerschnittstelle
– Fragen in natürlicher Sprache
– Mehrsprachige Fragen
– Kontext, Verwaltung und Abbildung
– Zusammenfassung (bilden)

Suche und & Extraktion
– Indexieren von Milliarden von Dokumenten, Ranking, Speicherung
– Verteilte Index-Integration (Vom Desktop zum Web)
– Nutzung statistischer Daten der Web-Dokumente für Näherung, phonetische und mehrsprachige Suche
– Fragenbeantwortung

Sicherheit
– Auf Kryptographie basierter Schutz
– Wasserzeichen

Anmerkung: Die Nutzung von Multimedia-Technologien soll einem Grossteil der Bevölkerung zugänglich gemacht werden. Die Sicherheitstechnologien werden eine grosse Rolle spielen um die Rechte der Urheber gewährleisten zu können.

Wie sich Quaero als Gegenstück zu Google positionieren kann, wird sich zeigen. Der Aufwand zur Entwicklung der Suchmaschine zeugt von starken Technologie-Partnern und finanziellem Hintergrund. Modernste Wissenschaft und Technik scheinen unbedingt notwendig um ernsthaft konkurrieren zu können. Es wird nicht genügen so gut wie Google zu sein. Nutzer werden nur wechseln, wenn sie eine Technologie vorfinden, die bessere Ergebnisse liefert. Wir können davon ausgehen, dass Google sich nicht auf dem erreichten Erfolg ausruhen wird. Bis zum Start von Quaero, der für den Sommer 2006 möglich erscheint, werden wir vom europäischen Marktführer Google, aber auch den starken Konkurrenten Yahoo! und Microsoft, weitere Innovationen zur Nutzerbindung erleben können.

Unabhängig davon wie das eingeläutete Rennen ausgeht, wir als Nutzer werden auf jeden Fall davon profitieren. Die perfekte Suchmaschine wird es weiterhin nicht geben, doch der Wettbewerb wird dafür sorgen, dass die Entwicklung der Suchmaschinentechnologien schneller voranschreitet.

Startseite des Quaero Projektes bei Thomson (Momentan passwortgeschützt)
DFAG – Deutsch-Französische Arbeitsgruppe Wirtschaftskooperation


Posted

in

by

Tags: