Word Stemming in Suchmaschinen

Suchmaschinen verwenden mitunter das Word Stemming. Worte werden auf Ihren Stamm reduziert. Ableitungen vom Wortstamm werden in der Trefferliste berücksichtigt.

Die Suche nach Zitronen wird mittels Word Stemming auf den Wortstamm Zitron(e) reduziert. Alle Worte die auf diesem Wortstamm beruhen, könnten nun berücksichtigt werden. Etwa Zitronencreme, Zitronat, Zitronensaft, usw.
Gleichzeitig muss aber gesichert werden, dass Worte die diesem Wortstamm angehören, nicht berücksichtigt werden. Sicherlich möchten Sie für diese Suche keine Treffer, die etwas über die Schmetterlingsart Zitronenfalter berichten.

Word Stemming kann also nur sehr differenziert angewandt werden. Die Suchmaschinenbetreiber benötigen praktisch ein “Wörterbuch”, das zulässige und unzulässige Wortstämme erkennt und diese sicher voneinander trennt. Kompliziert wird es, wenn Word Stemming in mehreren Sprachen angewandt werden soll. Jede Sprache benötigt ein separates Wörterbuch.

Die Suchmaschine Google experimentiert seit November 2003 öffentlich mit dieser Option. Es scheint vor allem bei Mehrwort Anfragen eine Rolle zu spielen. Sie können das Stemming ausschalten, indem Sie vor jedem Wort ein Pluszeichen setzen.

 

Word Stemming ist nicht nur für Suchende interessant. Auch Verfasser von Texten, die im Internet veröffentlicht werden, sollten daran denken. Wer über Zitronen schreibt, trägt mit der Erwähnung von Zitronencreme zur umfassenderen Information seiner Besucher bei und erhöht die Wahrscheinlichkeit, dass Suchmaschinen die Seite zum Thema Zitrone als wichtig ansehen.
Siehe auch Google Help Basics:
http://www.google.com/help/basics.html

Comments

Leave a Reply