Translate
this
page

|Nr.103||Archiv-Hauptseite| Übersicht2003||Nr.105 |


----------------------------------------------------------

@-web Newsletter Nr. 104

-----------------------------------------------------------
Herausgegeben für die Abonnenten von
@-web, Infobote.de und Findolin.de

ISSN 1439-0744 (Deutsche Bibliothek)


This newsletter in English (machine translation):
http://www.at-web.de/nl/104/en.htm

Themen:

  1. SUCHMASCHINENOPTIMIERUNG
    1.1 Themenbasierter PageRank
    1.2 Google Update ohne Ende
  2. BEITRÄGE SUCHDIENSTE
    2.1 Yahoo! - guter Umsatz dank Overture
    2.2 Nur 22% Klicks von bezahlten Google-Anzeigen
    2.3 Webcrawler startet in Deutschland
    2.4 Northern Light - come back?
    2.5 Mirago in Deutschland
    2.6 W3C und Suchmaschinen
    2.7 Kindersuchmaschinen
    2.8 Overture in Italien
    2.9 Suchmaschinen Test
    2.10 Untersuchung Intranet
    2.11 Google und die Wissenschaft
    2.12 Turbo10 knackt magische 1000
    2.13 PageRank Beschleuniger
  3. RECHERCHE
    3.1 Viel hilft nicht viel


Liebe Newsletterleser,
während in Deutschland die Entwicklung allgemeiner Suchmaschinen stagniert, drängen weitere englischsprachige Suchangebote auf den Markt. Das Google-Update mutet an wie die "Unendliche Geschichte" und Northern Light möchte als Suchmaschine in das Internet zurückkehren...




--------------------------------------
1. SUCHMASCHINENOPTIMIERUNG
-------------
-------------------------



1.1 THEMENBASIERTER PAGERANK
--------------------------------
Bisher basiert das PageRank-Verfahren auf der Einschätzung einzelner Seiten. Ein neuer Algorithmus, der die Suchbegriffe in Ihrem Kontext erkennt, könnte das ändern. Der neue Algorithmus verlässt sich nicht auf die blosse Nennung des Suchbegriffes in einem Dokument. Er berücksichtigt, welche weiteren Begriffe zum Thema gehören und kann somit die Qualität der Ergebnisse erhöhen. Seiten die nicht zum Thema passen, aber gute Plätze in der Ergebnisliste erreichen, weil sie den Suchbegriff enthalten, müssten Seiten weichen, die tatsächlich relevant zum Thema sind.

Mit dem zusätzlichen Vorschlag, den Verlauf der bisher besuchten Webseiten im Webbrowser der Nutzer zu untersuchen und die Bookmarks auszuwerten, könnten Zweideutigkeiten in der Antwort vermieden werden. Z.b. bringt die Suche nach "Käfer" für eine Suchmaschine nicht ausreichend Informationen, um festzustellen, ob die Frage einer bestimmten Insektenart oder einem Fahrzeug gilt. Abgesehen davon, dass Sie derart unspezifische Fragen vermeiden sollten, könnte Ihre Bookmarksammlung zu biologischen Themen b.z.w. Auto-orientierten Seiten den Entscheidungsprozess der Ranking-Algorithmen positiv beeinflussen.

Für zutreffender Resultate könnte auch ein Wort in einem Dokument hervorgehoben werden. Die anschliessende Suche würde mit der Analyse des Dokumentes beginnen und feststellen in welchem Kontext der Begriff steht.

Verweis zum PDF- Dokument, "Topic-Sensitive PageRank":
http://www.at-web.de/nl/104/ts.htm



1.2 GOOGLE UPDATE OHNE ENDE
-------------------------------
Seit Anfang Mai wurd der Google-Index aktualisert. Das Update hat eine völlig andere Dimension als alle bisherigen Aktualiserungen. Ein völlig neuer Index war notwendig. Da dieser zunächst nicht so umfassend und komplett war und ist, wie der bisherige Index, entstand der Eindruck, es würden alte Daten eingebracht.

Der neue Index wurde auf alle Google-Datencenter verteilt. Phase 1 des neuen Update ist somit seit einer Woche abgeschlossen. Länger wird Phase 2 dauern. Dafür ist ein typischer Index-Zyklus veranschlagt. Das bedeutet etwa einen Monat. Neue Daten und Verweise werden hinzugefügt, neue Spamfilter eingesetzt und aktiviert. Phase 2 könnte Mitte bis Ende Juni 2003 abgeschlossen sein. In der Phase 3 werden neue Algorithmen eingeführt. Dieser Prozess wird sehr viel länger währen, mehrere Monate. Ein reguläres Update ist nicht in Sicht wird vermutlich nicht vor Abschluss der Phase 2 stattfinden.

Neue b.z.w. aktualisierte Webseiten, werden weiterhin berücksichtigt. Die Aktivitäten des Freshbot wurden wesentlich verstärkt und erscheinen oftmals in ähnlicher Intensität, wie die des Deep Bot. Das nächste "normale" Update soll dann weitere neue Daten, Links u.s.w. einbringen.

Unsicherheit bringt die Anzeige der Google-Toolbar. Deren Informationsgehalt sollte während der Update-Periode nicht überbewertet werden. Da derzeit weniger Links im Index vorhanden sind, kann sich das auf die Anzeige der Toolbar auswirken. Veränderte PageRank-Werte bedeuten keinen Abstrich für die Beurteilung einer Webseite. Stabilere Werte für den PageRank sind sicher erst nach dem kompletten Abschluss von Phase 2 zu erwarten.


------------------------------
2. BEITRÄGE SUCHDIENSTE
------------------------------

2.1 YAHOO! UMSATZ DANK OVERTURE POSITIV
---------------------------------------------
Laut Quartalsbericht an die US-Börsenaufsicht, tragen Einnahmen, die aus der Partnerschaft mit Overture resultieren, mit 19% zum Yahoo!-Einkommen bei. Ohne die über Overture erzielten Einkünfte hätte Yahoo! ein negatives Einkommen erzielt. Ein Zeichen dafür, wie wichtig für Suchdienste die Einnahmen aus bezahlten Textanzeigen geworden sind. Yahoo! Deutschland unterhält hingegen die Partnerschaft mit Espotting.
Yahoo Deutschland:
http://de.yahoo.com/
Frühere Beiträge über Overture
http://www.at-web.de/Suchmaschinen-int/overture.htm
und Espotting
http://www.at-web.de/pay-search/espotting.htm



2.2 NUR 22% KLICKS VON BEZAHLTEN GOOGLE TEXTANZEIGEN
-----------------------------------------------------------
comScore Networks ermittelte im September 2002, unter Teilnahme von mehr als 5000 E-Commerce Sites, die Google-Klicks für diese Sites werden zu 78% aus den normalen Google-Ergebnissen generiert. Nur 22% kommen über Google Textanzeigen. Die Untersuchung ermittelte zudem für die Textanzeigen über Overture höhere Klickraten und eine höhere Conversion-Rate. Fazit: Bezahlte Aktionen können die Optimierung der Webseiten für Suchmaschinen gut ergänzen, nicht ersetzen.
Quelle, Overture News:
http://www.content.overture.com/d/USm/ac/re/nl/apr03si.jhtml



2.3 WEBCRAWLER STARTET IN DEUTSCHLAND
--------------------------------------------
Webcrawler begann als eigenständige Suchmaschine, die lange Zeit einen guten Namen hatte und die später von Excite übernommen wurde. Seit ca. 2 Jahren, läuft Webcrawler als eine von Infospace betriebene Meta-Suchmaschine. Die Ergebnisliste liefert Treffer von Google, FAST, Teoma, Ask Jeeves, Espotting, Overture, Mirago.
In diesen Tagen startet die deutschsprachige Version von Webcrawler.
Website Webcrawler Deutschland:
http://www.webcrawler.de/


2.4 NORTHERN LIGHT - COME BACK?
-------------------------------------
Die Suchmaschine Northern Light wurde nach dem Kauf durch die Firma Divine als öffentliches Angebot eingestellt. Divine ist pleite, Northern Light wieder ein eigenständiges Unternehmen. Die Web-Suchmaschine soll wiederkehren, ist auf der Startseite zu lesen. Northern Light war bis zur Schliessung eine der besten Suchmaschinen im Internet.
Website: Northern Light:
http://www.northernlight.com/
Ein früherer @-web Beitrag Northern Light ade! :
http://www.at-web.de/Suchmaschinen-int/northern-light-ade.htm



2.5 MIRAGO IN DEUTSCHLAND
-----------------------------
Bereits seit März 2003 ist die Website verfügbar, nun folgt der offizielle Startschuss. Die Suchmaschine Mirago, mit Ursprung in Grossbritannien, ist im deutschsprachigen Raum präsent und buhlt um die Gunst der Nutzer.
Website Mirago Deutschland:
http://www.mirago.de/

 

2.6 W3C UND SUCHMASCHINEN
------------------------------
Während der 12. World Wide Web Conference, vom 20. bis 24. Mai 2003, wurden zahlreiche Vorträge über Suchmaschinen-Technologien gehalten. Einige dieser Vorträge sind online verfügbar. Gary Price veröffentlichte eine Liste mit zugehörigen URL.
Liste ResourceShelf, Conference Papers:
http://www.at-web.de/nl/104/cp.htm
Liste WWC-Vorträge, Search and Data Mining:
http://www2003.org/t_sd.htm



2.7 KINDERSUCHMASCHINEN
----------------------------
Am Wochenende wird wieder einmal Kindertag gefeiert. Spezielle Suchmaschinen für Kinder sind immer noch rar im Internet. Kinder benötigen kindgerechte Webseiten. Noch wichtiger ist allerdings die angemessene Betreung der Kinder durch Erwachsene, auf ihren Reisen durch das Internet. Angebote für Erwachsene sind nur bedingt für Kinder geeignet. Der Klassiker, Die Macher der Kindersuchmaschine Blinde Kuh haben das schon sehr früh erkannt und ein spezielles Angebot für Kinder entwickelt.

Andere Angebote sind angetreten das Angebot kindgerechter Seiten zu erweitern. Dazu gehört die Kidstation. Sie kann als Ausgangspunkt für Kinderreisen durch das Internet verwendet werden. Der Kidstation Webfilter basiert auf den dort gelisteten Angeboten, diese werden sozusagen als "Whitelist" eingesetzt.

Website Kidstation: http://www.k-finder.de/
Weitere Kindersuchmaschinen:
Blinde Kuh http://www.blinde-kuh.de/
Milkmoon http://www.milkmoon.de/



2.8 OVERTURE IN ITALIEN
------------------------
Overture, Spezialist für kommerzielle Suche, erweitert seinen europäischen Wirkungskreis und ist nun auch in Italien mit einer Niederlassung präsent. Zeitgleich mit dem Markteintritt konnte Overture mit Tiscali einen der führenden italienischen Internet Service Provider als Partner gewinnen. Auch Lycos und Excite gehören in Italien
bereits zum Overture Netzwerk. Der Start von MSN ist für Juni 2003 geplant. In Kürze wird Overture ausserdem seine Pay-For-Performance Ergebnisse auf der AltaVista Website unter www.altavista.it listen.
Overture Italien:
http://www.content.overture.com/d/home/?mkt=it

2.9 SUCHMASCHINEN TEST
--------------------------
Wichtige internationale Suchmaschinen wurden im Heft 06/2003 der Zeitschrift Tomorrow getestet. Getest wurden ausschliesslich Suchmaschinen die im Volltext indexieren. Bis auf HotBot (Inktomi) verwenden alle Dienste einen eigenen Index.
Nicht nur die Ermittlung des Gewinners, Google erscheint logisch. Auch die Sortierung der nachfolgenden Suchmaschinen in der Reihenfolge AllTheWeb, HotBot (Deutschland), AltaVista, Teoma, WiseNut ist nachvollziehbar.
http://tomorrow.msn.de/



2.10 UNTERSUCHUNG INTRANET
------------------------------
Das Institut für e-Management e.V. führt eine aktuelle Untersuchung zum Thema:
"Wohin entwickeln sich Intranets?" durch. Es soll geklärt werden, ob sich Intranets mittlerweile zu einem ernsthaften Bestandteil der firmeninternen Wissens- und Kommunikationsflüsse entwickelt haben, bzw. sich dahin entwickeln. Teilnehmer erhalten als Dankeschön den Ergebnisbericht kostenlos.
http://www.ifem.org/untersuchungen/intranet/intranetbogen.htm

2.11 GOOGLE UND DIE WISSENSCHAFT
------------------------------------
Google veröffentlicht Verweise zu wissenschaftlichen Beiträgen von Google-Mitarbeitern.
Sehr viele dieser Beiträge befassen sich mit Themen rund um Suchmaschinen. Algorithmen, Data Mining, Natural Languagage Processing, Web Information Retrival sind nur einige Themen. Zudem gibt es Hinweise auf Projekte, an denen die Googlers (Google-Mitarbeiter) mitgearbeitet haben. Für alle, die an wissenschaftlichen Beiträgen über Suchmaschinen interessiert sind, ist diese Liste ein Fundgrube.
http://labs.google.com/papers.html



2.12 TURBO10 KNACKT MAGISCHE 1000
-------------------------------------
Die Meta-Suchmaschine Turbo10 steigerte ihre Verbindung zum Deep Web dramatisch. Innerhalb weniger Tage stieg die Zahl der Quellen um 320 auf aktuell 1108. Nigel Hamilton, Turbo10’s CEO sagt: "Das ist erst die Spitze des Eisberges. Mit unserem automatischen System können wir zu vielen tausenden weiteren Quellen verbinden".
Meta-Suchmaschine Turbo10:
http://turbo10.com/
Liste Deep Net:
http://turbo10.com/cgi-bin/showdeepnet.cgi
Bilder WWC Konferenz:
http://turbo10.com/pressrelease15.html

2.13 PAGERANK BESCHLEUNIGER
------------------------------
Die Berechnung des PageRank ist für die Suchmaschine Google ein zeitaufwändiger Prozess, der mehrere Tage Berechnung verlangt. Mit wachsender Anzahl erfasster Seiten steigt der Aufwand zur Kalkulation des PageRank, der in einem interativen Verfahren ermittelt wird. Kürzlich wurden mehrer Verfahren veröffentlicht, mit deren Hilfe sich der PageRank schneller berechnen lässt.
Die Methode der Extrapolation des PageRank arbeitet mit Annahmen zur Linkstruktur des Internet, die nicht gänzlich korrekt sind. Die Annahmen sind jedoch genau genug, um den PageRank in vereinfachter Form zu berechnen.
Der "BlockRank" geht von der Erfahrung aus, dass 80% aller Webseiten einer Internetpräsenz zu anderen Seiten innerhalb der Präsenz verweisen. Der PageRank vieler dieser Seiten muss nicht unbedingt einzeln ermittelt werden, sondern kann in angemessener Weise zusammengefasst werden, bevor die eigentliche Berechnung des PageRank startet.
Der "adaptive PageRank" hingegen berücksichtigt, dass für rund 50% aller Seiten, die iterative Berechnung des PageRank bereits sehr früh endet und nicht für die nachfolgenden Berechnungen mitgeführt werden muss. Entgegen der Behauptung in zahlreichen Publikationen, dass die drei Algorithmen Google bis zu 5mal schneller machen könnten, erklärte Sepandar Kamvar, Forscher an der Stanford Universität, die Algorithmen könnten realistisch eine Beschleunigung von 30% erzielen.

Durch Verfeinerung der Algorithmen könnte laut Kamvar die Personalisierung von Suchanfragen vorangetrieben werden.
Die Personalisierung kann dazu beitragen, Suchergebnisse zu liefern, die den persönlichen Vorstellungen der Suchenden besser entgegenkommen.

Die Verweise zu den Publikationen sind in der Stanford Global Database zu finden:
http://www-db.stanford.edu/~mor/GIB/



3. RECHERCHE
----------------

3.1 VIEL HILFT NICHT VIEL
--------------------------
Die Suche im Web auf beliebig viele Suchmaschinen zu verteilen ist nicht nutzerfreundlich. Die erweiterte Syntax der Suchmaschinen unterscheidet sich oft, so dass die Gefahr besteht, in einer anderen Suchmaschine mit gleicher Syntax andere Ergebnisse zu erzielen.
Eine Studie von Bernard Jansen und Caroline Eastman ergab, unter anderem, dass man sich als im Allgemeinen auf
ein, zwei Suchmaschinen konzentrieren sollte. Der Tenor: Es ist besser, die Syntax einer Suchmaschine richtig zu können, als die Syntax vieler Suchmaschinen schlecht zu beherrschen. Rund 60% aller Anfragen bringen in
unterschiedlichen Suchmaschinen gleiche Ergebnisse. Nur 10% aller Nutzer von Suchmaschinen verfeinern ihre Syntax zur Verbesserung der Ergebnisse. Professor Jansen empfiehlt Nutzern die sich mit einer oder zwei Suchmaschinen gut auskennen, solange an denen festzuhalten, bis Systemdesigner herausgefunden haben, wie die Suche personalisiert werden kann.

BBC-Beitrag:
http://news.bbc.co.uk/1/hi/technology/3033385.stm
Die Studie als PDF-Dokument:
http://www.at-web.de/nl/104/bj.htm

 


Bis zur nächsten Ausgabe des @-web Newsletter,

Klaus Patzwaldt




-----------------------------------------------------------------

Impressum:

ISSN 1439-0744 (Deutsche Bibliothek)
Jahrgang 5
Ausgabe 104
Herausgegeben für Abonnenten von @-web, dem Infoboten und Findolin
Datum: 30.05.2003

Dieser Newsletter darf unverändert weitergeleitet werden.
Zitate sind unter Angabe der Quelle erlaubt. Nachdruck, oder Übernahme in andere Angebote erfordern die Zustimmung des Herausgebers.

Herausgeber: Klaus Patzwaldt
Themenvorschläge, Änderungswünsche, Fragen, Hinweise, Kritiken. Eine Mail an newsletter@at-web.de genügt.

Newsletter bestellen:
mailto:newsletter@at-web.de?subject=abo_newsletter
Newsletter abbestellen
mailto:newsletter@at-web.de?subject=deabo_newsletter


Copyright © 1999/2003
@-web Internetservice und Dienstleistungen
Am Wiesenrain 36a •   12587 Berlin
http://www.at-web.de/
Tel: 030 / 64 48 84 11   Fax: 030 / 64 48 86 59
Newsletter-Archiv :
http://www.at-web.de/newsletter/archiv/

Infobote:
http://www.infobote.de/

Findolin:
http://www.findolin.de/
------------------------------------------------------------

|Nr.103||Archiv-Hauptseite| Übersicht2003||Nr.105 |