Translate
this
page

|Nr.107||Archiv-Hauptseite| Übersicht2003||Nr.109 |


----------------------------------------------------------

@-web Newsletter Nr. 108

-----------------------------------------------------------
Herausgegeben für die Abonnenten von
@-web, Infobote.de und Findolin.de

ISSN 1439-0744 (Deutsche Bibliothek)


This newsletter in English (machine translation):
http://www.at-web.de/nl/108/en.htm

Themen:

  1. SUCHMASCHINENOPTIMIERUNG
    1.1 Buch: Suchmaschinen im Internet
    1.2 GoogleGuy sagt

  2. BEITRÄGE SUCHDIENSTE
    2.1 Suchmaschine für 3D Modelle
    2.2 Google und robots.txt
    2.3 Suchtechnologie: Tasso NT Service
    2.4 Yahoo! kauft Overture
    2.5 Kaltix - PageRank personalisieren
    2.6 Suchmaschine mailt Ergebnisse
    2.7 Fireball - Relaunch
    2.8 Alles Klar - statt MSN nun Lycos
    2.9 Overture erhöht Mindestgebot
    2.10 Suchmaschinen dürfen tief verlinken
    2.11 Idealo - Preisvergleich
    2.12 Google Toolbar für Mozilla und Netscape
    2.13 Erweiterte Suche für Google-News
    2.14 GuruNet - Homework Edition
    2.15 AlltheWeb - Neue Dateitypen
    2.16 Guhgel und Co.



----------<Anzeige>------------------------------------------------
SUCHMASCHINEN-MARKETING

Umfassend - international - erfolgreich.

Die Webeffekt AG - Unser Name ist ein Versprechen.

http://www.Webeffekt.de

Tel. 02064-48670
----------</Anzeige>------------------------------------------------




Liebe Newsletterleser,
Suchmaschinenoptimierer können mit einem vom Springer-Verlag herausgegebenem Buch ihr Wissen vertiefen und den Ausprüchen von GoogleGuy, einem Google-Mitarbeiter, folgen. Interssant dürfte für alle Leser der Relaunch der Suchmaschine Fireball sein. Senden Sie mir doch bitte Ihr Feedback, wie Sie die neuen Ergebnisse von Fireball beurteilen.




--------------------------------------
1. SUCHMASCHINENOPTIMIERUNG
-------------
-------------------------

1.1 BUCH: SUCHMASCHINEN IM INTERNET
---------------------------------------
Das Buch von Michael Glogger gibt einen tiefen technischen Einblick in die Arbeitsweise von Suchmaschinen. Sie erfahren etwas über Hypermedia basierte Gewichtungsmodelle, Datenstrukturen der Information Retrival Systeme, Datennormalisierung und vieles mehr.
Ranking-Methoden werden ebenso wie Spam-Methoden ausführlich beschrieben.
Mehr:
http://www.at-web.de/buch/suchmaschinen-im-internet.htm


1.2 GOOGLEGUY SAGT
----------------------
Webmasterworld ist eine ergiebige Quelle zu allen Themen des Suchmaschinenmarketing. Speziell das Google-Forum enthält eine Fülle von Postings, die teilweise unüberschaubar und unübersichtlich sind. Die wohl wichtigsten Postings sind die vom Google-Mitarbeiter, der unter dem Pseusonym Googleguy agiert. GoogleGuy gibt oft sehr hilfreiche Andeutungen oder konkrete Hinweise. Seit Mai 2003 werden auf einer Website alle Aussagen von GoogleGuy zusammengefasst. Der Autor dieser Seite, Marc Carey, ergänzt die Aussagen GoogleGuys mit Kommentaren, die seine eigene, persönliche Meinung darstellen.
Einige Ausführungen GoogleGuys werde ich nachfolgend kurz in deutscher Sprache wiedergeben:
- Dynamisch erzeugt Webseiten: Man sollte möglichst wenige Parameter übergeben. URLs die eine ID-Kennzeichnung enthalten, sollten vermieden werden. Googlebot versucht, sich von Session-ID's fernzuhalten.
- Wenn alle Seiten einer Website mit einem textbasierten Browser wie Lynx erreichbar sind, ist das die beste Basis, dass die Spider allen Links folgen können.
- Toplevedomains wie .de, .com, u.s.w. haben keine Bedeutung für das Ranking
- Es ist ein Gerücht, dass einige Webmaster glauben, die Google Toolbar sei die Ursache, dass Webseiten von Googlebot erfasst werden.
- Ebenfalls in das Reich der Mythen gehört das Gerücht, dass Webseiten in den Google-Index gelangen, wenn sie auf Google werben.
- Sprung Menüs werden mit JavaScript realisiert. Es könnte sein, dass die regulären Google-Spider nicht in der Lage sind, diesen zu folgen. Im Zweifelsfalle sollte eine Sitemap für Besucher und Spider hilfreich sein.
- Unterstriche in einer URL zählen nicht als Wortrenner.
Anmerkung: Für eine Zweiwort Optimierung bedeutet das, blaue-murmeln.htm zu verwenden, statt blaue_murmeln.htm

Website "GoogleGuy Says":
http://www.markcarey.com/googleguy-says/



------------------------------
2. BEITRÄGE SUCHDIENSTE
------------------------------

2.1 SUCHMASCHINE FÜR 3D MODELLE
------------------------------------
Die Princeton Shape Retrival and Analysis Group zeigt mit dieser experimetellen Suchmaschine, die praktischen Möglichkeiten um dreidimensionale Modelle aufzufinden.
Können Sie zeichnen? Mit der Maus am Computer? Dann haben Sie gute Voraussetzungen die 3D-Suchmaschine zu benutzen. Relativ gute Ergebnisse lassen sich mit einer simplen Skizze eines Autos erreichen. Die Darstellung des menschlichen Herzens bringt eher Ergebnisse, die nicht mit der Vorgabe übereinstimmen. Da die 3D-Modelle vorrangig technisch basiert sind, mag das nicht weiter verwundern.
Einfacher geht die Suche mit der reinen Texteingabe. Sie berücksichtigt Dateinamen, Anker-Text der Darstellungen, Kennzeichnungen innerhalb des 3D Modells und Text auf der Webseite, in der Nähe der Darstellung. Verfügen Sie über 3D Darstellungen, etwa im VRLM 2.0 -Format, können Sie diese als Vergleichsmodell für die Suche verwenden.
Website Princeton 3D Model Search Engine:
http://shape.cs.princeton.edu/search.html



2.2 GOOGLE UND ROBOTS.TXT
----------------------------
In einer Leserzuschrift erhielt ich den Hinweis darauf, dass Google Webseiten erfasst, obwohl die Seiten durch einen entsprechenden Eintrag in einer Datei robots.txt von der Indexierung ausgenommen wurde.
Können durch einen Eintrag in die robots.txt Dateien vor der Erfassung schützen?
Die Antwort lautet eindeutig nein. Die Datei robots.txt hat sich als ein gewisser Standard etabliert um Suchmaschinen mitzuteilen, in welcher Form bestimmte Seiten oder Verzeichnisse bei deren Erfassung berücksichtigt werden sollen.
Wichtige Suchmaschinen halten sich (meist) an diese Empfehlungen. Webmaster sollten jedoch nicht glauben, damit einen wirksamen Schutz aufzubauen, der die Seiten vor dem Zugriff aus dem Internet zu schützt. Stellen Sie sich das Internet als eine sehr belebte Strasse vor. Würden Sie auf einer belebten Verkehrsader einer Grosstadt wichtige Akten unbeaufsichtigt deponieren? Die Gefahr wäre wohl zu gross, dass diese in unbefugte Hände geraten. Ähnlich verhält es sich mit ungeschützten Dokumenten im Internet. Suchmaschinen finden Dokumente entweder durch deren Anmeldung oder über Verweise von anderen Webseiten. Selbst wenn Sie selbst keinen Verweis auf die im Web abgelegten Seiten setzen, kann es sein, dass Freunde, bekannte, Kollegen, Geschäftspartner dies tun. Sobald es nur einen Verweis gibt, ist die Wahrscheinlichkeit gross, dass Suchmaschinen darüber Ihre Seite finden und in ihren Index aufnehmen. Google nimmt z.B. Seiten auf, die nie vom GoogleBot besucht wurden. Alle Informationen von Seiten, die in der Ergebnisliste erscheinen, erhält die Suchmaschine ausschliesslich über die verweisenden Seiten. Die GoogleBots erfassen in diesem Fall die URL der Seite und den beschreibenden Linktext.
In der Ergebnisliste wir jedoch lediglich die URL angezeigt, ohne Beschreibungstext und Angabe der Dateigrösse.

Um Seiten wirklich vor dem Zugriff aus dem Internet zu schützen, sollte zumindest ein Passwortschutz angelegt werden. Gehen Sie immer davon aus, dass Seiten ohne Zugansschutz im Web öffentlich zugänglich sind. Es gibt genügend Spider, die sich nicht nach den Angaben ider robots.txt richten.

Siehe auch:
http://www.at-web.de/grundlagen/robots-txt.htm
http://www.robotstxt.org/wc/norobots.html
http://www.searchengineshowdown.com/features/google/unindexed.shtml


2.3 SUCHTECHNOLOGIE - TASSOS NT SERVICE SUITE
---------------------------------------------------
Betreiber von Webseiten oder Webshops könen von Tasso NT Service Suite profitieren.
Diese professionelle Software basiert nach eigenen Angaben auf den Erkenntnissen neuronaler Netze und künstlicher Intelligenz. Tassos steht als Akronym für "Technologie Assoziativer Speicher". Tassos erkennt abweichende Schreibweisen, benötigt keine logischen Operatoren in der Fragestellung, zerlegt zusammengesetze Worte in ihre Bestandteile und sucht auch nach diesen Bestandteilen. Die assoziative Suche verknüpft Suchbegriffe mit Worten ähnlicher Bedeutung und findet diese ebenfalls. Soweit das System mit entsprechenden Informationen versorgt wurde, findet es den Kontext eines Wortes, also dessen Bedeutung in seinem Textumfeld. Beispielsweise hat das Wort "Wurzel" für Botaniker, Mathematiker und Zahnärzte jeweils eine unterschiedliche Bedeutung.
Eine 30-Tage Testversion ist auf den Seiten der Software professional GbR erhältlich.
Website:
http://www.sw-pro.de/


2.4 YAHOO! KAUFT OVERTURE
----------------------------
Suchdienstanbieter Yahoo! wird Overture für 1,63 Milliarden US-Dollar kaufen. Overture hat erst vor wenigen Monaten die Suchmaschine AllTheWeb und die FAST-Websuche gekauft. Yahoo! kaufte bereits den Suchmaschinen-Index Inktomi.
Mit dem Kauf von insgesamt drei der wichtigsten Suchmachinen stellt Yahoo! sich in eine starke Position gegenüber Konkurrent Google, dessen Index immer noch vorrangig die Ergebnislisten von Yahoo! füllen. Bisher wurden keine Pläne Yahoos bekannt, wie nun mit den 3 Suchmaschinen, Inktomi, AltaVista und AllTheWeb verfahren wird. Alle drei stellen im Verhältnis zu Google nur einen sehr geringen Anteil für die Weiterleitung von Besuchern über Suchmaschinen dar. Die grössten Chancen für eine schlagkräftige Websuche dürfte Yahoo mit einer Suchmaschine erzielen, die auf den Stärken aller drei akquirierten Suchmaschinen basiert. Overture wird zukünftig als Tochtergesellschaft von Yahoo! agieren.
Mit dem Kauf von Overture findet die bisher grösste Konzentration im internationalen Suchmaschinenmarkt stattfinden. Kommerzielle Suchdienste sind derzeit das schnellst wachsende Segment im Internet und sollen 2006 bereits 5 Milliarden Dollar Einnahmen generieren.
Pressemitteilung Yahoo:
http://docs.yahoo.com/docs/pr/release1102.html

2.5 KALTIX - PAGERANK PERSONALISEREN
---------------------------------------
Mitglieder des Stanford PageRank Projektes haben die Firma "Kaltix" zur Kommerzialisierung personalisierter Web Suchtechnologien gegründet. Das heisst die Forschungen zum PageRank sollen professionell vermarktet werden. Grössere Flexibilität im Ranking soll durch Personalisierung des PageRank erreicht werden.
Auf der Website sind unter dem Punkt "Publications" immerhin 11 Veröffentlichungen aus den Jahren 2002 und 2003 zum Thema PageRank zu finden. Gemäss Gary Price, Resourceshelf, besitzt die Stanford Universität das PageRank-Patent, nicht wie vielleicht irrtümlich angenommen, Google. Larry Page, Google-Mitbegründer, wird in der Patentschrift jedoch als Erfinder benannt.
Website Stanford PageRank Project:
http://pagerank.stanford.edu/index.html


2.6 SUCHMASCHINE MAILT ERGEBNISSE
-------------------------------------
TEC Search wird entwickelt, um Nutzern in armen Ländern kürzere Online-Zeiten zu ermöglichen und damit wertvolle Online-Kosten u sparen. Die Suchanfrage wird an einen Server des MIT (massachusetts institute of technology) in Boston gemailt. Die Antwort kommt nach ca. 24 Stunden per Mail und enthält wichtige Ergebnisseiten, die anschliessend ohne Internetverbindung ausgewertet werden können.
Website TEC Search:
http://cag.lcs.mit.edu/tek/


2.7 FIREBALL - RELAUNCH
-------------------------
Die Suchmaschine Fireball kommt in einem schlankeren Kleid und mit neuen Algorithmen daher. Das Ranking wurde optimiert, die verfügbaren Optionen übersichtlich angeordnet. Fireball selbst schreibt dazu: "Dank einer völlig überarbeiteten Technologie und der Erstellung des sogenannten 'Virtual Document Index' konnte die Relevanz der Suchergebnisse erheblich verbessert werden."
Mehr:
http://www.at-web.de/fireball/relaunch-2003.htm


2.8 ALLESKLAR - STATT MSN NUN LYCOS
----------------------------------------
Lycos Deutschland pflegte bisher einen eigenen hochwertigen Webkatalog. Dieser wird für eine gewisse Zeit noch als Einzellösung unter Fireball zu finden sein. Nun wird unter Lycos Deutschland der Katalog von Allesklar.de, mit einem Umfang von ca. 0,5 Mill. Einträgen, präsentiert. Der Standardeintrag in Allesklar ist noch "wertvoller" geworden und kostet bis 30.09.2003 als Einführungspreis 199,- Euro. ab 4.Quartal 2003 wird der AllesKlar-Webkatalog auch auf der zu Lycos Europe gehörenden Suchmaschine Fireball verfügbar sein.
Website Lycos Katalog:
http://webkatalog.lycos.de/
Frühere Beitrag Alles Klar:
http://www.at-web.de/webverzeichnis/allesklar-iw2001.htm
Früherer Lycos Katalog:
http://www.at-web.de/webverzeichnis/lycos-katalog.htm


2.9 OVERTURE ERHÖHT MINDESTGEBOT
--------------------------------------
Ab Samstag den 16.08.2003 werden die Mindestgebote im Werbenetzwerk von Overture Deutschland von 0,10 Euro auf 0,15 Euro erhöht. Bisherige Gebote unter 0,15 Euro werden automatisch auf den neuen Mindestwert angehoben.
Website Overture Deutschland:
http://www.de.overture.com/


2.10 SUCHMASCHINEN DÜRFEN TIEF VERLINKEN
---------------------------------------------
Der Bundesgerichtshof entschied für die News-Suchmaschine Paperboy, dass Verweise auf einzelne Webseiten eines Webangebotes nicht strafbar sind. Suchmaschinen im Internet sind wichtige Wegweiser und basieren auf dem Prinzip, tief auf einzelne Seiten eines Angebotes zu verlinken.
Mehr:
http://www.at-web.de/aktuell/deep-link.htm


2.11 IDEALO - PREISVERGLEICH
-----------------------------------
Idealo vergleicht Preise von derzeit mehr als 200 Anbietern. Über 20 000 Elektronikprodukte und mehr als 1 Mill. Medien (Bücher, Software,...) werden in den Vergleich einbezogen. Die Preise werden mindestens täglich aktualisiert. Eine gute Gelegenheit, preisgünstige Angebote zu finden.
Website Idealo:
http://www.idealo.de/


2.12 GOOGLE TOOLBAR FÜR MOZILLA UND NETSCAPE
--------------------------------------------------
Die Suchmaschine Google bietet ihre Toolbar, welche unter anderem den PageRank einer Seite anzeigt, nur in einer Version für den Internetexplorer. Eine Open Source Lösung für Mozilla arbeitet ebenfalls im Netscape Browser.
Website "Googlize your Mozilla":
http://weblogs.mozillazine.org/doron/archives/003718.html
Toolbar des Mozilla Projektes:
http://googlebar.mozdev.org/


2.13 ERWEITERTE SUCHE FÜR GOOGLE NEWS
-------------------------------------------
Die Google News verfügen nun über eine erweiterte Suche, leider nur für die englische Ausgabe. Einschränkungen auf einzelne Quellen oder Länder sind möglich. Praktisch ist ebenfalls die zeitliche Eingrenzung zwischen einer Stunde und 30 Tagen.

Eine abweichende Variante der erweiterten Suche bietet Tara Calishain, Co-Autorin des Buches "Google Hacks" auf ihrer Website.
Google News:
http://news.google.com/
ResearchBuzz:
http://www.buzztoolbox.com/google/goonews.shtml


2.14 GURUNET - HOMEWORK EDITION
------------------------------------
Vor wenigen Tagen stellte Atomica die Gurunet Homework Edition vor. GuruNet bietet Zugriff auf Enzyklopädien, Wörterbücher, Fachinformationen aus Wissenschaft und Technologie, u.s.w.. Besonders Schüler, Studenten und Lehrkräfte sollen von der neuen Version profitieren.
Beschreibung GuruNet:
http://www.at-web.de/suchagenten/gurunet.htm


2.15 ALLTHEWEB - NEUE DATEITYPEN
------------------------------------
Neben den Dateiformaten MS-Word, Adobe-PDF und Macromedia-Flash finden Sie nun im AlltheWeb-Index Dateien in den Formaten MS-Excel und MS-Powerpoint. Die Syntax lautet filetyp:excel und filetyp:powerpoint, ergänzt mit ihrem Suchbegriff.
Achtung: Dateitypen wie MS-Exel können Viren oder schädliche Makros enthalten.
Suchmaschine: AlltheWeb:
http://www.alltheweb.com/
Diesen Tipp gefunden bei Gary Price, ResourceShelf:
http://www.resourceshelf.com/


2.16 Guhgel und Co.
-------------------
Die Suchmaschine Google gibt es in zahlreichen Sprachen der Welt, darunter einige die auf unserer Erde eher selten gesprochen werden, wie "Elmer Fudd" oder "Bork, bork, bork". Deutschsprachige Dialekte haben es hingegen bisher nicht in die Google Sprachtools geschafft. Kein Grund zum trauern, Sachsen und Schwaben können jeweils eine Version in ihrer Heimatsprache nutzen. Beide Seiten sind jedoch keine Angebote von Google. Die sächsische Version zeigte während meines Test Schwächen, da die Zugriffe nachmittags nicht verarbeitet wurden. Nach Mitternacht verlief der Zugriff problemlos. Die schwäbische Version hingegen läuft stabil und übersetzt zuverlässig die besuchten Seiten. Bevor Sie das ihrer eigenen Site antun, können Sie ja zum eingewöhnen zunächst die Google-News in schwäbisch oder sächsisch lesen.
Google auf schwäbisch:
http://unimut2.fsk.uni-heidelberg.de/unimut/schwob?schwob_url=http://www.google.de
Google auf sächsisch:
http://www.guhgel.de/

 


Bis zur nächsten Ausgabe des @-web Newsletter

Klaus Patzwaldt

-----------------------------------------------------------------

Impressum:

ISSN 1439-0744 (Deutsche Bibliothek)
Jahrgang 5
Ausgabe 108
Herausgegeben für Abonnenten von @-web, dem Infoboten und Findolin
Datum: 25.07.2003

Dieser Newsletter darf unverändert weitergeleitet werden.
Zitate sind unter Angabe der Quelle erlaubt. Nachdruck, oder Übernahme in andere Angebote erfordern die Zustimmung des Herausgebers.

Herausgeber: Klaus Patzwaldt
Themenvorschläge, Änderungswünsche, Fragen, Hinweise, Kritiken. Eine Mail an newsletter@at-web.de genügt.

Newsletter bestellen:
mailto:newsletter@at-web.de?subject=abo_newsletter
Newsletter abbestellen
mailto:newsletter@at-web.de?subject=deabo_newsletter


Copyright © 1999/2003
@-web Internetservice und Dienstleistungen
Am Wiesenrain 36a •   12587 Berlin
http://www.at-web.de/
Tel: 030 / 64 48 84 11   Fax: 030 / 64 48 86 59
Newsletter-Archiv :
http://www.at-web.de/newsletter/archiv/

Infobote:
http://www.infobote.de/

Findolin:
http://www.findolin.de/
------------------------------------------------------------

|Nr.107||Archiv-Hauptseite| Übersicht2003||Nr.109 |