Translate
this
page

|Nr.10||Archiv-Hauptseite|Übersicht99||Nr.12 |


******************************************

@-web Newsletter Nr.11

******************************************


Themen:
  1. ALLGEMEINES
  2. WIE SUCHMASCHINEN ARBEITEN: TEIL 3, LYCOS.DE
  3. NEUIGKEITEN

  4. Onlinegebühren, Gratiskarten im Web, Die andere Art der Navigation im WWW, Beliebtheit von Webseiten
  5. TRICKKISTE

  6. Erkennen der Bildschirmauflösung
  7. FEEDBACK

  8. zu Fireball und AltaVista

1. ALLGEMEINES

Wie immer gibt es auch ein paar Neuzugänge. Aktueller Stand: 221 Websites sind auf der Liste verzeichnet. Wer Freunde oder Bekannte hat, die in diesem Linkring mitmachen möchten, der sende mir einfach eine Mail. Für die Neuzugänge ist es wichtig, daß die Liste von ALLEN aktualisiert wird.
Im Rahmen einer Mailingaktion habe ich diverse Teilnehmer zur Aktualisierung Ihrer Daten aufgefordert. Der unpersönliche Ton liess sich nicht vermeiden, den sollte mir niemand übelnehmen. Es ist zu erwarten, dass die Anzahl der eingetragenen Links zurückgehen wird, da einige Teilnehmer nicht in der Lage sind Ihre Liste zu aktualisieren. Da nur aktuelle Listen einen wirklichen Nutzen bringen, ist es aber eher als Gewinn anzusehen wenn nur die tatsächlich aktiven Mitglieder eingetragen sind. Wer mir innerhalb der letzten beiden Tagen geschrieben hat und auf Antwort wartet habe bitte noch etwas Geduld, ich melde mich in den nächsten Tagen.


2. WIE SUCHMASCHINEN ARBEITEN: TEIL 3, LYCOS.DE

Lycos.de ist ein "Kind" des Bertelsmann Konzern und wurde im Herbst 1996 von der Bertelsmann Tochter Telemedia ins Web gestellt.

2.1 EINTRAGEN

Es genügt die Startseite der Webpräsenz einzutragen, alle weiteren Seiten werden automatisch erfasst. Der Spider von Lycos untersucht und verfolgt alle Links der Website. Alle Seiten auf die ein Hyperlink gesetzt ist, werden erfasst und in den Lycos-Katalog aufgenommen. Die Anmeldung der Seiten erfolgt immer in den USA. Deshalb erfolgt die Bestätigungsmeldung für einen erfolgreichen Eintrag in englischer Sprache. Das hat den Vorteil, dass man gleichzeitig im amerikanischen Index erfasst wird. Ob eine Webseite bei Lycos erfasst ist kann man auf der Anmeldeseite in einem speziellen Formular überprüfen und sich, falls erforderlich, gleich eintragen lassen.

Die Betreiber von Lycos behaupten in Ihrer Bescheidenheit die beste Suchtechnologie der Welt und den grössten Webkatalog mit über 100 Mill. URL zu besitzen. Bei der rasanten Entwicklung im Web kann so eine Behauptung schon morgen der Schnee von gestern sein. Ich gestehe aber, dass besonders die individuelle Berücksichtigung der Rankingkriterien für die Suche einen starken Eindruck auf mich macht.

2.1.1 Erfassungskriterien

Alles was wir über Metatags wissen, können wir bei Lycos.de getrost vergessen. Bei Lycos.de werden keine Metatags berücksichtigt. Von Startseiten mit Frames wird der NOFRAME - Bereich verwendet, um die Angebote zu indizieren. Hinweise zum NOFRAME - Bereich gab ich im Newsletter Nr.3, Pkt. 2.4. Indiziert wird der gesamte sichtbare und unsichtbare Text. Damit der unsichtbare Text nicht zur Anzeige kommt, wurden sogenannte Stoppwörter eingeführt, die im weiteren Text noch beschrieben werden.

2.1.2 Rankingkriterien

  • Seitentitel
  • Überschriften
  • Häufigkeit der Wörter im Dokument in Bezug auf die Durchschnittshäufigkeit im Lycos-Katalog pro Dokument
  • Abstand der Wörter zueinander
  • Wörter am Textanfang
  • Bestimmte Reihenfolge der Suchbegriffe
  • Metatags werden nicht berücksichtigt !

In diesem Zusammenhang ist das Powerpaneel - nur in der Profisuche verfügbar - eine sehr interessante und nützliche Einrichtung. Es ermöglicht dem Suchenden eine gewisse Mündigkeit bei der Wichtung der Rankingkriterien. Die genannten Rankingkriterien können in Ihrer Relevanz eingestellt werden: Pro Kriterium kann die Wichtung zwischen unwichtig, mittel und wichtig mittels Dropdown-Menü gewählt werden.
Wer also beispielsweise glaubt, dass es für seine Suche nicht relevant ist ob das Suchwort am Anfang des Textes besonders oft erscheint, stellt diese Option auf unwichtig.

2.1.3 Updatezyklus, Aktualisierung, wie wird die Website erfasst

Die Erfassung der Seiten kann einige Tage dauern. Spätestens nach etwa einem Monat sollte man prüfen, ob die Aufnahme erfolgreich war, sonst ist eine Neuanmeldung erforderlich. Der Spider besucht die Webseiten regelmässig. Webseiten die länger als 4 Wochen nicht im WWW verfügbar sind, werden zum "Abschuss" reif und aus dem Katalog von Lycos entfernt. Möglicherweise könnte es auch Websites erwischen, die auf einem unzuverlässigen Server gehostet werden. Ist der Server zufällig mehrmals genau zu dem Zeitpunkt nicht erreichbar sein, wenn der Spider zum idexieren vorbeischaut, ist die Löschung aus dem Index vorprogrammiert.
Dann hilft nur das erneute Anmelden der Website.

2.1.4 Logfile-Eintrag

Der Spider von Lycos.de heisst T-Rex und hinterlässt im Logfile den Eintrag:
Lycos_Spider_(T-Rex)

2.2 SUCHEN

Anzeige des Suchergebnisses:

Die Anzahl der Suchergebnisse pro Seite kann zwischen 10 und 40 selbst gewählt werden.

Die Anzeige der Suchergebnisse erfolgt in der Form:
- URL der Domain die das entsprechende Dokument enthält.
- Titel oder Überschrift, mit dem genauen Link zur betreffenden Seite
- Der Beschreibungstext enthält die ersten Worte des Seitentextes. Das kann auch eine Navigationsleiste am Anfang einer Seite mit Links wie
| home | o.ä. sein. Mit einem aussagefähigen Text hilft der Autor dem Suchenden also, schnelle Entscheidungen für die entsprechende Seite zu fällen.

- Die Relevanz der Seite wird in Prozent angegeben. Die Startseite von http://www.at-web.de/ schafft es bei dem Suchbegriff at-web nur auf den 2. Ergebnisplatz mit 86% Relevanz :-(
Vermutlich müsste ich für eine bessere Relevanz die Seite so ändern, dass @-web durch at-web ersetzt wird oder at-web noch mehrfach im Text wiederholen, möglichst am Anfang der Webseite. Ich möchte aber nicht um jeden Preis nur suchmaschinengerechte Webseiten haben und ein 2.Platz bei Lycos genügt mir :-)
Die Suche nach @-web ist übrigens nicht möglich, weil wie nachfolgend noch erläutert, das @ Zeichen als Stoppbegriff behandelt wird.
Interessant ist, wie der Noframebereich der @-web index.htm ausgewertet wird und ein sinnvolles Ergebnis wiedergibt. Wem würde es nützen wenn hier steht:" Ihr Browser ist nicht framefähig...."
- Dateigrösse in KB
- Die Option für die Suche nach ähnlichen Ergebnissen ist nicht bei allen Ergebnissen verfügbar.

2.2.1 Einfache Suche ( Standardmaske beim Ansteuern von http://www.lycos.de/ )

Da der gesamte Text des HTML-Dokument erfasst wird, sollte man keine Worte zum Suchen verwenden, die garantiert in jedem Dokument auftauchen wie z.B. head, body,... also alle HTML-Befehle. Diese sogenannten Stoppwörter zu denen auch einzelnen Buchstaben oder Zahlen, Satzzeichen (Punkt, Ausrufezeichen,..) und Bestandteile von Internetadressen (www. ,@) gehören, bewirken, dass keine Suche gestartet wird.

Unterstützt werden folgende Suchoptionen:
+ schliesst das zu suchende Wort ausdrücklich ein.
- schliesst das zu suchende Wort ausdrücklich aus.
" " Phrasensuche findet genau_den_Text.

Die Suche wird standarmässig im deutschsprachigen Raum des Internet durchgeführt, kann aber auf das gesamte Internet ausgedehnt werden.

2.2.2 Erweiterte Suche (Profi-Suche)

Mit der Profisuche steht ein mächtiges Werkzeug bereit, das die Suchergebnisse auf vielfältige Weise beeinflussen kann.
Folgende Optionen stehen zur Verfügung um die Profisuche zu beeinflussen:

  • Verknüpfungsmethoden
  • Eingabe boolescher Operatoren
  • Katalogangabe
  • Bereichsangabe
  • Sprachauswahl
  • Wichtung von Relevanzkriterien
  • Ergebnisdarstellung

Verknüpfungsmethoden
- über Drop-Down Feld:
Suchen Sie alle Wörter: entspricht dem + b.z.w. UND der Logikoperatoren.
Suchen Sie mindestens ein Wort: entspricht der ODER-Suche.
Geben sie einfach Ihre Frage ein: bestimmte Wörter der Frage werden als relevant eingestuft und als Abfragekriterium benutzt.
Geben sie die gesuchte Phrase ein: entspricht "" der Phrasensuche.


- mit booleschen Operatoren:
AND (+) das Wort soll im Suchergebnis enthalten sein.
OR Mindestens eines der Suchwörter soll im Ergebnis erscheinen.
NOT (-) Das Wort soll nicht im Suchergebnis enthalten sein.
"" Genau diese Wortgruppe finden.Mit der Phrase können zur Verfeinerung der Suche zusätzlich boolesche Operatoren kombiniert werden.
ADJ (unmittelbar benachbart) findet Wörter die direkt nebeneinander stehen.
NEAR (nahe) Die Suchbegriffe sind max. 25 Worte voneinander entfernt.
FAR (weit) Im Dokument stehen die Suchbegriffe mindestens einmal im Abstand voneinander, der 25 Wörter (oder mehr) umfasst.
BEFORE(vor-) Die Begriffe müssen in der angegebenen Reihenfolge im Dokument vorhanden sein, der Abstand zueinander ist dabei nicht von Bedeutung.
O ist ein zusätzlicher Operator mit der Funktion von BEFORE. Er wird nur im Zusammenhang mit ADJ,NEAR und BEFORE verwendet. Man schreibt dann: OADJ, ONEAR, OFAR.

Spezifierung von Wortabständen:
Für die Operatoren NEAR, FAR, ADJ, ONEAR,OFAR, OADJ
lassen sich die voreingestellten Wortabstände an die persönlichen Wünsche anpassen. Mit dem Schalter /n wird die Anzahl der Worte festgelegt. Mit Spass ADJ/2 Spiel werden die Dokumente angezeigt wo beide Worte in genau diesem Abstand enthalten sind. Das könnte sein: Spass und Spiel, Spiel oder Spass, Spass aber Spiel, ...

Katalogangabe gibt die Möglichkeit die Suche auf spezielle Bereiche einzuschränken:
Im gesamten Internet
im deutschsprachigen Katalog ( Länder Deutschland, Österreich, Schweiz u. Liechtenstein)
Im Tripod-Homepagekatalog
im Bilderkatalog
im Soundskatalog
im Bücherkatalog
im Wörterbuch

Bereichsangabe, die Suche kann auf bestimmte Bereiche eingegegrenzt werden:
Im ganzen Dokument
Im Titel
In der Webadresse (URL)
In den Seiten einer bestehenden Domain

Sprachauswahl:
Grundsätzlich können Dokumente in jeder Sprache gesucht werden.
Man kann die Suche auf eine von 38 vordefinierte europäischeSprachen reduzieren. Dafür wählt man aus dem Pull-Down Menü die gewünschte Sprache. Eine "Sprache" ist z.B. auch friesisch :-) Hat Otto Waalkes geschafft friesisch als europäische Nationalsprache zu etablieren ? Esperanto und rätoromanisch sind eher ungewöhnliche Sprachformen, für manchen aber sicher interessant.

Relevanzkriterien wichten:

Die Unterscheidung zwischen wichtig, mittel und unwichtig ist möglich für:

Alle Wörter finden..., Häufigkeit der Wörter..., Wörter erscheinen früh im Text..., Wörter stehen nahe beieinander..., Wörter erscheinen im Titel..., Wörter erscheinen in der vorgegeben Reihenfolge...

Ergebnisdarstellung:

Zwischen 10 und 40 Ergebnisse (in Zehnerschritten) können auf einer Seite gleichzeitig dargestellt werden.
Die Sortierung der Ergebnisse kann nach Domänen oder nach Relevanz erfolgen.

3. NEUIGKEITEN

3.1 ONLINEGEBÜHREN

Die Hannover Telefon GmbH bietet einen Internetzugang mit sekundengenauer Abrechnung für 2Pf./Min. einschliesslich Telefongebühren. Dafür ist monatlich eine Grundgebühr von 21,-DM zu entrichten. Wenig-Surfer können einen Tarif ohne Grundgebühr mit 4Pf./Min. nutzen. Einzelheiten unter http://www.htp-tel.net/

3.2 GRATIS-KARTEN IM WEB
Die Karten des Welt-Atlas der amerikanischen National Geographic Society lassen sich jetzt auch im Web abrufen. http://plasma.nationalgeographic.com/mapmachine/

3..3 DIE ANDERE ART DER NAVIGATION IM WWW
Eine vollkommen andere Form der Navigation im Netz beschreiten die Firmen Datango (Berlin) http://www.datango.de/ und Netzpiloten (Hamburg) http://www.netzpiloten.de/ . Das Internet soll mit dieser Form der Netzerkundung besonders bisher Web-Unkundige für das Medium interessieren.
Das Prinzip beruht auf Sight-Seeing Touren durch das Web. Es gibt sowohl Touren für das Durchschnittspublikum, aber auch Angebote spezieller Routen, durch die man von Spezialisten geführt wird.
Bei Datango wird die Tour z.B. von Moderatoren wie Sabrina Staubitz von RTL in einem kleinen Fenster geführt. Im Fenster daneben werden die einzelnen Stationen der Tour gezeigt. Um die Datango Tour nutzen zu können, muss man sich einen 1,1 MB Download eines speziellen Players zumuten, der nur mit dem Internetexplorer von MS funktioniert. Schnäppchen und Erotik sind die gefragtesten Touren.
Bei den Netzpiloten erlebt man ohne Moderation eine Abfolge von Links zu einer bestimmten Rubrik, wie etwa "Politik". Die Geschwindigkeit mit der die Links angefahren werden, kann der Besucher regeln, einen Stopp einlegen und nach Wunsch weitertouren.
Wer diese Art der Netzerkundung in ansprechender Form anbietet, kann vielleicht noch eine interessante Geschäftsidee verwirklichen. Ich bin überzeugt, dass diese Art der Führung ein grosses Publikum finden wird. Die vorhandenen Suchmaschinen und Kataloge und Verzeichnisse sind damit nicht zu ersetzen aber für Anfänger sicher eine interessante Möglichkeit, das Web kennenzulernen.

3.4 BELIEBTHEIT VON WEBSEITEN

Von MMXI Europe wurde eine aktuelle Studie zur Beliebtheit von Webangeboten erstellt. Dabei wurden unter den TOP 25 für Deutschland folgende Plätze von Suchmaschinen und Katalogen belegt:
1. AltaVista.com
7.Fireball.de
12. Lycos.de
23 Yahoo.com
24.Yahoo.de
http://www.mmxieurope.com/

4. TRICKKISTE

Erkennen der Bildschirmauflösung mit einem kleinen Java-Script

Besonders wenn man Bilder oder Grafiken ins Web stellt, ist es oft günstig, die Darstellung in mehreren Varianten entsprechend der Bildschirmauflösung zu varieren. Mit einem kleinen Javascript kann man die Bildschirmauflösung des Nutzers ermitteln und auf die für Ihn günstigste Darstellung weiterleiten.

In den Head-Bereich der Datei kopiert man dafür folgendes Script:

<script language="JavaScript">
<!--
if ((navigator.appVersion.indexOf("4.") != -1) && (navigator.appName.indexOf("Netscape") != -1) ||
(navigator.appVersion.indexOf("4.") != -1) && (navigator.appName.indexOf("Explorer") != -1))
{
size = screen.width + "x" + screen.height;
if (size == "Auflösung")
{
top.location = "index2.htm";
}
}
-->
</script>


Den Begriff Auflösung ersetzt man durch die Angabe der Bildschirmauflösung in Pixel z.B. 1024x768 für welche die Seite zu der umgeleitet wird, optimiert ist, im Beispiel die Datei index2.htm.
Im Beispielscript wird nur dann die Umleitung aktiviert wenn die Bildschirmauflösung genau mit dem unter Auflösung eingesetzten Wert übereinstimmt. Möglich ist aber auch die Abfrage ob die ermittelte Auflösung
ungleich: if (size != "Auflösung")
grösser: if (size > "Auflösung")
kleiner: if (size < "Auflösung")
als die angegebene Auflösung ist.


5. FEEDBACK

Zum vorigen Newsletter schrieb Gerhard Schoolmann: Domino.Bamberg@t-online.de
http://www.abseits.de

ergaenzend noch zwei Hinweise:

1. Fireball unterscheidet zwischen Gross- und Kleinschreibung. Es empfiehlt sich deshalb, wenn man z.B. sowohl bei einer Suche nach "Journalist" also auch nach "journalist" gefunden werden moechte, beide Versionen in die Seite einzubauen. Da die Keywords ausgewertet werden, kann man hier Woerter klein schreiben, die im deutschen Text korrekterweise gross geschrieben werden muessen. Gewohnheitsmaessig unterscheiden nicht wenige Nutzer von Suchmaschinen nicht zwischen Gross- und Kleinschreibung, weil diese Unterscheidung international nicht ueblich ist.

2. Wegen eines bisher noch nicht behobenen Fehlers in der Indizierungs-Software ist Fireball nicht in der Lage, eine Website, bei der per robots.txt der Indizierung einmal untersagt worden ist, nach einer erneuten Freigabe zur Indizierung diese Site zu indizieren. Fireball "merkt" sich intern, dass die Website fuer robots gesperrt worden ist und weigert sich standhaft, sich noch einmal die (mittlerweile geaenderte) robots.txt anzuschauen.


Eine weiter Zuschrift kam von Werner Tiesbohnenkamp wernert@okay.net:

In Ihrem Newsletter steht zu Altavista folgendes:

> Scooter aktualisiert erfasste Webseiten täglich !, Neuerungen werden
> somit täglich erfasst und aktualisiert.

Das ist insofern missverständlich, als dass es den Eindruck erweckt, Altavista würde veränderte Websiten automatisch täglich aktualisieren. Altavista updated zwar den Index täglich unter Berücksichtigung der täglichen manuellen Eintragungen und der von Scooter am gleichen Tag besuchten Seiten. Es werden aber nicht täglich alle erfassten Websites besucht, dass geschieht nur im Vierteljahresrhythmus. Will man also, dass eine aktualisierte Webseite auch so im Index erscheint, muss man diese manuell anmelden.



bis zur nächsten Ausgabe der Link-News

Klaus Patzwaldt
-----------------------------------------------------------------

Impressum:

ISSN 1439-0744 (Deutsche Bibliothek)
Jahrgang 1
Ausgabe 11
Datum: 05.11.1999


Dieser Newsletter darf an Freunde oder Bekannte weitergeleitet werden.

Zitate sind unter Angabe der Quelle erlaubt. Nachdruck, oder Übernahme in andere Angebote erfordern die Zustimmung des Herausgebers.

Herausgeber: Dipl. Ing. Klaus Patzwaldt
Themenvorschläge, Änderungswünsche, Fragen, Hinweise, Kritiken, Bestellen u. Abbestellen des Newsletter, Änderung der Mailadresse:
Eine Mail an mail@at-web.de genügt.

Copyright © 1999
@-web Internetservice und Dienstleistungen
Am Wiesenrain 36a    12587 Berlin
http://www.at-web.de/
Tel: 030 / 64 48 84 11   Fax: 030 / 64 48 86 59

Newsletter-Archiv : http://www.at-web.de/newsletter/archiv/

------------------------------------------------------------

|Nr.10||Archiv-Hauptseite|Übersicht99||Nr.12 |