| Translate this page |
|Nr.9||Archiv-Hauptseite|Übersicht99||Nr.11 |
![]()
******************************************
@-web Newsletter Nr.10
******************************************
Themen:
- ALLGEMEINES
- WIE SUCHMASCHINEN ARBEITEN TEIL 2, FIREBALL
- NEUIGKEITEN
Onlinegebühren, Encyclopaedia Britannica, Atlas des Cyberspace,Jahr 2000 Problem, Suchmaschine f. Mailinglisten- TRICKKISTE
transparentes GIF- FEEDBACK
Ergänzungen zu AltaVista1. ALLGEMEINES
Wie immer gibt es auch ein paar Neuzugänge. Aktueller Stand: 217 Websites sind auf der Liste verzeichnet. Wer Freunde oder Bekannte hat, die in diesem Linkring mitmachen möchten, der sende mir einfach eine Mail. Für die Neuzugänge ist es wichtig, daß die Liste von ALLEN aktualisiert wird.
2. WIE SUCHMASCHINEN ARBEITEN TEIL 2, FIREBALL
1996 wurde die Suchmaschine unter dem Namen Flipper vom Fachbereich Informatik der TU-Berlin gestartet. Später hiess sie Kitty. Durch die Zusammenarbeit mit Gruner + Jahr kam die finanzielle Grundlage, um die Suchmaschine zu einer der Grossen im deutschsprachigen Raum wachsen zu lassen. Seit Juni 1997 ist Fireball online. Fireball ist nicht nur qualitativ mit AltaVista vergleichbar. Das ist auf die verwendete AltaVista Search Software zurückzuführen.
2.1 EINTRAGEN
Fireball listet nur deutschsprachige Seiten. Zum Erkennen wird ein Wörterbuch verwendet. Ausserdem gibt es einen besonderen ErkennungsalgoRhythmus. Dabei wird die Zeichenfolge eines Textes mit für deutsche Seiten typische Zeichenfolgen verglichen. Der Ähnlichkeitsgrad entscheidet darüber, ob die Seite als deutschsprachig eingestuft oder nicht in den Index aufgenommen wird.
2.1.1 Erfassungskriterien
Fireball empfiehlt Metatags zur Erfassung besonders dann einzusetzen, wenn die Site mit Frames gestaltet wurde, sehr viel Grafik enthält oder sehr wenig Text. Probleme bei der deutschsprachigen Indexzierung kann es geben wenn die Seite nur oder überwiegend aus:
Imagemaps oder Java-Applets (Javascript)
besteht, oder der sichtbare Text aus Gestaltungsgründen nur in grafischer Form als Bilder vorliegt. Dann sollte der deutschsprachige Textanteil beeinflusst werden durch: Einfügen deutschsprachiger Seitenbeschreibungen oder Bestückung der keywords mit entsprechenden Suchworten.
2.1.2 Rankingkriterien:
Die Wertung wird nicht pro Seite vorgenommen, sondern auf die gesamte Fundstellenmenge (gemeint ist hier vermutlich die angemeldete URL einschliesslich der Unterseiten) bezogen.
- Seitentitel
- URL
- Überschriften H1
- Hervorhebungen z.B. strong
- Häufigkeit des Suchwortes im Seitentext
- Häufigkeit des Suchwortes im Gesamtindex
- Das Metatag keywords
- Auftreten des Suchbegriffes oder der Phrase innerhalb der ersten Worte eines Dokumentes (z.B. im Titel)
- Distanz der einzelnen Suchwörter zueinander, je weiter die Suchworte beieinander stehen, je höher die Wertung
Die Indexierung erfolgt auf der Grundlage der AltaVista Search Software und diese indexiert wie folgt:
Dokumente, Texte (jedes Wort), Bilder(-namen), Applets und Active X, Objektnamen, wie auch sämtliche URL, Links (auch in Imagemaps), Host und Domain Name, usw.
2.1.3 Updatezyklus, Aktualisierung, wie wird die Website erfasst
Neuindexierungen von URL werden in den späten Nachtstunden durchgeführt. Am nächsten Morgen stehen die Dokumente in Fireball zur Recherche bereit. Eine besondere Rolle spielt für Fireball das Verfallsdatum. Nach Ablauf des Gültigkeitsdatum sucht der Robot Hardrock die Webseite erneut auf.
Ohne Gültigkeitsdatum werden Dokumente nach einigen Wochen erneut aufgesucht. Hat sich das Dokument geändert, wird der Aktualisierungszyklus kürzer festgelegt, gab es keine Änderung, verlängert sich der Zyklus bis zum nächsten Besuch von Hardrock.
2.1.4 Logfile-Eintrag
Der Robot von Fireball heisst Hardrock und hinterlässt folgenden Eintrag im Logfile:
KIT-Fireball/2.*
An dieser Stelle sei noch nachgetragen wie sich der Scooter von AltaVista im Logfile verewigt:
Scooter/2.*
2.2 SUCHEN
Was wird im Suchergebnis angezeigt?
Als Treffertitel wird angezeigt, was im Title-Tag eingetragen ist.
Als Beschreibungstext werden die Begriffe des Metatag description angezeigt, b.z.w. es werden die ersten Zeichen des HTML-Dokuments verwendet. Ausserdem erscheinen die URL (mit Hyperlink hinterlegt), das Veröffentlichungsdatum und die Grösse der Datei in kB.
Mit dem Pull-Down Menü Ausgabe kann die Menge der angezeigten Informationen beeinflusst werden:
standard, wie vorgehend beschrieben
detail, es werden zusätzlich die im Dokument enthaltenen Metadaten angezeigt.
kompakt, nur Dokumententitel, Veröffentlichungsdatum und die ersten paar Worte des Dokumentes.
2.2.1 Einfache Suche ( Standardmaske beim Ansteuern von http://www.fireball.de/)
Als Suchsprache ist deutsch voreingestellt. Mit der Auswahl im Pull-Down Menü kann in 18 europäischen Verkehrssprachen gesucht werden ohne den Anfragesyntax verändern zu müssen. Durch anklicken von WWW(AltaVista) wird die Suche auf das gesamte Web ausgedehnt.
Unterstützt werden folgende Suchoptionen:
Leerzeichen Voreinstellung ist die ODER-Suche. Werden mehrere Worte eingegeben wird erst geprüft ob alle Suchbegriffe in einem Dokument vorkommen. Diese Ergebnisse werden zuerst angezeigt. Danach werden die Dokumente geprüft ob mindestens ein Wort aus der Eingabe vorkommt und an die Trefferliste "angehängt".
+ schliesst das zu suchende Wort ausdrücklich ein
- schliesst das zu suchende Wort ausdrücklich aus
* Joker (Trunkierung), Eweiterung der Suche um Pluralformen, Adjektive, Adverben und konjugierte Formen des Suchbegriffes
" " Phrasensuche, es werden Satzteile, ganze Sätze, Slogans u.ä. gefunden, das Suchergebnis lässt sich gut einschränken. Auch Bindestriche (-), Punkte (.) oder Schrägstriche (/) zwischen den Worten (ohne Leerzeichen) bilden eine Phrase.Gross-/Kleinschreibung: Kleinschreibung findet alle Begriffe des Wortes, Grossschreibung findet exakt die Worte in dieser Schreibweise.
Empfehlenswert ist, möglichst viele Worte in die Suche einzubeziehen, also bevorzugt Phrasensuche, um so genauer werden die erzielten Treffer.
Weitere Suchoptionen:
Der Suchvorgang kann auf bestimmte Bereiche der Anfrage eingeschränkt werden:
anchor:text
Worte die im Text des Hyperlinks stehen, also etwa: <a href="">Text des Hyperlink</a>.
applett:class / Art
Kann man benutzen wenn man den genauen Namen eines Java-Applets weiss.
domain:domainname
Man kann sich hier alle Seiten einer Topleveldomain auflisten lassen, die in dieser Suchmaschine bekannt sind, z.B .net findet alle Domains die unter .net registriert sind.
host:name
Es werden alle Seiten einer Webpräsenz aufgelistet, wer wissen möchte wie umfangreich die Präsenz at-web.de ist gibt ein: host:at-web.de und bekommt alle Seiten aufgelistet, die unter der @-web Domain von Fireball erfasst sind.
image:Bildname
z.B. image:trans.gif listet alle Bilder auf, die unter dieser Bezeichnung abgespeichert wurden.
link:URL
Hiermit kann man feststellen, wieviel Links auf die eigene Webseite bei Fireball registriert sind. Z.B. listet link:at-web.de alle Links auf, die Fireball zu @-web kennt.
metaname:suchwort
Mehrere Suchausdrücke können durch logische Operatoren verknüpft werden.
Z.B. keywords:berlin listet alle Dokumente bei denen das Wort Berlin in den keywords aufgeführt ist. Die Suche nach Metadaten ist ausschliesslich im deutschsprachigen Index möglich.
Eine Liste der unterstützten Metadaten folgt weiter unten, Pkt.2.2.4.
text:Text
Findet Seiten in denen an irgendeiner Stelle das gesuchte Wort enthalten ist ( URL, Bildunterschrift, ...)
title:text
Beschränkt die Trefferquote auf Dokumente die den Suchbegriff im Titel enthalten.
url:text
beschränkt die Trefferquote auf Seiten mit einer bestimmten URL. Z.B. listet url:at-web.de alle Seiten auf die at-web als URL enthalten, einen Link auf at-web gesetzt haben, oder bei denen at-web in einem Dateipfad vorkommt.
2.2.2 Erweiterte Suche (Profi Suche)
Dient zur speziellen Einschränkungen des Suchergebnisses. Dafür werden boolesche Operatoren wie AND ,OR,(AND) NOT, NEAR verwendet.
Im Gegensatz zur einfachen Suche ist es zwingend notwendig, zwei oder mehrere Suchwörter mit logischen Operatoren zu verbinden oder als Phrase zu markieren.
AND (&) sowie OR (|) entsprechen den Funktionen der einfachen Suche + und Leerzeichen .
Mit NOT (-) schliesst man bestimmte Begriffe aus der Suche aus. Mit der Eingabe Unterhaltung AND NOT sex findet man alle Seiten die das Wort Unterhaltung aufweisen, schliesst davon aber alle Seiten aus, die den Begriff sex beinhalten.
NEAR(~) fordert, dass die Suchworte max. 10 Worte voneinander entfernt sind.
" " Phrasensuche, wie bei der einfachen Suche beschrieben.
Bei komplexeren Anfragen kann auch mit Klammerausdrücken gearbeitet werden:
(Berlin OR Bonn OR Nümbrecht) AND Unterhaltung
findet die Unterhaltungsangebote, genauer gesagt das Suchwort Unterhaltung, in allen Dokumenten, welche mindestens einen der drei Ortsnamen enthalten.
Sortierreihenfolge:
Die Ergebnisse werden unsortiert ausgegeben. Mit dem Feld Sortierung kann man beeinflussen, in welcher Reihenfolge die Treffer angezeigt werden sollen. Der Sortiereintrag:
Berlin Unterhaltung
zeigt gemäss obigem Beispiel zuerst alle Seiten an, die die Worte Berlin und Unterhaltung enthalten.
Berlin tanzen
zeigt gemäss obigem Beispiel zuerst alle Angebote an, die Berlin, Unterhaltung und tanzen enthalten.
ZEITRAUM: In separaten Feldern kann man den Zeitraum eintragen, auf den die Suche begrenzt werden soll.
Mit Eingabe von +* kann man die aktuelle Anzahl der von Fireball erfassten Dokumente ermitteln, die derzeit bei rund 7,9 Millionen deutschsprachigen Webseiten liegt.
2.2.3 Weitere Suchmöglichkeiten
2.2.3.1 Rubrikensuche
Für das schnelle Finden von vielgesuchten Begriffen hat man bei Fireball ein Rubrikenverzeichnis angelegt. Rund 150 000 Einträge sind in 250 Rubriken enthalten.
2.2.3.2 Lifesuche
Man kann beobachten nach welchen Begriffen momentan gesucht wird. Eine Liste enthält aktuelle Suchbegriffe, alle 30 Sekunden findet die Aktualisierung statt.
2.2.4 Metagenerator
ein kostenloser Service ist der Meta Tag Generator von Fireball. Es ist selbst für Anfänger ziemlich leicht, eigene Metadaten zu erstellen. Die jeweilige Zahl nach dem Komma ist die maximale Zahl an Zeichen, die für das jeweilige Tag bei Fireball verwendet werden dürfen. weitere Zeichen werden ignoriert. Von Fireball unterstützte Metadaten sind:
- description (Beschreibung), 256
- keywords (Suchbegriffe), 256
- robots (Index-Anweisungen für die Suchrobots), 32
- author (Autor, Verfasser), 64
- copyright (Urheberrecht), 64
- expiries (Verfallsdatum), 32
- page-topic (Seitenthema), 64
- page-typ (Seitentyp), 64
- publisher (Herausgeber d. Seiten), 64
- audience (Zielgruppe), 64
3. NEUIGKEITEN
3.1 ONLINEGEBÜHREN
Nachdem ich im vorigen Newsletter zu diesem Thema einige Zahlen durcheinandergebracht habe, entschuldige ich mich bei allen Lesern dafür. Nachfolgend in Kurzform die korrekte Information:
T-Online pro:
Grundgebühr: 19,90 DM, keine Freistunden, keine weitere Nutzungsgebühr, Telefongebühren: 3 Pf/Min.
T-Online eco:
Grundgebühr: 8,00 DM, 2 Freistunden, Nutzungsgebühr: 2Pf/Min., Telefongebühren:3 Pf/Min.
Zum Vergleich zwei weitere Tarife:
AOL:
Grundgebühr: 9,90 DM, keine Freistunden, keine weitere Nutzungsgebühr, Telefongebühren: 3 Pf/Min, zusätzlich pro Einwahl: 6 Pf
Mobilcom 01019 Power Tarif
(Mindestabnahme 20 Stunden im Monat): Grundgebühr: keine, keine Freistunden, keine weiteren Nutzungsgebühren, Telefongebühren: 3,9 Pf/Min, zusätzlich pro Einwahl 6 Pf.
3.2 ENCYCLOPAEDIA BRITANNICA
das altehrwürdige Nachschlagewerk ist jetzt vollständig mit seinen 32 Bänden ,die 44 Millionen Wörter beinhalten, kostenlos im Netz unter http://www.britannica.com/ vertreten. Die Betreiber des Webserver haben nicht mit der Beliebtheit dieses Werkes gerechnet, der Server ist hoffnungslos überlastet. Der Langenscheidt-Verlag hat auf der Frankfurter Buchmesse erklärt, mit dem 24-bändigen Brockhaus Lexikon im nächsten Jahr ins Web zu gehen. Das Angebot wird dann kostenpflichtig sein.
3.3 ATLAS DES CYBERSPACE
Der Brite Martin Dodge ist nebenberuflich als Geograf tätig, genauer gesagt als Cybergeograf. Er möchte das Internet gern bildlich darstellen. Dazu benutzt er z.B. normale Landkarten auf denen zu sehen ist:
die Dichte von Internet-Providern,
Anzahl von Netzbenutzern in verschiedenen Staaten,
der Datenfluss zwischen Netzknoten innerhalb eines Kontinents oder zwischen Erdteilen,
aber auch die Abbildung der Hirarchie komplexer Websites oder der bildlich wiedergegebene Weg den ein Anwender einschlägt, der sich durch Teile des WWW klickt. Dodge sagt über sich:
"Ich verstehe mich als Betreiber einer Galerie. In der Malerei haben Bilder auch eine Daseinsberechtigung obwohl sie nicht neu sind."
Es sind wirklich interessante Bilder u. Grafiken zu sehen, die den Cyberspace visualisieren sollen.
http://www.cybergeography.org/
http://www.casa.ucl.ac.uk/
http://www.invisibleworlds.com/
http://www.edgar.space.invisible.net/
http://www.mappa.mundi.net/
http://www.mids.org/
http://www.thinkmap.com/
3.4 JAHR 2000 PROBLEM
Die Bundesregierung hat eine Hotline zum Jahr 2000 Problem eingerichtet. Tel.: 0180/595 2000 (24Pf/Min.) Dort kann eine kostenlose CD-Rom angefordert werden. Infos auch unter:
http://www.info-jahr-2000.de/
3.5 DEUTSCHSPRACHIGE SUCHMASCHINE FÜR MAILINGLISTEN
Unter der URL:
http://www.meta-list.net
kann man mittels deutschsprachiger Suchfunktion in über 230 000 Diskussionsforen und Newslettern recherchieren.
4. TRICKKISTE
transparentes GIF
Mir einem transparenten GIF(1x1 Pixel) kann man verschiedene Gestaltungsaufgaben lösen.
- Tabellen mit leeren Feldern können mit einem transparentem GIF als Platzhalter in Ihrer Form gehalten werden, ohne dass Browser die Tabelle verstümmeln, weil sie die leeren Felder nicht darstellen. Einfach das GIF in die jeweilige Leerzelle einfügen.
- Es besteht die Möglichkeit einer zusätzlichen Verlinkung von Webseiten. Möglicherweise möchte man den Weg für Robots anders gestalten, als für den normalen Besucher. Dafür bietet sich die Verlinkung mit transparentem GIF an.
- Für die pixelgenaue Positionierung von Text und Grafiken besteht eine weitere Einsatzmöglichkeit. das transparente GIF wird z.B. am linken Bildschirmrand positioniert. Mit der width Angabe im Image-Tag lässt sich nun eine beliebige Grösse (etwa 75 Pixel) für das GIF angeben. Genau um diesen Wert verschoben erscheint die sich anschliessende Grafik auf dem Bildschirm.
5. FEEDBACK
bis zur nächsten Ausgabe der Link-News
Kein Feedback, dafür noch ein paar Ergänzungen zu AltaVista.de:
Phrase Dedection:
Recherche nach Markennamen, Produkten, Services und Persönlichkeiten bringt vorsortierte Sites zum Thema. Mit dem System Phrase Detection werden mehrgliedrige Suchbegriffe nach denen öfter gesucht wird, automatisch zu Phrasen verbunden.
AltaVista.de bieten einen Übersetzungsservice, der für das Übersetzen in verschiedene Sprachen genutzt werden kann. Die URL lautet: http://babelfish.altavista.de/. Es reicht eigentlich sich zu merken, dass man über einen Link von der AltaVista.de Startseite dort hingelangt.
Möglich ist:
Englisch-Deutsch
Englisch- Französich
Englisch-Italienisch
Englisch-Spanisch
Englisch-Portugiesisch
und die jeweiligen Umkehrformen wie:
Deutsch-Englisch,...
Und noch eine brandneue Nachricht zu AltaVista.de: Seit gestern steht bei AltaVista.de der Webkatalog Web.de zur Recherche zur Verfügung. Grundlage ist eine Vereinbarung zur Zusammenarbeit zwischen beiden Betreibern.
Klaus Patzwaldt
-----------------------------------------------------------------
Impressum:
ISSN 1439-0744 (Deutsche Bibliothek)
Jahrgang 1
Ausgabe 10
Datum: 22.10.1999
Dieser Newsletter darf an Freunde oder Bekannte weitergeleitet werden.
Zitate sind unter Angabe der Quelle erlaubt. Nachdruck, oder Übernahme in andere Angebote erfordern die Zustimmung des Herausgebers.
Herausgeber: Dipl. Ing. Klaus Patzwaldt
Themenvorschläge, Änderungswünsche, Fragen, Hinweise, Kritiken, Bestellen u. Abbestellen des Newsletter, Änderung der Mailadresse:
Eine Mail an mail@at-web.de genügt.
Copyright © 1999
@-web Internetservice und Dienstleistungen
Am Wiesenrain 36a 12587 Berlin
http://www.at-web.de/
Tel: 030 / 64 48 84 11 Fax: 030 / 64 48 86 59
Newsletter-Archiv : http://www.at-web.de/newsletter/archiv/
------------------------------------------------------------
|Nr.9||Archiv-Hauptseite|Übersicht99||Nr.11 |
![]()