Translate
this
page

|Nr.14||Archiv-Hauptseite|Übersicht99||Nr.16 |


******************************************

@-web Newsletter Nr. 15

******************************************


Themen:
  1. WIE SUCHMASCHINEN ARBEITEN: TEIL 7, ScoutMaster (.de)
  2. NEUIGKEITEN

  3. Strato-Tip,
    FindALL - Metasucher,
    Quickbrowse-Zeitungslesen im Web,
    Yoolia- Recherchedienst.
  4. FEEDBACK


1. ScoutMaster

http://www.scoutmaster.de/

1 .1 SUCHMASCHINENANMELDUNG

Allgemeines


Hiermit stelle ich eine Suchmaschine vor, die etwas aus dem Rahmen fällt. Sie gehört bisher nicht zu den Grossen im deutschsprachigen Raum, hat aber das Zeug dazu. Die Betreiber nennen es lieber ein Recherche-Tool. Entwickelt wurde dieses Tool für die Kunden der Firma Fraas Software Engineering aus Wolfratshausen (Oberbayern). Es soll Dateien ohne vorherige Archivierung auf einer beliebigen Festplatte wiederzufinden.
Unified Data Archtektur (UDA) von Intersystems heisst das Werkzeug, das der Suchmaschine als Rüstzeug dient. Die postrelationale Datenbank Caché von Intersystems arbeitet genauer und schneller als herkömmliche relationale Datenbanken. Die Datenstruktur wird nicht mehr einfach nur in Tabellen abgebildet sondern multidimensional. Ein Datenwürfel der beliebig viele Dimensionen darstellen kann bildet die Datenstruktur komplexer ab. Der Zugriff auf die Daten kann durch die komplexe Abspeicherung in Objekt-Form wesentlich genauer und zielgerichteter erfolgen.
Für den normalen Nutzer ist wohl schon die Vorstellung von mehr als drei Dimensionen schwerlich nachvollziehbar.

Auf die Daten wird sowohl mittels Transaktionen als auch objektorientiert zugegriffen. Die Datenbank ist über verschiedene Techniken ansprechbar:

  • Standard-SQL
  • Objektorientiert
  • multidimensional über globale Arrays.

Die Datenbank ist für verschiedene Betriebssysteme entwickelt:
Diverse Unix-Derivate:Linux, Solaris, AIX, HP-UX, True64-Unix
Win 95/98, Win NT, Open VMS.

Die technische Lösung für Scoutmaster beruht überwiegend auf Intel-Rechnern mit Linux als Betriebssystem. Einzelne Rechner, die letztendlich zusammengeschaltet sind übernehmen verschiedene Aufgaben:
2 Rechner als Firewall
1 Rechner für Spiderfunktionen im WWW
diverse Rechner zum Beherbergen der Datenbanken
1 Rechner unter NT 4.0 bearbeitet alle Anfragen von aussen.

Anzahl der erfassten Webseiten: 1,8 Mill.
Logfile-Eintrag der Indexsoftware:
Name:
Eintrag: scoutmaster


SUCHMASCHINENANMELDUNG:
http://www.scoutmaster.de/scripts/weblink.mgw?MGWLPN=S&AC=H&D=D

ERFASSUNGSKRITERIEN

- URL
- Datum
- Metatags: keywords, description, author, publisher,....
- Seitentitel
- sichtbarer Text

RANKINGKRITERIEN

- URL
- keywords
- description
- Platzierung des Suchwortes im Text und im Seitentitel
- Suchbegriff im Linktext (dazu gehören auch E-Mail Verweise)

UPDATEZYKLUS

ist nicht bekannt. Der Inhalt erscheint nicht sehr aktuell, Seiten die vor 10 Monaten das letzte Mal besucht wurden sind keine Seltenheit. Die Aktualisierung der eigen Seiten können Sie durch erneutes Anmelden der Domain erreichen.

ERWEITERTE FUNKTIONEN

URL und E-Mail Suche
Über eine spezielle URL-Liste können Sie nach URL's suchen , b.z.w. im Datenbestand der URL's "blättern". Jede URL kann in Ihrer Struktur angezeigt werden. Das ist eine interessante Funktion bei fehlender Sitemap direkt auf der Webseite.
Die Suche nach E-Mail Adressen ist auch ohne nachfolgendem Domainnamen möglich, die Eingabe bis zum @-Zeichen genügt.

1.2 RECHERCHE

EINFACHE SUCHE
hier Schnellsuche genannt:
Die Standardsuche ist mit der UND Verknüpfung von Begriffen verbunden. Das heisst suche den 1.Begriff im ganzen Text , UND den 2.Begriff +/- 1 Zeile. Die Eingabe mehrerer Begriffe getrennt durch ein Leerzeichen erzwingt, dass alle Begriffe gefunden werden müssen. Für diese Begriffe wird festgelegt dass sie bis max. 1 Zeile vor oder nacheinander stehen dürfen. Dieses Kriterium lässt sich in der erweiterten Suche skalieren. Weitere Funktionen zum Spezifizieren der Suche:
- Und Es können ausserdem folgende Operatoren verwendet werden:
AND, UND, & sowie das Leerzeichen
- Oder, OR, ODER, |
- Und nicht, NOT, NICHT, !
- Nahe beieinander, NEAR, NAHE
- Nahe in n Zeilen Abstand:
Millennium NEAR/0 Jahreswechsel
Millennium NEAR/5 Jahreswechsel
Millennium NAHE/0Jahreswechsel
Millennium NAHE/5Jahreswechsel

Es ist möglich die Suche auf spezielle Felder einzuschränken, hier als Suche nach Schlüsselwörtern bezeichnet:

url:text Findet Seiten, die den angegebenen Text in der URL enthalten.
title:text Findet Seiten, die den angegebenen Text im Seitentitel enthalten.
visible:text Findet Seiten, die den angegebenen Text im sichtbaren Inhalt einer Seite enthalten.
date:datum Findet Seiten, die am angegebenen Datum erstellt wurden.
description:text Findet Seiten mit unsichtbarem Text, der nur in den Description-Zeilen der META-Tags vorkommt.
key:text Findet Seiten mit unsichtbarem Text, der nur in den Keys-Zeilen der META-Tags vorkommt.
author:text Findet Seiten mit unsichtbarem Text, der nur in den Author-Zeilen der META-Tags vorkommt.
publisher:text Findet Seiten mit unsichtbarem Text, der nur in den Publisher-Zeilen der META-Tags vorkommt.
meta:text Findet Seiten mit unsichtbarem Text, der nur in den sonstigen Meta-Zeilen (außer den oben genannten) vorkommt.

ERWEITERTE SUCHE

Zur präzisen Eingrenzung des Recherche-Ergebnisse können diverse Suchbegriffe aufgeführt werden. Es können max. 9x9 Begriffe in Tabellenform erfasst werden. Sie können durch logische Funktionen verknüpft werden. Die Funktionen werden durch Betätigen der entsprechenden Buttons oder, und, undnicht aktiviert . Dadurch werden gleich Eingabefelder für die nächsten Suchbegriffe erstellt. So kann eine Matrix mit 9x9 Begriffen erstellt werden, deren horizontalen Felder mit ODER verknüpft sind, vertikal durch UND b.z.w. NICHT.

ERGEBNISANZEIGE

Ist der Suchbegriff nicht vorhanden, wird das nachfolgende Wort im "Lexikon" wie der Index genannt wird, angezeigt. Ausgehend von dem angezeigten Ergebnis können Sie im Index vorwärts oder rückwärts blättern.
Die Anzeige kann in Ihrer Ausführlichkeit beeinflusst werden:
Kompaktansicht
Zeigt die Seiten der URL an
Superkompaktansicht
Zeigt nur die URL und die Anzahl der Fundstellen in der URL
Detailansicht
Besitzt die Option, die Anzahl der Zeilen um die Fundstelle herum anzuzeigen, es sind bis zu 30 Zeichen vor b.z.w. hinter der Fundstelle möglich. Die Angabe 3 Zeilen bedeutet, dass jeweils eine Zeile vor, eine Zeile nach und die Zeile der Fundstelle selber ausgegeben werden.
Trunkierung mittels Wildcards * ist genauso möglich wie der Einsatz von Platzhaltern ?
Sie können sowohl nach bestimmten Zahlenbereichen suchen, wie auch Datumsbereiche die in einem Dokument angegeben sind, finden. Die Angabe 30. Dezember 1999 findet diese Datum sogar in der Darstellung diverser Datumsformate.

ERGEBNISSE SORTIEREN

Interessante Möglichkeiten bietet die Ergebnisanzeige:
Neben der URL des gefundenen Dokumentes wird der Text des Titel-Tag angezeigt. Daneben erscheint ein Text-Symbol mit einer Zahl davor, diese gibt an wieviel Zeilen das Dokument hat. Es folgen bei der Standardsuche 3 Zeilen des Textes. Also genau die Zeile wo der Suchbegriff enthalten ist, der Suchbegriff ist hier farblich hervorgehoben. Ausserdem die vorherige und die folgende Zeile.
Durch Klicken auf das Text-Symbol kann das Dokument (suchmaschinengerecht aufgearbeitet) in einem neuen Browserfenster geöffnet werden. In diesem Fenster steht über dem Dokument die URL, das letzte Aktualisierungsdatum, das Datum wann ScoutMaster das letzte Mal die Seite inspiziert hat. Es wird auch erklärt in welchen Zeilen der Suchbegriff gefunden wurde. Natürlich ist der Suchbegriff und die jeweilige Zeilennummer im Dokument farblich hervorgehoben.
In der URL-Zeile gibt es noch ein Symbol das nach dem Anklicken die URL-Struktur der angegeben URL darlegt. Jede Seite wird Zeile für Zeile akribisch aufgelistet, mit Erstellungsdatum, Dateigrösse, Anzahl der Zeilen, und über welchen Link der ScoutMaster zu dieser Seite gekommen ist.
Für jede angegebene URL ist es möglich den Hoster des Angebot rauszubekommen, also z.B.Strato, Speedlink,.... Sie klicken dafür einfach auf die IP-Nummer des Host.
Mittels Auswahlliste können Sie bestimmen ob bis zu 200 Dokumente untereinander angezeigt werden sollen und die Anzahl der angezeigten Zeilen je Dokument zwischen 1 und 61 auswählen. Aber Achtung! Die Option 200 Dokumente benötigt einige Sekunden bis die Seite angezeigt wird.

2. NEUIGKEITEN

2.1 TIP FÜR STRATO GEPLAGTE:
Probleme mit dem Provider Strato haben zu einem speziellen Strato-Chat geführt. Zu erreichen unter:
http://194.97.6.206:4001
Entsprechend diversen Meldungen wird an den Strato-Problemen gearbeitet. Gestern erfuhr ich davon, dass "der Crash" wieder im Lot sei. Schaun mer' mal.

2.2 FINDALL

Eine Mischung aus Metasuchmaschine und URL-Verzeichnis ist FindALL. Die deutschsprachige Suche findet hauptsächlich bei Lotse, Crawler und Yahoo statt. Die Suche im Internationalen Web wird durch Anfragen bei AltaVista, Fast und Yahoo ermöglicht. Die Betreiber des Angebot sprechen von einem intuitiv zu bedienendem Portal. Sie können sich auch im Katalog von FindALL anmelden. Nachdem von Ihrer Homepage die Inhalte der Meta-Tags keywords und description ausgelesen wurden, müssen Sie sich noch für eine Kategorie entscheiden, in der Sie mit Ihrer Domain erscheinen möchten. Ein interessantes Feature ist die Livesuche, alle 30 Sekunden werden die gerade gesuchten Begriffe aktuell angezeigt.
http://www.findall.de/

2.3 QUICKBROWSE

Dieser Beitrag wird für die meisten Newsletter-Leser nur indirekt von Interesse sein. Da es sich hier eindeutig um die Orientierung im Web handelt und Ideen aus Amerika schnell zu uns rüberkommen ist es nur eine Frage der Zeit, wann wir diese Form des Zeitungslesen bei uns begrüssen können.
Ein Programm das schnelleres und übersichtlicheres Zeitungslesen im Internet ermöglichen soll, ist in Amerika seit Februar 1999 auf dem Markt.
Nach dem Anmelden ist es möglich aus verschiedenen Bereichen der amerikanischen Presse Artikel auszuwählen. Es werden die aktuellen Artikel zum ausgewählten Thema angezeigt. Durch Anklicken auf eine Überschrift werden die Artikel in ein separates Browserfenster geladen. Dort sammeln sich durch das jeweilige Anklicken die Artikel auf einer langen Seite an. Diese können Sie in Ruhe lesen, wenn sie wieder offlline sind.
Sie können sich auch die Artikel per E-Mail zusenden zu lassen.
Natürlich ist dieses Angebot wie die meisten Webseiten im Internet kostenlos, die Finanzierung erfolgt offensichtlich über Werbung.
So ist das Angebot zu erreichen:
http://www.quickbrowse.com/

2.4 YOOLIA

Als Recherchedienst versteht sich die Mannschaft von Yoolia AG, einem neuen Berliner Unternehmen. Die Idee ist nicht neu, sie stammt vom amerikanischen Markt und wurde auf den deutschen Internet-Markt umgesetzt. Hier wird zwischen den Anfragen des Users und kommerziellen Angeboten vermittelt. Informationen die Sie benötigen besorgt Yoolia. Einige der möglichen Hauptthemen sind: Mode, Musik, Reisen, Sport, Finanzen , Gesundheit, Kunst und Kultur. Die Daten des Users werden anonymisiert, so dass der User nicht mit unerwünschten Mails von den Anbietern belästigt wird. Eine aufwendige Sicherheitstechnik soll das möglich machen.
Auch dieses Angebot ist kostenlos, lediglich eine relativ anonyme Anmeldung ist erforderlich: Anonymer User-Name, Passwort, Postleitzahl, Land und Geschlecht und Geburtsdatum werden abgefragt. Es wird nicht geprüft ob die Angaben stimmen ;-)
http://www.yoolia.com/

3. FEEDBACK

Zu speedfind.de gibt es noch folgende Ergänzungen:

1. Eine nicht dokumentierte Funktion ist die Prüfung ob und welche Seiten der eigenen Domain erfasst wurden:

url:domainname.de

Ein grafisches Tool für Webmaster das diese Funktion übernehmen soll ist in Entwicklung.

2. Bei der Anmeldung wird ein 128-bit MD5 Hashkey als elektronischer Fingerabdruck ausgegeben. Damit wird die Datei auf Einzigartigkeit geprüft. Nach Meinung der Suchmaschinenbetreiber werden mit hoher Sicherheit Dubletten im Index vermieden.

3. Der schnellste Weg wichtige Seiten bei Speedfind.de in den Index zu bringen: Einzelne Seiten anmelden, die sind am nächsten Tag aufgenommen.

°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°

Ich wünsche allen Lesern einen wunderschönen Jahreswechsel und prima Erfolge im nächsten Jahr.
Die Magie der Zahlen kann nicht darüber hinwegtäuschen, dass bis zum nächsten Jahrtausend noch etwas mehr als ein Jahr vergeht. Obwohl wir das alle genau wissen, feiern wir das Ereignis bereits morgen. Na, eigentlich ist es auch nicht so wichtig, andere Kulturkreise haben ganz andere Zeitrechnungen und somit ganz andere Auffassungen vom Jahrtausendwechsel. In China wurde das dritte Jahrtausend vor über drei tausend Jahren begonnen!!!! Die Wissenschaftler streiten sich ob das Jahr 1 dieser auf der Geburt Jesus beruhenden Zeitrechnung nicht schon ein paar Jahre eher war. Vielleicht leben wir schon ein paar Jahre im neuen Jahrtausend ????? Die Astronomen rechnen mit einem Kalender der bereits 4713 Jahre vor der Geburt Christus beginnt.
Ich wünsche uns allen ein paar angenehme Besonderheiten, aber nicht durch den Jahreswechsel bedingt, sondern weil wir sie mit unserer bisherigen Tätigkeit begründet haben oder ein bisschen Glück dabei ist. Dass bisherige Taten "belohnt werden", dass gute Ideen dem einen oder anderen eine gute berufliche Basis gewährleisten, dass jeder sein finanzielles Auskommen hat um seine Pläne umzusetzen. Last but not least soll das seelische Wohlbefinden jedem ein Leben mit der erforderlichen inneren Stärke ermöglichen. bis zur nächsten Ausgabe der Link-News

Klaus Patzwaldt

-----------------------------------------------------------------


Impressum:

ISSN 1439-0744 (Deutsche Bibliothek)
Jahrgang 1
Ausgabe 15
Datum: 30.12.1999


Dieser Newsletter darf an Freunde oder Bekannte weitergeleitet werden.

Zitate sind unter Angabe der Quelle erlaubt. Nachdruck, oder Übernahme in andere Angebote erfordern die Zustimmung des Herausgebers.

Herausgeber: Dipl. Ing. Klaus Patzwaldt
Themenvorschläge, Änderungswünsche, Fragen, Hinweise, Kritiken, Bestellen u. Abbestellen des Newsletter, Änderung der Mailadresse:
Eine Mail an mail@at-web.de genügt.

Copyright © 1999
@-web Internetservice und Dienstleistungen
Am Wiesenrain 36a    12587 Berlin
http://www.at-web.de/
Tel: 030 / 64 48 84 11   Fax: 030 / 64 48 86 59

Newsletter-Archiv : http://www.at-web.de/newsletter/archiv/

------------------------------------------------------------

|Nr.14||Archiv-Hauptseite|Übersicht99||Nr.16 |