Translate
this
page

|Nr.15||Archiv-Hauptseite| Übersicht2000||Nr.17 |


******************************************

@-web Newsletter Nr.16

******************************************


Themen:

  1. WIE SUCHMASCHINEN ARBEITEN: TEIL 8, ACOON (.de)
  2. NEUIGKEITEN
    Meta-list.net, Orientierungshilfe im Web, Fremdwörterbuch, Domain-Namen, Flatrate
  3. TRICKY
    Webseiten speichern
  4. FEEDBACK
    Domain-Namen, ScoutMaster

------------------
1. ACOON (.de)
------------------
http://www.acoon.de/
ALLGEMEINE ANGABEN
----------------------------
Acoon gibt es seit dem Frühjahr 1999.
Die gesamte Suchmaschine besteht aus drei Windows-NT Rechnern, eine für Suchmaschinen eher ungewöhnliche Variante des Betriebssystem. Die Betreiber versichern jedoch, dass der Betrieb des System sehr sicher ist und es keine Ausfallprobleme gibt. Durch eingeplante Redundanzen gibt es die Sicherheit, dass ein Rechner den Anderen ersetzen kann. Die Intel-PC's sind jeweils mit zwei 400 Mhz Pentium II CPU ausgerüstet. Der Computer der den Webrobot beinhaltet verfügt über 512 MB Arbeitsspeicher.
Die beiden anderen Computer besitzen neben 1GB Arbeitsspeicher noch 400GB Festplattenkapazität, die über RAID-Systeme verwaltet werden.
Die Software ist eine selbstentwickelte Software, die in der Programmiersprache Delphi geschrieben wurde. Der gesamte Programmcode besteht aus 12000 Programmzeilen.
Betreiber der Suchmaschine ist die Firma Schöller & Poller GbR.

ANZAHL ERFASSTER WEBSEITEN: 23,8 Mill.
----------------------------------------------------
Logfile-Eintrag der Indexsoftware:
Acoon Robot v1.*

---------------------------------------------
1.1 RECHERCHE (SUCHFUNKTIONEN):
---------------------------------------------


EINFACHE UND ERWEITERTE SUCHE
--------------------------------------------
Bei Acoon gibt es nur eine Suchmaske, die eine beschränkte Anzahl an Suchoptionen zulässt. Für wenig geübte Nutzer wahrscheinlich sehr angenehm, da Sie hier nicht viel falsch machen können. Die erste Hürde wartet allerdings schon bei der Eingabe zweier Begriffe. Gerade dem unerfahrenen Nutzer wird es eher Probleme bereiten, dass die Grundeinstellung, die Eingabe mehrerer Wörter nur durch Leerzeichen getrennt, eine ODER-Suche veranlasst.
Weiter Suchoptionen:
+ steht für die Verknüpfung zweier Begriffe, nur Dokumente mit beiden Begriffen werden angezeigt.
- schliesst den nachfolgenden Suchbegriff aus.
Leerzeichen bewirken, wie oben beschrieben, das nur einer dieser Begriffe angezeigt werden muss.

Bei der Verwendung mehrerer logischer Operatoren müssen Sie darauf achten, dass die Abarbeitung der Anfrage von links nach rechts erfolgt.

1.Beispiel
Berlin München +Hotel
Alle Dokumente müssen Berlin oder München enthalten und das Wort Hotel

Eine Verknüpfung bezieht sich immer auf das zu diesem Zeitpunkt errechnete Teilergebnis. Es wird also zuerst die Abfrage der ersten beiden Worte (Berlin ODER München) gestartet, das (intern) ermittelte Ergebnis wird dann nach allen Dokumenten durchsucht, das auch noch mindestens einmal den Begriff Hotel enthält.

2.Beispiel: Berlin +München Hotel
Alle Dokumente müssen Berlin UND München erhalten ODER das Wort Hotel. Diese Abfrage ergibt eine volkommen andere Treffermenge. Erst werden alle Dokumente ermittelt die Berlin UND München enthalten. Durch die folgende ODER-Verknüpfung erfolgt keine weitere Eingrenzung des Ergebnisses, weil die Bedingung (Berlin UND München) ODER Hotel schon durch den bisherigen Suchlauf erfüllt ist, bei ODER muss ja nur eine Seite der Bedingung erfüllt sein.
Soweit die Theorie. In der Praxis zeigt sich, dass es für die Anzeige der vorderen Plätze kaum einen Unterschied macht, welche der beiden Verknüpfungen benutzt wurden.

Eine undokumentierte Funktion:
host:www.at-web.de verrät Ihnen alle bei Acoon registrierten Seiten der @-webWebsite.
Von den Betreibern der Suchmaschine wurde mir versichert, dass diese Funktion erst seit dem vergangenen Wochenende zur Verfügung steht.
Die Funktion wird noch weiterentwickelt, in den nächsten Tagen kommen noch einige Optionen hinzu.
In der nächsten Woche soll dann eine ausführliche Dokumentation zur Verfügung stehen.
In den nächsten 2-3 Monaten werden die Phrasensuche und Klammerbegriffe hinzukommen. Die Trunkierung (*) ist nicht geplant.

ERGEBNISANZEIGE:
------------------------

  • Seitentitel
  • Relevanz in %
  • Genaue URL des Dokument
  • Inhalt des Meta-Tag description
  • Wird der Meta-Tag description nicht verwendet, erscheinen die ersten 250 Zeichen des Seitentextes

ERGEBNISSE SORTIEREN:
-------------------------------

Durch Anklicken des unter jedem Ergebnis dargestellten Links:"Nur Seiten von dieser WWW-Site anzeigen", können Sie das Suchergebnis auf die von Ihnen bevorzugte Domain eingrenzen. Die Ausgrenzung einer bestimmten Domain ist ebenfalls möglich.

-----------------------------------------
1.2 SUCHMASCHINENANMELDUNG
-----------------------------------------

Im Erfassungsformular brauchen Sie nur die URL eintragen, die erfasst werden soll. Der Submit-Buttom ist beschriftet: URL eintragen/abmelden. Eine Erläuterung zur Abmeldung gibt es leider nicht.
Normalerweise ist es auch nicht erforderlich, Seiten abzumelden, da der Robot spätestens nach zwei bis 3 Wochen wieder vorbeischaut und nicht vorhandene Seiten aus dem Index entfernt. Wenn Sie diesen Vorgang beschleunigen wollen tragen Sie die Seiten die es nicht mehr gibt, nochmals ein. Dann ueberprüft die Acoon-Software diese Seiten innerhalb von 48 Stunden, merkt dass sie nicht mehr da sind und löscht sie aus der Datenbank.

ERFASSUNGKRITERIEN
----------------------------

Webseiten dürfen keinen Passwortschutz haben. Voraussetzung für die Anmeldung ist die deutsche Sprache der Webseiten. Bei sehr viel Grafik im Text kann es möglich sein, dass die Seiten ohne Meta-Tags nicht gespidert werden. Das gilt erfahrungsgemäss auch für Seiten, die sehr viel Script im Body-Bereich haben. Abhilfe ist möglich:
Benutzen Sie die Meta-Tags keywords und description mit deutschsprachiger Beschreibung und Suchbegriffen um in den Index aufgenommen zu werden. Ausserdem wird der Einsatz des folgenden Meta-Tag empfohlen:
<meta http-equiv="language" content="de">
Achtung Betreiber von Websites mit Framesets: Der Noframebereich muss mit Verweisen zu den weiteren Seiten bestückt sein. Damit ist der Robot von Acoon in der Lage die Folgeseiten zu erfassen. Alternativ ist auch noch eine Sitemap möglich, die nicht im Frameset gefangen ist. Statt der index.htm wird die Sitemap angemeldet, damit der Robot den optimalen Ausgangspunkt zum Erfassen der Seiten bekommt. Die Sitemap enthält nur Text und Verweise auf alle Seiten der Webpräsenz.

RANKINGKRITERIEN:
------------------------


  • Meta-Tag:"description"
  • URL
  • Seitentitel


UPDATEZYKLUS:
-------------------

Durch das leistungsfähige System der Suchmaschine ist es möglich den Index etwa 10-14 tägig zu aktualisieren. Täglich werden etwa 2. Mill Seiten gespidert. Angemeldete Seiten erscheinen nach 3-4 Tagen im Index. Der sehr schnelle Updatezyklus macht es im Normalfall unnötig, einzelne Seiten separat anzumelden, nach spätesten 14 Tagen ist die gesamte Domain im Index, wenn eine Seite angemeldet wurde. Natürlich muss diese Seite über Hyperlinks dem Spider den "Zutritt" auf die folgenden Seiten gewähren.

ERWEITERTE FUNKTIONEN
--------------------------------

Als zusätzlichen Service gibt es im unteren Teil der Startseite ein weiteres Formularfeld. Dieses leitet eine direkte Abfrage der Watchlist des Börsenmagazin.de ein. Die Abfrage des Börsenkurses ist nicht life, sondern erfolgt mit 15 minütiger Zeitverzögerung. http://kurse.boersenmagazin.de/

--------------------
2. NEUIGKEITEN
--------------------

2.1 ALTAVISTA UND META-LIST.NET
-------------------------------------------

In die bekannte Suchmaschine AltaVista (.de) ist jetzt zur gezielten Suche nach Mailinglisten und Newslettern die Abfrage der Suchmaschine Meta-List.net des Berliner Providers Speed-Link integriert. Bei AltaVista.de kann somit in über 234 000 Mailinglisten und Newsletter recherchiert werden. Meta-List.net verfolgt bei der Listensuche ein globales, multilinguales Konzept. Derzeit ist eine englische sowie eine deutsche Version verfügbar. Bis zum Frühjahr 2000 soll die Nutzeroberfläche zusätzlich in japanisch, chinesisch und in den europäischen Hauptsprachen angeboten werden. Meta-List lässt sich bei AltaVista aufrufen, wenn man nach einer Suchabfrage unter den Funktionen "Suche einschränken" auf "Mailinglisten" klickt. Natürlich ist Meta-List.net auch direkt ansprechbar: http://www.meta-list.net/

2.2 ORIENTIERUNGSHILFE IM WEB
------------------------------------------

Ein Kurzübersicht für diverse Sucheinrichtungen im Internet hat Fritz Lange entwickelt. In einer sehr kompakten und übersichtlichen Form hat er ein Hilfsmittel geschaffen, das sehr gut als Gedankenstütze und Ausgangspunkt für diverse Ausflüge ins Internet dienen kann. Sowohl Internet-Newbies als auch Professionals haben hiermit eine einfache und effektive Startrampe ins Web. Links zu diversen Suchmaschinen,Verzeichnissen und Metasucher sind genauso vorhanden, wie diverse Adressenverzeichnisse (Telefon, E-Mail, Branchen). Weitere Rubriken sind: Software/News, Staat und Gesellschaft, Wirtschaft und Finanzen, Naturwissenschaft, Heim und Familie, Freizeit und Hobby.
Nach Angaben des Autors steht das Suchwerkzeug zur beliebigen Nutzung und Verlinkung (unverändert).
Wir bitten um zahlreiches Feedback.
http://www.b7.net/suchen.htm


2.3 LANGSCHEIDT- FREMDWOERTERBUCH
----------------------------------------------------

Basierend auf einer Information der Ausgabe 1/00 des Web-Netz Newsletter (http://www.web-netz.de/) habe ich folgende Information recherchiert:
Die ständig aktuellste Ausgabe von Langenscheidts Fremdwörterbuch steht im Internet zur Verfügung. Es werden rund 30 000 Begriffe erklärt, die aus anderen Sprachen in das Deutsche Eingang fanden. Darunter auch viele Begriffe aus Fachbereichen wie beispielsweise Medizin, Rechtswesen und Medien.
Die Bedienung ist einfach, die Bearbeitungsgeschwindigkeit der Datenbank sehr akzeptabel. Nachschlagen können Sie hier:
http://www.langenscheidt.aol.de/


2.4 DOMAIN-NAMEN
------------------------

In letzter Zeit gab es vermehrt Meldungen über lange Domain-Namen. Weltweit sind mehr als 6,5 Millionen .com, .net und org-Domains registriert. Jeden Tag kommen mehr als 30.000 neue Domains hinzu. Nach Angaben der International Data Corporation wird erwartet, dass die Anzahl der registrierten Domain-Namen bis zum Jahr 2003 auf 13,1 Millionen steigt. Um dieser wachsenden Flut an Domain-Namen gerecht zu werden, sind für die genannten Domain längere Namen von bis zu 67 Zeichen erlaubt. Die Zeichenanzahl gilt einschliesslich der Rechnerbezeichnung www. und der Toplevel-Domain-Bezeichnung (.com, .org, .net)
http://www.registrars.com/
Offenbar ist die nationale deutsche Domainbehörde DE-NIC schon ein Schritt weiter. Ich berichtete bereits im Newsletter Nr.6 http://www.at-web.de/newsletter/news6.htm ausführlich über deutsche Domain-Namen die schon seit längerer Zeit 63 Zeichen lang sein dürfen.

2.5 FLATRATE ADE - SCHADE EIGENTLICH!!
-----------------------------------------------------

Am Montag berichtete einige Medien dass die Würzburger Firma compuTEAM http://www.ctonline.de/ als Anbieter einer Internet-Flatrate auftritt. Die Konditionen waren verlockend: 89,-DM im Monat, Einwahl über einen von 78 Einwahlknoten direkt am Backbone der Telekom einmalige Einrichtungsgebühr von 89,-DM, Mindestlaufzeit 3 Monate. Leider gab es am selben Abend auf der Webseite des Betreiber schon ein Dementi: "Aufgrund von internen Fehlern, entstanden durch eine unvollständige Übermittlung von Daten, ist es uns nicht möglich die cTOnline-Flatrate in der angegeben Form zu realisieren." Schade, schade, schade. Was nicht ist kann ja noch werden, ich bin ganz sicher dass wir in dieser Hinsicht vom Jahr 2000 noch viel erwarten können.

Als Trost können Sie überlegen ob folgendes Angebot interessant ist:
Privattarif von surf1 Flatrate:
179,-DM/Monat , Vertragslaufzeit 1 Monat, einmalige Einrichtungsgebühr: 199,- DM
159,-DM/Monat, Vertragslaufzeit 6 Monate, einmalige Einrichtungsgebühr: 149,- DM
139,- DM/Monat, Vertragslaufzeit 12 Monate, einmalige Einrichtungsgebühr 129,- DM
Surf1 möchte die Bedenken über lange Vertragslaufzeiten ausräumen und verspricht auf Preise und Leistungen anderer Anbieter zum Vorteil Ihrer Kunden zu reagieren.
http://www.surf1.de/

3. TRICKY
------------

Eigenmächtiger Internetexplorer:
Nicht direkt ein Trick, aber vielleicht trotzdem interessant:
Beim Speichern einer Datei mit dem IE 5 werden in den Quellcode der HTML-Datei zwei Zeilen hinzugefügt:
Eine Kommentarzeile mit der URL woher diese Datei stammt:
<!-- saved from url=(0059)http://localhost/at-web/newsletter/news16.htm -->
Eine Metatag-Zeile die den Browser als Text-Generator ausweist:
<META content="MSHTML 5.00.2014.210" name=GENERATOR>
Wenn Sie diese Einträge nicht in der gespeicherten Datei haben möchten gibt es zwei Möglichkeiten dies zu vermeiden:
1. Löschen Sie diese Zeilen im Quelltext.
2. Benutzen Sie einen anderen Browser zum Abspeichern. Netscape speichert, ohne die Datei zu verändern.

4. FEEDBACK
----------------
DOMAINNAMEN:
--------------------
Fritz Lange ist beim Durchstöbern des Newsletter-Archiv auf den Beitrag im Newsletter Nr.6 - Domainnamen für .de Domains - gestossen und hat mir folgende Ergänzungen mitgeteilt:

1. 26 Zeichen hats mal gegeben incl Dot und TLD, also eigentlich 22-23 Zeichen. Ärger kanns heute noch mit manchen E-Mailprogrammen geben, die sich standhaft weigern , längeres zu akzeptieren.

2. die Grenzen 3-Zeichen, KFZ-Kennzeichen, ein-Buchstabe sind Spezialitäten des DENIC, nicht für INTERNIC-Domains gültig.

3. zusätzlich sind Namen von TLD als Domainname ungültig, also COM, NET, EDU, ORG etc.

Zu diesem Thema von mir folgende Ergänzung: Alle von mir gegeben Informationen zur Secondlevel-Domain sind immer im Zusammenhang mit der .de Top-Level-Domain zu betrachten, so wie ich das auch im Newsletter Nr.6 formulierte.
Gross und Kleinschreibung ist nur bei der Secondlevel-Domain unwichtig, also alles was zwischen www. und .de steht. Zum Schreiben einer vollständigen URL die auch Unterverzeichnisse und Dateinamen enthält ist die genaue Schreibweise der Unterverzeichnisse in Abhängigkeit vom Betriebssystem des Host-Rechner sehr wichtig. Alle Server mit Unix-Systemen oder vielleicht noch besser ausgedrückt alle Nicht-Windows Server achten sehr genau auf die Gross- u. Kleinschreibung.
Genaue Informationen zur Gestaltung von Domainnamen sind im RFC 1035 enthalten. Dieser ist direkt beim DE-NIC einsehbar.
http://www.de-nic.de/

SCOUTMASTER:
-------------------

Einige Ergänzungen gibt es auch zur Suchmaschine ScoutMaster die im letzten Newsletter vorgestellt wurde:
Updatezyklus:
- Das Wiederbesuchen der Webseiten durch den Spider wird normalerweise aus den Änderungszeiträumen der einzelnen Seiten berechnet. Die Maschine ist zur Zeit in der Umstrukturierung, das Spidern wird demnächst wieder aufgenommen.
- Zum Ranking noch folgende Ergänzungen:
höchste Priorität hat die URL
keywords wird ebenfalls eine hohe Wichtigkeit zugeordnet.

Nach der Cebit wird ScouMaster als Intranet-Recherchetool verkauft. Vorerst für grössere Netzwerke dann auch die PC-Version. Die Versionen für Windows-NT und W98 sind bereits in der Testphase. Nach Auskunft von Herrn Fraas stellt das Tool die Basis für die Wissensermittlung im Unternehmen dar und arbeitet vollkommen selbstständig.

bis zur nächsten Ausgabe des @-web Newsletter

Klaus Patzwaldt

-----------------------------------------------------------------

Impressum:

ISSN 1439-0744 (Deutsche Bibliothek)
Jahrgang 2
Ausgabe 16
Datum: 14.01.2000

Dieser Newsletter darf an Freunde oder Bekannte weitergeleitet werden.

Zitate sind unter Angabe der Quelle erlaubt. Nachdruck, oder Übernahme in andere Angebote erfordern die Zustimmung des Herausgebers.

Herausgeber: Dipl. Ing. Klaus Patzwaldt
Themenvorschläge, Änderungswünsche, Fragen, Hinweise, Kritiken, Bestellen u. Abbestellen des Newsletter, Änderung der Mailadresse:
Eine Mail an mail@at-web.de genügt.

Copyright © 1999/2000
@-web Internetservice und Dienstleistungen
Am Wiesenrain 36a    12587 Berlin
http://www.at-web.de/
Tel: 030 / 64 48 84 11   Fax: 030 / 64 48 86 59

Newsletter-Archiv :
http://www.at-web.de/newsletter/archiv/

------------------------------------------------------------

|Nr.15||Archiv-Hauptseite| Übersicht2000||Nr.17 |