Translate
this
page
|Nr.6||Archiv-Hauptseite|Übersicht99||Nr.8 |
![]()
******************************************
@-web Newsletter Nr.7
******************************************
Themen:
1. ALLGEMEINES
Wie immer gibt es auch ein paar Neuzugänge. Aktueller Stand: 192 Websites sind auf der Liste verzeichnet. Wer Freunde oder Bekannte hat, die in diesem Linkring mitmachen möchten, der sende mir einfach eine Mail. Für die Neuzugänge ist es wichtig, daß die Liste von ALLEN aktualisiert wird.
2. WEBSTATISTIKEN TEIL1
Diesen Beitrag schrieb Gastautor Peter Kammerer mailto:webmaster@15370-petershagen.de Webseite:http://www.15370-petershagen.de/
Für die Einschätzung der Effektivität seiner Webpräsenz ist die regelmäßige Auswertung des Logfiles von großer Bedeutung. Aber nicht nur das Wissen um die Art und Weise, wie die eigene Website besucht wird, sondern auch bei der Überprüfung auf versteckte Fehler im HTML-Code ist die Analyse der Zugriffsaufzeichnung seht nützlich.
Um Statistiken vergleichbar zu machen, einigte man sich 1996 auf die beiden wesentlichen Kenngrößen "Visits" ( für die Anzahl der Besuche ) und "PageViews" oder "PageImpressions" (für die Anzahl der insgesamt abgerufenen Seiten).
Leider halten sich die Statistikprogramme nicht immer an diesen *Standard*.
Auf dem PC des Providers, auf dem unsere Website physikalisch vorhanden ist, werden alle Zugriffe auf die jeweiligen Dateien aufgezeichnet, also protokolliert. Das Ergebnis dieser fortlaufenden Aufzeichnung ist das sogenannte Logfile.
Ohne detailliert auf den Inhalt einer jeden Zeile im Logfile einzugehen, sei zunächst gesagt, dass sich aus den Aufzeichnungen u.a. die grobe Herkunft der Zugriffe (Domain), Zeitpunkt und Zeitdauer, aufgerufene Datei der Website (HTML-Dokument, Grafik, Audio/Videodatei...), verwendeter Browser und benutztes Betriebssystem herauslesen lassen.
Eine Zeile aus einem Logfile könnte etwa so aussehen:
193.159.143.223 - - [31/Aug/1999:11:05:13 +0200] "GET /assets/button/but_email.gif HTTP/1.1" 200 335 "http://www.15370-petershagen.de/html/header_gaeste.html" "Mozilla/4.0 (compatible; MSIE 5.0; Windows 98)"
Die Web-Server protokollieren nicht alle im gleichen Format. Im Laufe der Zeit sind eine Reihe von Log-Datei Formaten entstanden. Einige seien hier genannt:
- Combined logfile format (Netscape / Apache Web-Server)
- Common logfile format (Apache Web-Server / Netscape)
- IIS 3 Format (Microsoft Internet Information Server)
- Lotus Domino Format (Lotus Domino Server)
- NCSA Format (Apache Web-Server)
- WebStar (WebStar /Mac)
- WebTrends extended logfile format (Microsoft Internet Information Server Version 3
- W3C-Format (Microsoft Internet Information Server, V.4)
Unterschiede in den Logformaten bestehen bezüglich der aufgezeichneten Daten, zum Beispiel die Protokollierung der Browserinformationen und/oder der AddClicks.
bis zur nächsten Ausgabe der Link-News
Die Auswertung wird mit Hilfe von speziellen Statistikprogrammen durchgeführt, die dabei jede Zeile im Logfile analysieren. Manche Provider stellen dabei dem Kunden nur die Ergebnisse bereit, andere bieten zusätzlich noch das Logfile zum Download an. Letzteres ist insofern interessant, da man dann die Möglichkeit zu individueller Auswertung nach eigenen Kriterien hat.
Je nach verwendetem Statistikprogramm wird man bei den Ergebnissen mit einigen Fachbegriffen konfrontiert.
HIT
Zunächst wird uns gemeldet , wieviel Hits unsere Website hatte. Unter den Hits versteht man die Summe aller Zugriffe auf unsere Seite, egal woher und weshalb sie erfolgten. Jeder Zugriff auf unsere Website entspricht einem Hit und damit auch genau einer Zeile im Logfile. Dieser Zugriff kann von einer Suchmaschine im Zuge der Seitenindizierung kommen, von einem User, der sich im URL geirrt hat (und gleich wieder wegklickt) oder aber auch von einem Besuch unserer Seite kommen. Jede Datei, die vom Server angefordert wird, erzeugt statistisch einen Hit. Eine komplett geladene HTML-Seite mit 5 Bildern erzeugt also 6 Hits. Werden Dateien jedoch von einem Proxy bereitgestellt, erfolgt in diesem Fall keine Anforderung beim Server und es gibt keinen Hit.
Die reine Anzahl der Hits ist also für die Bewertung der eigenen Website nicht von sonderlicher Bedeutung. Erst wenn Ursache und Ziel dem Hit zugeordnet werden können, wird es interessant.... So kann man z.Bsp. der Statistik entnehmen, wann welcher Robot welche Seite indiziert hat. Dies kann für strategische Überlegungen genutzt werden.
Im Zusammenhang mit den Hits liefert das Statistikprogrammm aber auch eine Übersicht der erzeugten Fehlermeldungen. Erfolgt z.B. ein Zugriff auf eine Datei, die nicht gefunden wird, erzeugt dies den Fehler 404 (File Not Found).
Die Gründe dafür können vielseitig sein: Der User kann sich vertippt haben, die Groß-Kleinschreibung stimmt nicht, die Datei-Extension ist falsch. Ebenso kann aber auch die Pfadangabe zu der Datei fehlerhaft sein, die Datei kann überhaupt fehlen... Hier bietet sich eine ausgezeichnete Möglichkeit, um an der Qualität der eigenen Seiten zu *feilen*. Selbst wenn die Navigation stimmt, alle Objekte der Seite dargestellt werden und scheinbar alles in Ordnung ist, beweist die Statistik oft genug, dass insbesondere die Spider nicht in jedem Fall alle Dateien auffinden, und somit vielleicht dem einen oder anderen Link nicht folgen können. Das kann schlecht für die Indizierung seiner Seiten sein.
FILES
Viele Statistikprogramme melden auch die Anzahl der gesendeten Dateien. Ich selbst halte diesen Wert für relativ unbedeutend.
PAGEVIEWS
Eine weitere Kenngröße sind die sogenannten PageViews (wörtlich soviel wie *Seitenbetrachtungen*). Diese Bezeichnung wird von vielen Statistiktools übereinstimmend verwendet. Fordert ein User eine HTML-Datei an und wird diese komplett auf den Userrechner übertragen, entsteht zunächst ein Hit. Wird nun erst nach einer gewissen *Verweildauer* auf dieser Seite eine weitere Seite angefordert oder die Website verlassen, wird aus den Hit zusätzlich eine *Seitenbetrachtung*. Wie groß die Zeitspanne sein muß, um aus einem Hit ein Pageview zu machen, ist im Statistikprogramm festgeschrieben. Die Anzahl der Pageviews insgesamt sagt etwas über das Interesse an unseren einzelnen Seiten aus. Es sagt aus, wie wir es verstanden haben, den User für den jeweiligen Inhalt zu interessieren. In der Regel werden neben der Gesamtzahl an Pageviews auch noch die Anzahl der Pageviews für die einzelnen Seiten ausgegeben. Dies kann ein Indiz dafür sein, welche Seite uns besonders gut gelungen ist, oder welcher Inhalt besonders anspricht.
Neben der bloßen Anzahl stellen einige Tools (z.B. webbsuccess) noch andere Daten bereit: Verweildauer auf der Seite, wie oft war die Seite Einstiegsseite, wie oft Ausstiegsseite, wie oft war es die einzige Seite, gesendete Datenmenge u.v.a.m.
Befindet sich die angeforderte Datei jedoch bereits im Cache des Browsers, wird zwar ein Hit generiert, das Logfile enthält an dieser Stelle aber die Meldung 304. Das bedeutet, dass zwar das Objekt angefordert wurde, es jedoch nicht vom Server gesendet werden mußte.
SESSION, VISITS
Werden beim Surfen von einem User mehrere zusammenhängende HTML-Seiten abgerufen, navigiert der User also innerhalb unserer Website, gehen die Daten in die Kenngrößen Session oder Visits über. Ob der Wert als Session oder als Visit ausgegeben wird, hängt vom verwendeten Statistiktool ab. Diese Werte sagen eventuell etwas darüber aus, ob wir es mit den angebotenen Inhalten unserer Einzelseiten geschafft haben, den User auf unserer Website festzuhalten oder ob er enttäuscht schon nach der ersten Seite *die Flucht* ergreift....
Ein Besuch (Visit) wird als beendet angesehen, wenn innerhalb einer vorgegebenen Zeit keine weiteren Seiten aufgerufen werden. Beim dem Programm websuccess ist dieses time out auf 10 min festgelegt.
Das Tool websuccess bietet noch die Möglichkeit, das Besucherverhalten zu analysieren. Es zeigt nach Häufigkeit den Besucherweg durch unsere Seiten, in welcher Reihenfolge wurden also zusammenhängende Seiten abgerufen, welchen Weg nahm der Besucher durch unsere Website....
Im Zusammenhang mit den Begriffen Session und Visit sei jedoch auf eine mir bekannte Besonderheit hingewiesen:
Der Provider strato AG definiert für sein Analyse-Tools die Session wie folgt:
(Zitat Anfang) Sessions, auf deutsch Sitzungen gibt an, wieviele unterschiedliche Domains auf Ihre Internet-Präsenz zugegriffen haben. Greift eine Domain erneut auf Ihre Internet-Präsenz zu, wird dies innerhalb eines Tages nicht als neue Session gewertet. Die Anzahl der "Sessions" läßt bedingt Rückschlüsse auf die Anzahl der Besucher zu. (Zitat Ende)
So richtig mag ich dieser Definition nicht folgen, weicht sie doch deutlich von der Bezeichnung *Sitzung* ab. Sie entspricht daher m.E. auch nicht den Festlegungen bezüglich der IWV-Zahlen. Andererseits könnte diese Interpretation die Ursache für die recht unterschiedlichen Ergebnisse bei Auswertung des Logfiles meiner Internetpräsenz sein...
kByte Send (oder ähnliche Bezeichnungen)
Zu den Standardergebnissen zählt wohl auch die Angabe des Traffic im Betrachtungszeitraum, also welchen Umfang hatte der Datentransfer von unserer Seite weg, wieviel Bytes wurden durch den Server gesendet.
Diese bisher genannten Kenngrößen lassen sich nun, je nach eingesetztem Analysetool, für verschiedene Zeiträume ermitteln. Sehr häufig wird wohl die monatliche Auswertung zu finden sein, die in die parallel dazu bereitgestellten Jahreswerte eingeht.
Im zweiten Teil wollen wir sehen, welche Informationen wir dem Logfile noch entlocken können, und welche Schlußfolgerungen wir für unsere Arbeit ableiten können.
3. NEUIGKEITEN
3.1 WEB-KATALOG YAHOO BRINGT DIE MEISTEN HITS
Eine Studie von WebSideStory's StatMarket.com, hat herausgefunden, dass Yahoo bei der Beanspruchung von Sucheinrichtungen im Web ganz oben steht. Satte 43,55 Prozent der Hits, die im Web durch Suchmaschinen und Kataloge erzeugt werden, kann Yahoo.com für sich verbuchen. Auf Platz 2 landete Altavista mit 10,49 Prozent. Es folgen in der Auswertung Exite mit 9.85 Prozent und Infoseek mit 7,60 Prozent. Die Plätze 5-10: AOL Netfind, MSN, GoTo, Lycos, HotBot und WebCrawler.
Übrigens: WebSideStory bietet kostenlose Zugriffsstatistiken für private Homepages an.
3.2 NEUE NEWS-SUCHMASCHINE
Paperazzi, ein neuer Suchdienst für Online-Artikel. Das Angebot ähnelt Paperball (Gruner u. Jahr) Es wird in ca. 20 000 Artikeln und Infos von 100 Online-Zeitungen gesucht. Die Suchdatenbank ist recht flott. Man kann sich auch per E-Mail über Neuigkeiten des Suchbegriffs informieren lassen. http://www.paperazzi.de/
3.3 MEHR RADIOSENDER IM WEB
Vor drei Jahren gab es 56 Radiosender im Internet. Im vorigen Jahr waren es bereits 1.652 zum jetzigen Zeitpunkt sind es bereits 2.651 Radiosender im Web.
4. TRICKKISTE
So einfach kann man in einem HTML-Dokument Textstellen "markieren": Der zu markieren de Text wird in einen span Tag eingebunden.
<span style="background-color:#FFFF33">Dieser Text ist mit gelbem Textmarker hinterlegt</span> Man kann auch noch weitere Angaben machen, z.B. die Schriftfarbe ändern und die Schriftart z.B. fett:
<span style="background-color:FFFF33; color:000000; font-weight:bold"> Das ist ein schwarzer Text in Fettschrift auf gelbem Hintergrund</span>
Für den span-Tag benötigt man keine Style-Sheet Definitionen im Head-Bereich. Wer es möchte, sollte es einfach mal ausprobieren !
Klaus Patzwaldt
-----------------------------------------------------------------
Impressum:
ISSN 1439-0744 (Deutsche Bibliothek)
Jahrgang 1
Ausgabe 07
Datum: 10.09.1999
Dieser Newsletter darf an Freunde oder Bekannte weitergeleitet werden.
Zitate sind unter Angabe der Quelle erlaubt. Nachdruck, oder Übernahme in andere Angebote erfordern die Zustimmung des Herausgebers.
Herausgeber: Dipl. Ing. Klaus Patzwaldt
Themenvorschläge, Änderungswünsche, Fragen, Hinweise, Kritiken, Bestellen u. Abbestellen des Newsletter, Änderung der Mailadresse:
Eine Mail an mail@at-web.de genügt.
Copyright © 1999
@-web Internetservice und Dienstleistungen
Am Wiesenrain 36a 12587 Berlin
http://www.at-web.de/
Tel: 030 / 64 48 84 11 Fax: 030 / 64 48 86 59
Newsletter-Archiv : http://www.at-web.de/newsletter/archiv/
------------------------------------------------------------
|Nr.6||Archiv-Hauptseite|Übersicht99||Nr.8 |