Die Suche wird zurzeit überarbeitet

HTML Basis

Gesamt-Inhalt  Extras  Zurück  Weiter

Webserver-Statistik 9

Die Möglichkeiten


Was kann aus den Logfiles herausgefiltert werden?

Zunächst einmal die nicht ganz unwichtige Größe des Transfervolumens. Das Volumen ist normalerweise beschränkt oder muß zusätzlich bezahlt werden. Zur Errechnung des Volumens müssen alle Bytes aller übertragenen Dateien summiert werden. In der Regel für den Zeitraum eines Monats. 1&1 dokumentiert das Volumen allerdings zusätzlich in einer eigenen Datei.

Die interessanteste Information, die Anzahl der Besucher nämlich, kann leider nur geschätzt werden. Dazu kommen wir noch. Eine Identifizierung der User selbst ist nicht möglich. Die dafür notwendigen Informationen liegen an unzugänglicher Stelle auf fremden Computern.

Etwas einfacher hat man es da mit den Suchrobotern. Diese können nach einiger Übung relativ leicht identifiziert werden. Kriterien sind z.B. Zugriffe auf den "Robots.txt" und die Schnelligkeit, mit der die Maschinen die Seiten einlesen. Das schafft oder macht kein Mensch. Auch die Kenntnis der Namen von Robots wie Googlebot, Scooter, Slurp ist natürlich hilfreich. Dann können folgende Fragen beantwortet werden: Welche Suchroboter kommen wie oft und indexieren welche Seiten?

Man kann - etwas mühsam allerdings und selten exakt - den Weg einzelner Nutzer durch die Seiten nachvollziehen. Interessant ist auch die Verweildauer (Kurzbesuch oder Dauergast?) und die zeitliche Verteilung. Wie wird die Homepage hinsichtlich der Tageszeiten, Wochentage und Monate frequentiert?

Eine Auflistung der Seiten nach Rückgabecodes ist insbesondere wegen der Hinweise auf nicht gefundene Dateien für den Webmaster hilfreich. Da outet sich so manch defekter Link und kann beim nächsten Upload repariert werden.

Der Rückgabecode 206 gibt Auskunft über uninteressante oder zu große Seiten, da die Übertragung vom Besucher abgebrochen wurde. Das sind eventuell Anhaltspunkte, um entsprechende Dateien zu optimieren. Manche Download-Tools allerdings sorgen ebenfalls für 206er-Meldungen.

Leicht erkennbar sind natürlich besonders beliebte und häufig geladene Seiten. Für den Webmaster interessanter dürften vielleicht sogar die selten aufgerufenen Seiten sein. Ergibt sich doch dadurch die Möglichkeit der gezielten Optimierung.

Werden angebotene Downloads angenommen oder fristen sie unbeachtet ihr Dasein? Und wie schnell werden Downloads übertragen? Das ist in Einzelfällen feststellbar.

Die Referrerseiten habe ich schon an anderer Stelle angesprochen. Darüber sind Informationen zur Verlinkung der eigenen Homepage auf fremden Websites zu erhalten, auch wenn diese noch so klein und unbekannt sind. Aber vor allem werden natürlich die "großen" Suchmaschinen und Linkverzeichnisse gelistet sein.

Wenn die einzelnen Referrer gezählt und entsprechend zugeordnet werden, erhält man Auskunft über die ergiebigsten und am meisten genutzten Links. Andersherum gilt das genau so. Fehlen bestimmte Referrer, sollte man vielleicht mal wieder ein paar Seiten neu anmelden.

Kommen die Besucher mehr durch die Eingangstür (Startseite) oder durch die Hintereingänge (Unterseiten)? Ersteres deutet auf Links bei Suchkatalogen, in Linklisten und auf fremden Seiten hin. Auch Direkteingaben und Lesezeichenaufrufe des Users bewirken dasselbe. Der gezielte Zugriff auf Unterseiten wird dagegen in der Regel durch Eingabe von Suchbegriffen bei Suchdiensten erfolgen. Die benutzten Suchwörter sind sämtlich in den Logfiles dokumentiert.

Dazu ein anschauliches Beispiel:

194.221.189.5 - - [21/Feb/2003:15:54:58 +0100] "GET /extras/basis_3.htm HTTP/1.0" 200 4416 www.htmlbasis.de "http://217.160.108.151/
?per_page=15&timeout=5&qry=html+img+transparent&type=and&tt=4&catg=web" "Mozilla/4.7 [de] (WinNT; I)" "194.221.189.213"

Am 21.2.2003 wollte sich ein User, der sich anscheinend mit HTMl-Befehlen ("img") auskennt, über transparente Grafiken in HTML-Dateien informieren. Er benutzte dazu den Suchdienst Metacrawler.de ("http://217.160.108.151/"), der ihm 42 Ergebnisse anbot. Woher weiß ich, daß es Metacrawler war und daß es 42 Ergebnisse waren? Weil ich "http://217.160.108.151/" zusammen mit "?per_page=15&timeout=5&qry=html+img+transparent&type=and&tt=4&catg=web" aus den Logfiles in die Adresszeile des Browsers eingegeben habe und folgendes Resultat erhielt (Auszug):

Suchanfrage

Ich weiß natürlich nicht, welche der zuerst gelisteten Seiten vorher von unserem User aufgerufen und angeschaut wurden. Ich weiß aber, daß er sich um 15:54:58 MEZ für die Nr. 9 entschied

Suchergebnis

und diese Seite meiner Homepage aufrief. Vermutlich hatte er sich aber mehr Detailinformationen erhofft. Auf jeden Fall entschwand er gleich wieder - trotz weiterer Links auf der Seite.

Viele Webmaster machen den Fehler, Seiten zu isolieren. Der User findet zwar per Suchmaschine eine interessante Seite und kann diese auch lesen, drucken und abspeichern. Wenn er jedoch andere Seiten des Projekts aufrufen möchte, fehlt das entsprechende Navigationsmenü oder ein Link zur Startseite, überhaupt eine Wechselmöglichkeit zum Rest der Homepage. Dieser Fauxpas ist leider gar nicht so selten und betrifft sogar renommierte Websites.

Ich komme noch einmal auf die Suchbegriffe zurück. Die meisten Statistikprogramme können diese auflisten. Sehr interessante Optimierungshinweise ergäben sich, wenn die Software auch in der Lage wäre, Suchbegriffe zu dokumentieren, die nicht zu eigenen Seiten führen, obwohl sie thematisch eigentlich passen. Das ist natürlich technisch nicht möglich. Aber es gibt eine Alternative, wenn man wie ich eine Suchenfunktion (eines externen Dienstleisters) eingebunden hat. In den Statistiken werden auch die Anfragen mit negativen Antworten gelistet.

Die Angaben zu Browsertypen und zu den benutzen Betriebssystemen sagen etwas aus über die Kompatibilität der Seiten. Wenn man z.B. selbst eher eingleisig mit Windows und dem Internet Explorer arbeitet, in den Logfiles aber auch verschiedene andere Browser und Betriebssysteme auftauchen, ist alles in Ordnung. So brausen hin und wieder Opera-Nutzer über meine Seiten. Und auch manch stolzer Apple-Besitzer gibt sich die Ehre.

Nicht zuletzt kann Datenklau erkannt werden. Also fremde Links, die z.B. auf ihren Seiten Download-Dateien anbieten, die in Wirklichkeit auf anderen Servern liegen und dann dort für Transfervolumen sorgen. Dies kann mit Logfile-Einträgen zurückverfolgt und unterbunden werden.

Ein nicht zu unterschätzender Vorteil der Logfiles ist die Möglichkeit einer extrem zeitnahen Auswertung. So kann im Bedarfsfall sehr schnell reagiert werden.


Zurück  Seitenanfang  Weiter
http://www.htmlbasis.de Impressum