Analyse und Referrer

Vielfach werden wir von Kunden angesprochen, warum die Herkunft von Besuchern Ihrer Website überhaupt nicht erkannt werden kann. Schuld ist der im Request fehlende Referrer.

Über ein Feld im HTTP Prtotokoll kann (kann!) der Browser Informationen über die Herkunft eines Klicks  weitergeben. Der Referrer enthält üblicherweise die URL der Seite, die den Link auf die eigene Site  enthielt. Mitunter wird diese Information jedoch nicht in den Statistiken angezeigt. Die Gründe hierfür sind vielfältig, zunächst mal schematisch, was wirklich abläuft:

Es wird immer nur die unmittelbar vorherige Seite als Referrer angegeben. Beispiel:
Seite A enthält einen Link auf Seite B, diese wiederum auf Seite C. Verfolgt ein Benutzer nun diese Kette  von Links, so übermittelt der Browser mit den Requests die folgende Kette von Referrern:

Seite A —> Seite B (Referrer A) —> Seite C (Referrer B)

Wenn nun C die eigentliche Zielseite ist, und B lediglich eine Zwischenseite, die für den Anwender  unsichtbar den Browser “umleitet” (Redirect), dann kann die Seite B niemals die ursprüngliche  Absprung-Adresse enthalten.

Redirects

Teuflischer Grund für diesen Effekt sind Redirects - Es gibt zwei Sorten von Redirects: Serverseitige und  Clientseitige.

Erst mal zu den Serverseitigen: Der Server antwortet auf eine URL mit einem HTTP Status (30x), der den  Browser über eine neue Adresse der Seite informiert. Dies ist der korrekte Weg für Redirects und auf diese  Art und Weise geht der Referrer nicht verloren. In der Statistik steht die korrekte Absprungadresse.

Schlecht ist der billige Hack mit Javascript oder META Redirects. In beiden Varianten der clientseitigen Redirects lädt der Browser erst die ursprüngliche Seite um dann den Code (META oder Javascript)  auszuführen. Dieser Code lädt dann die eigentlich Zielseite. Diese hat als Referrer immer die Zwischenseite  mit dem META- oder Javascript-Code.

Pech für die Statistik: aus ihr geht nicht mehr hervor, von woher der Aufruf der Seite ursprünglich wirklich kam.

Abhilfe kann hier wirklich nur eine Umgestaltung der Website schaffen, in dem ein korrektes Verfahren für den Redirect verwendet wird, oder aber die vorherige Seite ebenfalls mit in die Statistik einbezogen wird. Geht dies nicht, weil diese zum Beispiel bei einem Hosting-Anbieter liegt, hilft hier sogar nur ein Wechsel der gesamten Infratstruktur weiter - oder man verzichtet auf diese wichtige Information.


am 25. April 2004 unter Analytics

Logfile Auswertung demystifiziert

Die bekannteste Methode, die Benutzung der eigenen Website zu messen, ist die Auswertung der eigenen Server Logfiles. Diese Methode liefert nur für ganz spezielle Anforderungen das notwendige Zahlenformat. Als Grundlage für strategische Entscheidungen, gerade im Marketing, ist die Auswertung von Logfiles ungeeignet.

Logfiles enthalten die technischen “Fingerabdrücke” der Browseraktivitäten des Rechners des Anwenders. Diese Fingerabdrücke haben nichts mit dem visuellen Eindruck, den ein Anwender von einer Website hat, zu tun. Eine neu geladene Webseite kann so bis zu 100 und mehr Einträge im Logfile verursachen.

Möchte man nur einen “Messimpuls” haben, wenn ein neuer Seiteneindruck im Browser des Anwenders erfolgreich geladen wurde, so ergibt sich bei der Logfile Auswertung die Notwendigkeit, diesen einen Impuls aus der Vielzahl der “Störgeräusche” herauszufiltern.

Die aggregierten Kennzahlen wie Visits (Besuche) oder Visitors (Besucher) stellen an die Logfile Auswertung eine weitere Herausforderung: Zusammengehörende Seitenabrufe eines Benutzers stehen verstreut zwischen den Abrufen aller anderer Benutzer und müssen mühsam wieder “zusammensortiert” werden - Ein Vorgang, der nicht immer funktioniert.

Möchte zudem ein Shopbetreiber auch noch wissen wieviele seiner Benutzer einen Kaufprozess vorzeitig abgebrochen haben und wie hoch die Warenkorb-Werte gewesen sind, ist er mit der Logfile Auswertung schlecht beraten - diese Informationen sind in Logfiles nicht enthalten.

Zudem kommen noch wesentliche Schwierigkeiten beim Handling hinzu: Logfiles enthalten keine Seitentitel sondern nur URL’s. Und wer diese bei modernen CMS Systemen mal gesehen hat, wird verstehen wie wenig Bezug eine URL zum Anwendereindruck einer Seite bzw. einer Seitenüberschrift  hat. Hinzu kommen weitere Dinge wie Auflösung von IP Adressen, Auswertung von externen und internen Referrern usw usw.

Unternehmen, die auf Basis von Server Logfile Auswertungen strategische Entscheidungen in der Weiterentwicklung ihrer Website getroffen haben, sind eher die seltene Ausnahme. Die gelieferten Statistiken sind zu fehleranfällig und zu nichtssagend. Dies ist zumindest unsere Erfahrung…


am 19. April 2004 unter Analytics