Usertracking: Datenquelle Netzwerküberwachung
Mit der Überwachung des Netzwerkverkehrs zwischen Webserver und anfragendem Computer können so viele Daten wie mit sonst keiner Methode gesammelt werden. Wird die Lösung zudem auf einem eigenen Rechnersystem realisiert, kann der Webserver dadurch entlastet werden. Im Folgenden sollen die drei Hauptvertreter vorgestellt werden.
1. Server Monitor
Server Monitore werden als Server Plug-In realisiert und zeichnen alle serverseitigen Ereignisse auf. Im Unterschied zu normalen Webserver-Logfiles werden die erhobenen Daten in Echtzeit an ein Data Warehouse übertragen und können sofort ausgewertet werden.
Problematisch wird der Einsatz von Server Monitoren jedoch, wenn ein Unternehmen mehrere Webserver parallel betreibt. Um hier ein vollständiges Bild vom Nutzerverhalten zu erhalten, müssen die Daten der verschiedenen Server zusammengefasst werden. Dies kann sehr aufwändig und fehlerbehaftet sein.
2. Network Monitor (Packet Sniffer)
Eine mögliche Lösung wäre der Einsatz eines Network Monitors (Packet Sniffers). Dieser ist zwischen dem Internet und der Serverfarm angesiedelt und protokolliert passiv alle versandten TCP-/IP-Pakete.
Da ein Network Monitor im Gegensatz zum Webserver auf einer niedrigeren Netzwerkschicht kommuniziert, hat er Zugriff auf weitergehende Informationen. Dies sind neben der Bestätigung, dass die vom Webserver versandten Daten den Empfänger erreicht haben, auch Informationen über:
- Client-initiated disconnects (z.B. Stop-Button während einem Download gedrückt)
- Netzwerkprobleme (z.B. Server retransmissions wegen überlasteten Netzwerken)
- Busy signals (z.B. Ignorierte Anfragen wegen einem überlasteten Server)
- Die Zeit, die der Server zum Antworten gebraucht hat
Mit einem Network Monitor können also zusätzliche Informationen über die technischen Rahmenbedingungen (Geschwindigkeit, Qualität und Ausfallsicherheit) gesammelt werden – alles Werte, die für die Qualität eines Internetauftritts von grundlegender Bedeutung sind.
3. Reverse Proxy Monitor
Noch weiter als Packet Sniffing geht ein Reverse Proxy Monitor (RPM), welcher den Kommunikationsstrom zwischen Client und Webserver nicht nur filtert, sondern auch gezielt verändert. Auf diese Weise lassen sich zusätzliche Informationen erheben (z.B. CGI-Parameter oder semantische Schlagworte). Angesiedelt wird ein Reverse Proxy Monitor, wie auch ein Network Monitor, zwischen dem Internet und dem Webserver.
Ein bekannter Anbieter dieser Technik ist die Firma SiteSpect. Ihr RPM ermöglicht neben der Datenerhebung und Analyse auch eine einfache Realisierung von A/B- und multivariaten Tests. Alle Analysen und Contentvariationen werden dabei vom RPM on the fly umgesetzt. Es sind also keinerlei Änderungen an den Inhalten auf dem Webserver nötig.
Diese Techniken zur Netzwerküberwachung haben einige Vor- und Nachteile.
Von Vorteil ist:
- Andere Verfahren zur Datenerhebung sind überflüssig
- Es können live und zentral so viele Daten gesammelt werden wie mit keiner anderen Methode. Dazu gehören zum Beispiel neben den üblichen Geschäftsdaten auch technische Informationen wie Serverfehler und Auslastungsdaten.
- RPMs ermöglichen es, immer First Party Cookies einzusetzen
Von Nachteil ist allerdings:
- Die Installation eines solchen Systems erfordert einiges Know-how, Konfigurationsarbeit und Zugriff auf das Netzwerk.
- In den Rohdaten können brisante Informationen wie Passwörter, Adressdaten und Kreditkartennummern unverschlüsselt vorhanden sein. Folglich sind einige Anstrengungen erforderlich, um das System auch datenschutzrechtlich sicher zu gestalten.
- Auch ein RPM stößt an seine Grenzen, wenn der Browser Daten aus dem Cache lädt oder massiv Flash eingesetzt wird.
- Ist die Datenerhebung vom Daten ausliefernden Webserver separiert, können anhand der Logfiles die Entscheidungskriterien (z.B. Zielgruppeneigenschaften) die zur Auslieferung eines bestimmten, dynamisch generierten Contents geführt haben, nicht mehr nachvollzogen werden.
Dieser Artikel entstammt meiner Diplomarbeit zum Thema “Usertracking”. Ich habe lange überlegt wie und in welcher Form ich die Arbeit veröffentlichen könnte und bin zum Schluss gekommen, dass meine Erkenntnisse daraus, über diesen Blog veröffentlicht, dem größten Publikum dienen können.
Eine Übersicht über weitere Artikel und ein Quellenverzeichnis sind unter
http://www.georg-weidner.de/usertracking zu finden.







Biser keine Kommentare zu "Usertracking: Datenquelle Netzwerküberwachung"
Was denkst du?