|
Beachtliche 358 Downloads der PDF-Version des ersten Fulda Echo gab es vom 1. bis zum 31. Mai 2006. Unsere Erwartungen wurden damit mehr als erfüllt. Dabei ist diese Zahl sogar nochvorsichtig gerechnet. Aufeinanderfolgende Zugriffe von der gleichen Internetadresse wurden dabei nur einfach gezählt. Wer sich dafür interessiert, wie die Zahlen genau zustande kommen, kann hier weiterlesen.
Grundlage von Zugriffszahlen im Internet sind natürlich immer die sog. Access-Logs, die vom Provider heruntergeladen werden können. Darin enthalten ist jeder Zugriff, egal ob eine Seite, ein Bild oder eine PDF-Datei heruntergeladen wurde. Eine Zeile aus dieser Datei als Beispiel: 217.5.xxx.xxx - - [31/May/2006:12:59:19 +0200] "GET /dl/fulda- echo-mai-2006.pdf HTTP/1.1" 200 665071 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322; .NET CLR 2.0.50727)" "www.fuldaecho.de" Da genau vermerkt ist, welches Betriebssystem und welchen Browser der Besucher verwendet, habe ich die erste Spalte mit der Internetadresse (IP) zur Anonymisierung teilweise durch X´e ersetzt. Aus den knapp 580000 Zeilen für Mai 2006 werden mit dem folgenden Linux-Kommando die "richtigen" herausgesucht (grep) und so beschnitten, dass nur noch die IP übrigbleibt. Das entfernen mehrerer gleichen Adressen, die direkt aufeinander folgen übernimmt "uniq" und schließlich zählt "wc" (für word count) die Zeilen. cat access.log |grep "GET /dl/fulda-echo-mai-2006.pdf"| cut -d" " -f1|uniq|wc 357 |