#!/usr/bin/perl ############################################################################### # # # Script: google_performance.pl - Version 0.1.20020813 # # # # Dieses Script durchsucht Apache-Access-Log-Dateien nach Referern, die von # # der Suchmaschine Google erzeugt wurden und gibt das Suchwort, die # # Position, die Sprache und die Zielseite aus. Zusätzlich werden alle # # Folgeseiten, die der Besucher betrachtet hat, ausgegeben. # # # # (c)Arne P. 2002 - http://scripte.arnep.de - arne(at)arnep.de # # # ############################################################################### # # # hier die Dateinamen eintragen # $filename = "access.log"; $outfile = "google.html"; # # ############################################################################### ## Ausgabedatei leeren open(OUT,">",$outfile) or die "Kann Datei $! nicht öffnen zum Schreiben"; ## Log-Datei öffnen open(IO,$filename) or die "Kann Datei $! nicht öffnen zum Lesen"; print OUT "
| Nr. | Suchstring | Start | Sprache | Zielseite | IP | Agent | Log-Eintrag | $i | $q | $num | $hl | $page | $ip | $agent | $log | \n"; } ## Nachfolgende Zeilen suchen anhand der IP-Adresse ## wenn eine andere IP-Adresse dazuwischen kommt, gehts nicht ## wird noch verbessert if ( $_ =~ m/^((\d+\.\d+\.\d+\.\d{1,3})[^"]* "GET ([^ ]*).*)$/ && ($2 eq $ip) ) { $log = $1; $page = $3; if ($page !~ m/.*gif$/ && $page !~ m/.*jpg$/) { print OUT "
| $i | $page | $ip | $log |
Statistik:
"; print OUT "\n";
print OUT "Gesamtzeilenanzahl: $zeilen
\n";
print OUT "Anzahl Stichwörter: $found
\n";
print OUT "