Web Analytics : dépolluer Awstats
Je continue de peaufiner mon travail de filtrage de trafic à partir de l’analyse des logs de mon serveur Apache et tout particulièrement de celle des user agents et aussi des pages accédés.
Parmi les pages, certaines d’entre elles n’offrent aucun intérêt quant à la mesure de l’audience. Sur un site WordPress, il s’agit des pages :
- wp-comments-post.php
- xmlrpc.php
- wp-login.php
- securimage_show.php, associé à l’extension SI Captcha Antispam
Ajoutons-y tous les accès aux pages stockées dans le dossier wp-admin qui sont accédés à l’occasion de l’édition de contenus ou de l’administration du CMS WordPress.
Le filtrage dans Awstats
Avec NotPageList et SkipFiles, vous disposez de deux directives dans Awstats qui permettent respectivement de filtrer par extension et aussi sur l’adresse de la page accédée.
SkipFiles="REGEX[\/(securimage_show|wp-comments-post|wp-login|xmlrpc)\.php] REGEX[\/awstats\.pl] REGEX[\/wp-admin\/]" NotPageList="css js class gif jpg jpeg png bmp ico rss xml swf woff ttf ttc eot otf svg txt html htm gz"