Parts de marché des navigateurs : des statistiques bidonnées !

Parts de marché des navigateurs : des statistiques bidonnées !Clairement, il faut aujourd’hui s’interroger sur la manière avec laquelle les outils de Web Analytics produisent leurs statistiques. La question se pose tout aussi bien avec Awstats que Google Analytics.

Extraire les user agents de vos fichiers de logs Apache

J’ai extrait un échantillon de 39690 hits des fichiers de logs de mon serveur Apache :

cat /var/log/httpd/access_log|cut -d '"' -f 6 > /home/ua_log

Seuls 9496 accès ont été effectués à partir des 6 principaux navigateurs. Cela représente 23.9% du total des hits. 76.1% du trafic provient de bots ou d’agrégateurs !

Les parts des principaux  navigateurs

Une fois les user agents extraits, j’ai utilisé la commande sed et wc pour disposer des hits effectués à partir des principaux navigateurs :

sed -n -r '/ Chrome\/([0-9]|\.)+ Safari\/([0-9]|\.)+$/p' /home/ua_log|wc -l #Chrome = 3650 (38.4%)
sed -n -r '/ Gecko\/[0-9]+ Firefox\/[0-9]+\.[0-9]+$/p' /home/ua_log|wc -l #Firefox = 2603 (27.4%)
sed -n -r '/(; (MSIE |Trident\/)[0-9]+\.[0-9]|Edge\/[0-9]+\.[0-9]+$)/p' /home/ua_log | wc -l # IE = 2247 +59-15 = 2291 (24.1%)
sed -n -r '/ Version\/.+ Safari\/.+$/p' /home/ua_log | wc -l #Safari = 699 (7.4%)
sed -n -r '/ (Opera|OPR\/([0-9]|\.)+$)/p' /home/ua_log|wc -l #Opera = 253 (2.7%)
Google Chrome 38.4%
Mozilla Firefox 27.4%
Microsoft Internet Explorer + Edge (???) 24.1%
Apple Safari 7.4%
Opera 2.7%

Les statistiques « navigateurs » dans Awstats

En reprenant  les données fournies ci-dessous par Awstats depuis le 1er juillet en termes de hits, les pourcentages des parts de marché des principaux navigateurs s’établissent comme suit :

Google Chrome 45.4% (+7.0%)
Mozilla Firefox 31.1% (+3.7%)
Microsoft Internet Explorer + Edge (???) 12.9% (-11.2%)
Apple Safari 7.5% (+0.1%)
Opera 3.0% (+0.3%)

Ces chiffres montrent une surévaluation des parts de l’ensemble des navigateurs à l’exception notoire d’Internet Explorer, sous évalué de 50% tout de même ! Le souci avec Awstats, c’est que la gestion des user agents est codée en dur dans le fichier awstats.pl.

awstats-navigateurs

Web Analytics  / Apache Awstats Formateur Apache Formateur Awstats Formateur Google Analytics Formateur LAMP Formateur Web Analytics Google Analytics Lamp Web Analytics