Parts de marché des navigateurs : des statistiques bidonnées !
Clairement, il faut aujourd’hui s’interroger sur la manière avec laquelle les outils de Web Analytics produisent leurs statistiques. La question se pose tout aussi bien avec Awstats que Google Analytics.
Extraire les user agents de vos fichiers de logs Apache
J’ai extrait un échantillon de 39690 hits des fichiers de logs de mon serveur Apache :
cat /var/log/httpd/access_log|cut -d '"' -f 6 > /home/ua_log
Seuls 9496 accès ont été effectués à partir des 6 principaux navigateurs. Cela représente 23.9% du total des hits. 76.1% du trafic provient de bots ou d’agrégateurs !
Les parts des principaux navigateurs
Une fois les user agents extraits, j’ai utilisé la commande sed et wc pour disposer des hits effectués à partir des principaux navigateurs :
sed -n -r '/ Chrome\/([0-9]|\.)+ Safari\/([0-9]|\.)+$/p' /home/ua_log|wc -l #Chrome = 3650 (38.4%) sed -n -r '/ Gecko\/[0-9]+ Firefox\/[0-9]+\.[0-9]+$/p' /home/ua_log|wc -l #Firefox = 2603 (27.4%) sed -n -r '/(; (MSIE |Trident\/)[0-9]+\.[0-9]|Edge\/[0-9]+\.[0-9]+$)/p' /home/ua_log | wc -l # IE = 2247 +59-15 = 2291 (24.1%) sed -n -r '/ Version\/.+ Safari\/.+$/p' /home/ua_log | wc -l #Safari = 699 (7.4%) sed -n -r '/ (Opera|OPR\/([0-9]|\.)+$)/p' /home/ua_log|wc -l #Opera = 253 (2.7%)
Google Chrome | 38.4% |
Mozilla Firefox | 27.4% |
Microsoft Internet Explorer + Edge (???) | 24.1% |
Apple Safari | 7.4% |
Opera | 2.7% |
Les statistiques « navigateurs » dans Awstats
En reprenant les données fournies ci-dessous par Awstats depuis le 1er juillet en termes de hits, les pourcentages des parts de marché des principaux navigateurs s’établissent comme suit :
Google Chrome | 45.4% (+7.0%) |
Mozilla Firefox | 31.1% (+3.7%) |
Microsoft Internet Explorer + Edge (???) | 12.9% (-11.2%) |
Apple Safari | 7.5% (+0.1%) |
Opera | 3.0% (+0.3%) |
Ces chiffres montrent une surévaluation des parts de l’ensemble des navigateurs à l’exception notoire d’Internet Explorer, sous évalué de 50% tout de même ! Le souci avec Awstats, c’est que la gestion des user agents est codée en dur dans le fichier awstats.pl.