Parts de marché des navigateurs : des statistiques bidonnées !

Parts de marché des navigateurs : des statistiques bidonnées !Clairement, il faut aujourd’hui s’interroger sur la manière avec laquelle les outils de Web Analytics produisent leurs statistiques. La question se pose tout aussi bien avec Awstats que Google Analytics.

Extraire les user agents de vos fichiers de logs Apache

J’ai extrait un échantillon de 39690 hits des fichiers de logs de mon serveur Apache :

cat /var/log/httpd/access_log|cut -d '"' -f 6 > /home/ua_log

Seuls 9496 accès ont été effectués à partir des 6 principaux navigateurs. Cela représente 23.9% du total des hits. 76.1% du trafic provient de bots ou d’agrégateurs !

Les parts des principaux  navigateurs

Une fois les user agents extraits, j’ai utilisé la commande sed et wc pour disposer des hits effectués à partir des principaux navigateurs :

sed -n -r '/ Chrome\/([0-9]|\.)+ Safari\/([0-9]|\.)+$/p' /home/ua_log|wc -l #Chrome = 3650 (38.4%)
sed -n -r '/ Gecko\/[0-9]+ Firefox\/[0-9]+\.[0-9]+$/p' /home/ua_log|wc -l #Firefox = 2603 (27.4%)
sed -n -r '/(; (MSIE |Trident\/)[0-9]+\.[0-9]|Edge\/[0-9]+\.[0-9]+$)/p' /home/ua_log | wc -l # IE = 2247 +59-15 = 2291 (24.1%)
sed -n -r '/ Version\/.+ Safari\/.+$/p' /home/ua_log | wc -l #Safari = 699 (7.4%)
sed -n -r '/ (Opera|OPR\/([0-9]|\.)+$)/p' /home/ua_log|wc -l #Opera = 253 (2.7%)
Google Chrome 38.4%
Mozilla Firefox 27.4%
Microsoft Internet Explorer + Edge (???) 24.1%
Apple Safari 7.4%
Opera 2.7%

Les statistiques « navigateurs » dans Awstats

En reprenant  les données fournies ci-dessous par Awstats depuis le 1er juillet en termes de hits, les pourcentages des parts de marché des principaux navigateurs s’établissent comme suit :

Google Chrome 45.4% (+7.0%)
Mozilla Firefox 31.1% (+3.7%)
Microsoft Internet Explorer + Edge (???) 12.9% (-11.2%)
Apple Safari 7.5% (+0.1%)
Opera 3.0% (+0.3%)

Ces chiffres montrent une surévaluation des parts de l’ensemble des navigateurs à l’exception notoire d’Internet Explorer, sous évalué de 50% tout de même ! Le souci avec Awstats, c’est que la gestion des user agents est codée en dur dans le fichier awstats.pl.

awstats-navigateurs

Web Analytics  / Apache Awstats Formateur Apache Formateur Awstats Formateur Google Analytics Formateur LAMP Formateur Web Analytics Google Analytics Lamp Web Analytics 

Commentaires

Article super intéressant, est-ce qu’il serait possible de coupler ces données avec Google Analytics pour voir si les données remontées par l’outil Google sont fiables ? (et si le trafic humain vs bot est bien évalué ?) car Google en tant que régie à tout intérêt a gonfler les stats des sites sur lesquels il colle de la pub

@Guillaume Je n’ai pas mis Google Analytics sur ce site. Je pourrais le faire sur un autre site. Le problème de Google Analytics est qu’il s’agit d’un marqueur par script. C’est un outil qualitatif avant de fournir des données quantitatives proches du réel.

Laisser un commentaire

(requis)

(requis)