Qwant collecte les données de l’expérience utilisateur !

Afin, sans doute, de parfaire, son algorithme, le moteur français Qwant traque vos clics à partir des pages de résultats de son moteur de recherche. Dans la copie d’écran ci-dessous, le lien vers DSFC (https://www.dsfc.net) est devenu :

https://lite.qwant.com/redirect/%2BNnDLYYpYFYdVS51d9NVaJkxiUsJcvcdPu8Z6chn6dg%3D/https%3A%2F%2Fwww.dsfc.net%2F?position=0&query=dsfc&t=web&l=fr

Même Google ne s’y prend pas aussi grossièrement, recourant pour sa part à l’attribut ping de la balise anchor , lorsque vous accédez au moteur de l’éditeur avec Chromium ! ;+)

Oui, Qwant traque l'internaute... au nom de l'expérience utilisateur !

Redirector pour ne pas lâcher votre expérience utilisateur à Qwant

Je ne sais pas dire si le fait de lâcher en pâture votre expérience utilisateur à Qwant est une bonne ou une mauvaise chose, même si l’anonymat vous est garanti. Toujours est-il que l’extension Redirector présente dans Chromium et dans Firefox Quantum pourra vous rendre de fiers services, si vous ne souhaitez pas que Qwant collecte les données issues de votre expérience utilisateur !

Redirector pour bloquer l'expérience utilisateur de Qwant

Moteurs  / Qwant Redirector 

Commentaires

Bonjour,
C’est d’autant plus surprenant que Qwant.com propose bien des liens directs sans redirection. Je partage également votre incompréhension d’avoir des redirections sur lite.qwant et pas sur qwant

@Balistic

C’est encore pire Sur le site https://www.qwant.com. Il s’agit d’un Javascript onmousedown :

<a href="https://www.dsfc.net/&quot; rel="noopener" target="_blank" onmousedown="LinkHelper.logHandler(this, Event, {AjaxRoute: ‘url’, position: ‘1’, t: ‘default’, domain: ‘web’, url: ‘https://www.dsfc.net/’, type: ‘serp’})" onclick="LinkHelper.clickHandler(this, Event)" onmouseup="LinkHelper.mouseUpHandler(this, Event)"><span class="result–web–title"><b>DSFC</b></span></a>

J’ai réussi à casser tout ça avec l’extension ReWriter sur Chromium.

Sur http://www.qwant.com l’espionnage est plus subtil, à grand coup de javascript déclenchés quand on clique :
https://s18.postimg.org/l5cugaeyx/Capture_d_cran_de_2018-02-18_13-31-31.png

Comment peut-être encore être surpris ? Les moteurs de recherche ne sont pas des gens qui nous veulent du bien.

@Thomas

Tout à fait !

Bonsoir,

Vous ne pouvez pas demander à un moteur de recherche de ne collecter aucune donnée. C’est impossible ! Sinon il ne saura jamais quel lien est pertinent pour vous.

Comment Qwant pourrait savoir que dsfc est un site pertinent si on ne lui informe pas que aujourd’hui 19 utilisateurs ont cliqué dessus

Ils ne vous veulent pas du mal, ils veulent juste vous offrir un bon service. Il faut un minimum de données à collecter si vous voulez que Qwant soit pertinent. Et Eric Leandri a déjà raconté dans un article que lorsque vous cliquez sur un lien, votre IP est stocké mais hashé dans leur base de données ce qui fait qu’il est impossible pour eux de vous retrouver, sauf si vous dites l’IP que vous aviez à tel date et tel heure.

@Bren

Le titre de mon billet est : « Qwant collecte les données de l’expérience utilisateur ! » Je n’ai pas dit que c’était mal. Je n’ai pas dit que c’était bien. Libre à chacun de prendre les dispositions qui lui correspondent. Pour ma part, c’est Redirector et ReWriter.

Alors avant de crier au loup, ça serait pas mal de lire leurs explications:
https://twitter.com/gchampeau/status/965164491385331714
https://twitter.com/gchampeau/status/965257110744428547?p=v

@pR

Mais je n’ai pas crié au loup. J’ai juste affirmé quelque chose de vérifiable, sans porter le moindre jugment, me semble-t-il :

« Je ne sais pas dire si le fait de lâcher en pature votre expérience utilisateur à Qwant est une bonne ou une mauvaise chose, même si l’anonymat vous est garanti. »

Avez-vous lu l’article, au moins ? Qu’est-ce que ce genre de commentaires à la noix peut me gaver !!!

Nous collectons des données NON PERSONNELLES qui nous permettent de savoir que quelqu’un (on ne sait pas qui, ni ce qu’il ou elle a fait avant) faisant cette recherche là a cliqué sur un lien menant à cette URL. Ca permet de savoir quels liens sont a priori les plus pertinents pour la recherche donnée, sans avoir aucune indication de qui a recherché quoi. Je vois pas trop ce qu’il y a d’étonnant là dedans, si ce n’est qu’effectivement on le fait sans collecter de données persos.

Comme vous l’avez sûrement vu l’ID de redirection est le même pour tout le monde, il n’est pas unique pour chaque utilisateur ou chaque session.

@Guillaume Champeau

J’ai indiqué clairement qu’il s’agissait de données issues de l’expérience utilisateur.

Concernant le lien, vous affirmez que le numéro figurant dans la redirection est unique, quelle que soit la machine à partir de laquelle la requête est effectuée ? J’ai bien compris ?

Oui. Peut-être qu’il change en fonction du pays et de la langue (ça serait logique mais j’ai pas possibilité de vérifier là tout de suite maintenant), mais c’est tout. C’est unique pour chaque URL de résultat sur une même requête. Vous et moi aurons les mêmes. Par exemple si vous cherchez « donnée », l’URL du premier résultat qui pointe vers Linternaute.com est https://lite.qwant.com/redirect/eB5dKSwfSkSjcl0JPiJBDlFiJ96KiD4AXrFVyB5NiZA%3D/http%3A%2F%2Fwww.linternaute.com%2Fdictionnaire%2Ffr%2Fdefinition%2Fdonnee%2F?position=0&query=donn%C3%A9e&t=web&l=fr

Ce n’est pas le cas ?

@Guillaume

Moi, j’obtiens ça : https://lite.qwant.com/redirect/RHyLGO6OuHeNa5zabExFdeI5urAKTVaywa4C0MJAIbw%3D/http%3A%2F%2Fwww.linternaute.com%2F?position=0&query=Linternaute.com&t=web&l=fr« .

Je pense qu’il s’agit d’un hash compilant l’adresse IP et d’autres données, pour l’occasion, personnelles.

Je ne sais pas comment vous obtenez cette URL mais moi j’ai strictement la même URL sur tous mes tests, y compris en me connectant derrière un réseau Tor, avec donc une autre adresse IP, un autre user_agent…

Et j’ai exactement la même URL vous que dans votre exemple sur la recherche « DSFC »… Comment l’expliquer ?
https://postimg.org/image/hy2mb0lez/

@Guillaume

Je l’ai eu en faisant une requête. Ce matin, c’est la même qu’hier soir.

/redirect/RHyLGO6OuHeNa5zabExFdeI5urAKTVaywa4C0MJAIbw%3D/http%3A%2F%2Fwww.linternaute.com%2F?position=0&query=Linternaute.com&t=web&l=fr

J’ai la même URL que Guillaume : https://lite.qwant.com/redirect/eB5dKSwfSkSjcl0JPiJBDlFiJ96KiD4AXrFVyB5NiZA%3D/http%3A%2F%2Fwww.linternaute.com%2Fdictionnaire%2Ffr%2Fdefinition%2Fdonnee%2F?position=0&query=donn%C3%A9e&t=web&l=fr

En fait, Denis, si votre billet est intéressant techniquement, je pense que c’est le titre qui retient l’attention et notamment « collecte », « données » et « utilisateur ».
Vous savez que l’on vit dans un monde où l’on se fait un avis d’un article en lisant uniquement son titre.

@gwado

Tout à fait d’accord ! Nous sommes dans la République des corps gras. ;+)

@gwado @Denis Szalkowski

Si vous ne souhaitez pas que les gens réagissent à votre titre. Evitez les titres exclamatifs et ce type de contenu. A lire votre titre , le contenu qui parle de bloquer cette redirection et les tweets réponses criant au vilain petit Qwant, ça a plutot l’air de vous déranger et c’est pour ça que j’ai répondu.

Je voulais juste dire qu’une simple redirection ne fait pas de Qwant un vilain moteur de recherche. Ils ont forcément besoin de comptabiliser les gens qui s’intéressent à vos blogs : L’IP sert à ne pas comptabliliser 2 fois le clic d’un même PC sinon on pourrait cliquer 1000 fois et ça compterait 1000 utilisateurs.

Bloquez les redirections si vous voulez mais Qwant ne saura plus combien de gens auront cliqué sur vos liens et vous risquerez alors de perdre en classement. Rien de méchant de mon côté en tout cas ;) Mes excuses si vous avez mal pris mon commentaire précedent.

@Bren

Concernant les redirections, j’indique clairement, dans l’article, comment faire. Je me demande si vous lisez vraiment les articles.

NB Le hash présent dans le lien ne m’indique pas la manière dont il est calculé.

Salut Dénis,

En fait, il faut faire la différence entre l’analytics, tracking Et profiling.
Ce que fait Qwant est le minimum syndical pour avoir des stars sur ce qui se passe chez lui. Les données enregistrées sont relativement minimales et surtout totalement anonymes. Il s’agit de stats, qui peuvent se comparer au pogosticking chez Google. L’humain valide la décision de l’algo pour ranker une URL.
On va considérer que c’est de l’analytics. D’autres vont faire du tracking (footprint browser, cookie, etag, etc) et pour Google c’est du profiling de haute volée. J’en entend parler de sources directes depuis 2005. Ça ne boxe pas dans la même catégorie.
Ton article n’est pas complètement trompeur, mais il n’est pas du tout claire à propos de ces différents niveaux d’enregistrement de données liées aux visites.

@Laurent

L’analytics sans tracking, c’est Awstats, à savoir l’analyse des logs du serveur Apache/Nginx issus des requêtes des Internautes. Dès lors que des paramètres figurent dans le GET de l’URL en rapport avec l’environnement de l’utilisateur, il y a là une intention de collecte de données complémentaires. Potentiellement, il s’agit, sans équivoque, de tracking et/ou de profiling.

Je ne mets pas sur le même niveau Qwant et Google, bien évidemment. Pour autant, je pense très sincèrement que ce type d’analyse d’activités – je suis là extrêmement générique – est totalement inutile. Sauf s’il s’agit de mesurer l’expérience utilisateur et/ou le Machine Learning modifiant l’algorithme de ranking. On serait là alors bel et bien dans le tracking/profiling !

Non ce n’est pas du profiling, puisqu’on ne sait pas que c’est toi.
Tu n’es même pas une IP

@Laurent

Tu te fais là l’apôtre de Qwant, là où je suis un utilisateur inconditionnel de Qwant. Quel est ton objectif, au juste ?

Laisser un commentaire

(requis)

(requis)