Le rankbrain : un jus de « concon » sémantique ?
Je viens de lire avec attention le billet d’Olivier D. et d’Olivier A. sur le RankBrain. Grosso modo, il s’agirait d’un nouvel algorithme utilisé par Google qui utiliserait les liaisons sémantiques entre les mots et les expressions.
Depuis quelques temps, je me suis aperçu d’une plus forte magnétisation sémantique dans les pages de résultats des moteurs de recherche. Dans un article récent où je parlais de l’importance de l’expérience utilisateur et du SMO, j’évoquais l’existence d’une espèce de magma sémantique dont l’existence a été illustrée par Christian Méline au travers de l’utilisation de méta-mots et de lexies par les moteurs. Lisez Christian : il est passionnant ! C’est un grand copain à Laurent qui, lui, a fait un super boulot autour du cocon sémantique. A ne pas confondre avec le « concon » sémantique !
Et Bing : affaire suivante !
Ce phénomène de merdier magma sémantique, Je l’avais surtout remarqué dans Bing, où la requête sur formateur sécurité informatique ou cybersécurité est devenue dans les SERP formation sécurité informatique ou cybersécurité. Formateur devient formation, quand il est combiné à d’autres mots ou expressions. Dans le cas de Bing, le problème vient sans doute de la faible occurrence de l’expression formateur sécurité informatique ou cybersécurité dans l’index. Il y a bien une sorte de magnétisation sémantique du fait d’un problème de pondération relative de mots ou d’expressions les uns par rapport aux autres. Remarquez que, sur le mot formateur employé seul dans la recherche, le moteur Bing se comporte « normalement ». Ça commence à se gâter sur la requête sur deux mots. Quant à celle sur trois mots, vous pouvez en voir le résultat sur la copie d’écran ci-dessous.
Pour Google, maintenant !
Il semblerait que Google soit exposé au même problème que Bing, dans une moindre mesure. J’en avais parlé dès juillet 2014. Sans pouvoir dire vraiment à quoi il sert, il y a deux hypothèses quant au fameux RankBrain. Ou bien il est là pour amortir/corriger cette magnétisation sémantique sous la pression d’un gonflement de l’index. Ou bien il contribue, à l’insu de son plein gré, à l’amplifier.
En faisant une requête sur formateur debian, je serais de tenter pour la 2e hypothèse, une sorte de remake du grand blond avec une chaussure noire, la créature qui échappe au Docteur Frankenstein. Dans les SERP, formateur debian est supplanté par formateur linux ( ou formateur open source). La réciproque est totalement fausse. Pourquoi ? En faisant une recherche sur chacun des deux mots debian et linux dans Google, le nombre d’occurrences sur le mot linux est près de 10 fois supérieur au mot debian. Google semble être victime de la même problématique observée sous Bing, une sorte de magnétisation sémantique mal maîtrisée, un effet de bord auquel j’ose croire que l’expérience utilisateur n’amène pas en plus son grain de sel perturbateur.