SEO : désavouer des liens
Parmi ses outils pour webmasters, Google propose depuis quelques mois un outil de désaveu de liens. J’ai déjà eu l’occasion de m’en servir sans que je constate de chute du ranking pour mes sites. C’est peut-être même le contraire qui s’est produit sans que je puisse le vérifier précisément. L’idée sous-tendue par le désaveu de liens serait la suivante. Si, par inadvertance, vous êtes embarqué sur des sites pénalisés, le risque que vous soyez pénalisé ne serait pas négligeable. Cela reste à vérifier, sachant que je n’ai pas vraiment envie de jouer sur un terrain aussi sensible. Et puis, je n’ai pas que ça à faire ! ;+)
Filtrer les referers à partir de Awstats
Grâce aux expressions régulières, j’ai filtré au plus fin (???) les liens qui me semblaient de mauvaise qualité en me basant sur quelques expressions et surtout sur les suffixes des noms de domaine. J’ai bien conscience que tout ceci soit parfaitement arbitraire ! Dans mon filtre, j’ai entré l’expression suivante :
(porn|sex|\.(am|as|at|bg|br|bz|cl|cn|cz|ee|fi|gd|gg|hr|ht|hu|il|im|in|ir|kg|kr|la|lc|lv|ma|md|ms|mu|mx|nu|pl|re|ro|rs|ru|sa|sg|sk|st|su|th|tk|to|tr|tw|ua|uz|vn|ws|za)(/|$))
Tout en posant aussitôt un filtre d’exclusion :
((yoolink|board|webmail|search|forum|awstats|piwik|rss|feed|reader|yandex)|((\.(blogspot|mail|google))|(/(eurofiles|p|t|paper|bit|lo|eo|news|images|translate|hl))\.)|(\.(lan|COM|no|gl|li|ly|co|nl|pro|tel|fm|edu|au|biz|dk|it|es|uk|jp|se|tv|us|ca|io|eu|me|com|net|fr|be|ch|de|org|info|mobi|lan|corp)(#|:|/|$)))
Gnumeric et Gedit à la rescousse
Après avoir copié/collé les listes obtenus dans le tableur Gnumeric, j’ai collé le contenu de la 1ère colonne dans Gedit. Le logiciel Gedit est, de mon point de vue, l’un des meilleurs éditeurs. Il est disponible sous Windows, même s’il s’agit d’une version quelque peu ancienne.
Là, j’ai remplacé http://www. par domain:, http:// par domain:, puis le / par \n. Après avoir pris soin de trier en éliminant les doublons, je n’ai conservé que les lignes préfixées par domain:. Après sauvegarde, c’est ce fichier que j’ai envoyé à partir de la page de désaveu des liens proposée par Google. Au total, j’ai identifié 1737 noms de domaine à partir de septembre 2010 pour le site Voie Militante.
Vous pouvez télécharger à partir de ce lien le fichier pour le site Dsfc.net, qui contient quant à lui 1995 liens désavoués.
Source : désavouer des liens