Le jour où j’ai changé mon fichier robots.txt !

Très important sur le plan SEO et du référencement naturel, le fichier robots.txt est censé donner des consignes aux moteurs de recherche quant à l’exploration des sites.

Article L 342.1 du code de la propriété française

La loi française et tout particulièrement l’article L 342.1 du code de la propriété intellectuelle nous permettent de préciser notre volonté quant à la reproduction et la diffusion des articles de nos blogs !

J’ai, pour ma part, ajouté à mon fichier robots.txt :

Conformément à l’article L 342.1 du code de la propriété intellectuelle, nous interdisons l’extraction, à des fins de diffusion et de republication d’articles complets de ce site, exception faite de la Wayback Machine. Ce droit doit faire l’objet d’un licence préalable.

Le risque de pénalité SEO pour Duplicate Content

En dehors de se faire piller par des personnes ou des entreprises peu scrupuleuses, le souci est, en terme SEO et de référencement naturel, d’éviter un risque de pénalité pour Duplicate Content ! Nos articles sont des productions originales. Nous entendons qu’ils le restent.

Bloquer le vol de nos contenus par Google

J’ai, pour ma part, ajouté aux fichiers de configuration Apache (vous pouvez utiliser le fichier .htaccess à cette fin) la directive suivante :

Header set X-Robots-Tag "index,follow,noarchive"

Vous pouvez aussi ajouter à vos pages Web :

<meta name="robots" content="index,follow,noarchive" />
<meta name="googlebot" content="noarchive" />

Elle empêche Google de proposer l’accès à vos contenus par la fonctionnalité de mise en cache, sans que les internautes se rendent sur votre site ! Vous pouvez vérifier que cette fonction est désactivée sur mon site en cliquant sur ce lien.

Le jour où j'ai changé mon fichier robots.txt !

 

Juridique / , , , ,