
Avant d’avoir à regretter de ne pas vous être penché sur le plagiat de vos contenus, mieux vaut maitriser les aléas du contenu dupliqué. Pour enrichir votre site et y ajouter des informations, pas la peine d’imaginer copier du contenu déjà existant sur internet pour vous faciliter la tâche : Google sait détecter le contenu dupliqué, donc n’essayez même pas…Quels sont les problèmes liés au contenu dupliqué, comment évaluer les risques et trouver des solutions ?
Vous avez en tête d’améliorer votre référencement et pour cela vous devez être attentif à avoir sur les pages de votre site un contenu unique mais aussi contrôler que votre contenu n’a pas été copié.
Un contenu dupliqué ? Kesako ?
Un contenu est considéré comme dupliqué quand il est identique plusieurs fois sur Internet. Il ne s’agit pas seulement de mots ou phrases isolées, mais lorsque le contenu copie un extrait relativement important d’un autre site ou du même site. La tolérance est placée à environ 40% de textes identiques mais la prudence impose de se situer bien en dessous de ce pourcentage.
L’url, l’unité de mesure
L’unité de mesure pour Google c’est l’url. Vous devez analyser le contenu dupliqué en comparant une url à une autre. Si un caractère change dans l’url, c’est donc pour Google un autre contenu.
Le contenu dupliqué interne à votre site
Le contenu dupliqué peut-être dans vos pages si vous avez 2 url différentes avec du contenu identique. Google fera un choix entre les 2 pages : une page sera donc indexée. Il est donc préférable de créer un contenu unique dans votre site.
Vérifiez aussi d’un point de vue technique que votre CMS ne génère pas de contenu dupliqué. Tous les CMS sont, en général, réglables et ils permettent de bloquer certaines parties. Il faut absolument étudier tous les cas de figure pour éviter le contenu dupliqué.
Ainsi, par exemple, si vous proposez trois programmes de formation qui vont se dérouler sur le même lieu mais sur chaque page vous allez ajouter des objectifs identiques, des publics similaires. Vous créez par cette répétition une difficulté majeure pour le référencement de vos pages. Il vous faudra être attentif à ces détails qui vous paraissent sans importance et demander des conseils pour éviter toute sanction de la part de Google.
Le contenu dupliqué externe à votre site
Il peut tout simplement venir du fait d’avoir .com et .fr. Du coup, vos propres sites se battent en duel. Quand une personne copie et colle votre contenu. Et encore plus bêtement, vous envoyez vos fiches produits, par exemple, Rue du Commerce. Dans ce dernier cas de figure, vous devez donner un contenu différent et appauvri.
Certains sites e-commerce concurrents possèdent de nombreuses pages quasi identiques, en raison du « descriptif issu du fabricant ou du fournisseur ». Si chaque concurrent reproduit le même descriptif ; ils feront la même erreur et proposeront un contenu identique.
Comment fonctionne Google ?
Il accorde en général sa préférence au site le plus populaire ou au contenu le plus ancien. Ce contenu qu’il identifie comme original est dit « contenu canonique ». Les autres sont alors considérés comme des contenus dupliqués.
Pourquoi Google a mis en place ce système ?
Pour Google, sa première source de coût c’est d’envoyer tous les jours ses robots, cela lui coûte en infrastructure, machine, homme… La façon de la réduire, c’est d’envoyer le crawler sur les pages qui méritent d’être crawler souvent. Quand vous rentrez dans le filtre du contenu dupliqué, le robot décide donc d’envoyer de moins en moins souvent sur vos pages. Le plus important, c’est d’analyser le comportement de Google Bot grâce aux logs. Attention pour analyser le log, il faut avoir des outils spécifiques comme :
Kill Duplicate
Kill Duplicate est un outil qui détecte les pages plagiant votre site et contacte les propriétaires des sites copieurs. Si votre négociation s’avère impossible, une option permet de contacter l’Hébergeur qui pourra prendre des mesures contre ce plagiat.
La MOZ bar
La MOZ bar est un plugin pour moteur de recherche qui permet d’identifier les balises title, meta description mais aussi les urls canoniques utilisées sur les pages que vous visitez.
Et puis vous pouvez aussi étudier les avantages et inconvénients des outils suivants pour mieux contrôler vos contenus :
- Grammarly
- Scribbr
- PlagScan
- CopyScape
- Copyleaks
- Plagiarism Checker X
- Quetext
Alors, prenez le temps de créer du contenu unique et ne copiez jamais des textes des sites extérieurs pour vous faciliter la tâche.