Duplicate content : qu’est-ce que c’est ?
Le duplicate content (ou contenu dupliqué) est la crainte de nombreux créateurs de contenus web
Apprenez-en plus sur ce phénomène et comment l’éviter grâce à notre article. Découvrez d’autres définitions SEO sur notre blog dédié à la rédaction web et SEO.
Le duplicate content, qu’est-ce que c’est ?
En français, duplicate content signifie contenu dupliqué. Il renvoie à la reproduction à l’identique, ou presque, du contenu d’une page web ailleurs sur internet. En plus d’être particulièrement frustrant pour le rédacteur, ce phénomène constitue un véritable problème pour le site internet au niveau de son référencement. En effet, les moteurs de recherche comme Google traquent les pages touchées par le duplicate content si bien que le site victime de plagiat se retrouve pénalisé. Selon certaines estimations, le duplicate content représente près de 29 % du contenu web.
Comment fonctionne le duplicate content ?
Une page web est concernée par le duplicate content dès que le contenu textuel d’un paragraphe est repris sur une autre URL, qu’il ait été légèrement modifié ou non. Il existe deux catégories de duplicate content :
- Le contenu dupliqué interne à un site internet, lorsque des pages sont dupliquées sur des URLs différents. Cela peut s’expliquer par une erreur du webmaster ou lorsqu’il existe plusieurs version du site internet (desktop et mobile). Ce problème est récurrent pour les e-boutiques avec les fiches produits.
- Le contenu dupliqué externe, sur d’autres sites web. Plusieurs raisons peuvent expliquer le duplicate content : le plagiat, une redistribution du flux RSS ou une description similaire d’un contenu presque identique. Si cette copie peut être le fruit du hasard, elle est malheureusement intentionnelle la plupart du temps.
L’impact du duplicate content sur le référencement d’une page sur les moteurs de recherche
Bien souvent, la duplication d’un contenu n’empêche pas l’indexation des sites internet par les moteurs de recherche. À titre d’exemple, Google ne surclasse pas les pages concernées par le duplicate content. Elles perdent ainsi des positions dans les SERP, au risque d’être retirées des résultats de recherche. Par ailleurs, si le PageRank du contenu dupliqué par le voleur est meilleur que celui de la page initiale, celle-ci peut être lésée. Il existe trois cas de figure :
- Lorsque deux pages web sont exactement pareilles, c’est celle qui a le PageRank le plus fort qui est indexé,
- Lorsque deux pages web sont similaires, à l’exception de leurs balises Title et Description, toutes les pages sont indexées. Seules celles qui sont considérées comme des copies ne seront visibles dans les résultats de recherche qu’en cliquant sur « relancer la recherche en incluant les pages ignorées »,
- Lorsque deux pages web sont différentes, mais que les balises Title et Description sont identiques, les robots de Google peuvent ne pas indexer les pages qui sont considérées comme dupliquées.
Des outils pour détecter le duplicate content ?
Vous l’aurez compris, la duplication de contenu peut être lourde de conséquences. En effet, elle nuit à la visibilité de votre site malgré votre optimisation SEO. Dès que son indexation dans les résultats des moteurs de recherche tels que Google est touchée, vous perdez du trafic SEO. Pour autant, plusieurs outils existent pour lutter contre le contenu dupliqué :
- SiteLiner : scanner votre site web pour prendre connaissance des contenus en double et obtenir un état des lieux de votre maillage interne et externe,
- Duplichecker : vérifier si votre article est bien l’original à partir du taux de similitude de votre sujet par rapport aux autres articles sur le même thème,
- Mozbar : vérifier les redirections et les balises canoniques de votre site web.
Vous pouvez également taper votre URL en http dans la barre de recherche pour vérifier que vous êtes dirigé vers la version sécurisée de votre site.
Comment résoudre un problème de duplication de contenu ?
Votre objectif est de montrer aux moteurs de recherche que votre site contient le contenu original de vos pages. Deux techniques existent pour la duplication interne :
- La redirection 301 : rediriger la page dupliquée vers l’originale,
- La balise rel=canonical : indiquer aux moteurs de recherche que la page est une copie
En cas de duplication externe, vous pouvez tenter de contacter le webmaster du site et d’envoyer un rapport de spam à Google.
Bonjour, je suis Nathalie, responsable des publications du blog Content Rank. Sur le blog, vous trouverez différents articles sur la thématique du marketing digital pour vous aidez à comprendre ce domaine technique.