Nos conseils pour lutter efficacement contre le duplicate content
Voir son site web être pénalisé à cause du duplicate content, voilà une crainte partagée par tous les créateurs de contenu
Découvrez dans cet article nos conseils pour vous prévenir de ce phénomène.
Le duplicate content, qu’est-ce que c’est ?
Le duplicate content, ou contenu dupliqué en français, désigne des contenus identiques sur des sites internet différents. De ce fait, lorsqu’un simple paragraphe est repris tel quel sur une autre URL, on parle de contenu dupliqué. En plus de faire perdre la crédibilité et à la légitimité des pages, la duplication de contenu nuit au référencement des sites internet, car les moteurs de recherche peuvent les sanctionner.
Comment expliquer le phénomène du duplicate content ?
La duplication de contenus peut être involontaire, mais il arrive qu’elle ait été réalisée intentionnellement. Selon le site SEO Raven, le duplicate content représente environ 29 % du contenu présent sur internet. Plusieurs raisons peuvent expliquer ce phénomène :
- Le contenu dupliqué suite à une erreur du webmaster,
- Le contenu dupliqué à cause d’une erreur technique sur les paramétrages du CMS (Content Management System),
- Le contenu dupliqué dans un annuaire ou lors d’une mauvaise stratégie de netlinking,
- Le contenu plagié volontairement pour nuire à la visibilité du site internet.
Duplicate content et référencement
Lorsque les robots de Google détectent une duplication de contenu, ils doivent trancher sur la page web qui est un meilleur résultat afin d’offrir une meilleure expérience aux utilisateurs :
- Lorsque deux pages internet sont identiques, c’est celle qui possède le meilleur PageRank qui va être mise en avant, au détriment de la seconde.
- Lorsque deux pages sont similaires, sauf au niveau des balises Title et Description, seule la page considérée comme étant l’originale par Google sera visible dans les résultats du moteur de recherche (SERP).
- Lorsque deux pages sont différentes, avec des balises Title et Description identiques, Google peut choisir de ne pas indexer les pages dupliquées.
Les conséquences du duplicate content
Si votre site est victime de duplication de contenu, il est important de réagir rapidement, au risque de perdre son bon positionnement dans les résultats de recherche. Cela aura pour conséquence de vous faire perdre du trafic SEO, car vos pages web seront de moins en moins visibles, et ce, malgré la qualité de votre optimisation SEO. Une seule solution vous permet de sortir de cette situation : détecter et stopper la copie de contenu.
Les outils mis en place pour lutter contre le duplicate content
Il existe plusieurs outils qui vous permettent d’obtenir un état des lieux de votre site web. Certains d’entre eux sont gratuits :
- SiteLiner vous permet de scanner votre site afin de repérer les contenus copiés. Cet outil possède également des indicateurs qui vous permettent de connaître les liens internes et externes présents sur votre site. La version gratuite de SiteLiner peut scanner jusqu’à 250 pages.
- Duplichecker est capable de vérifier si le contenu que vous venez d’écrire est 100 % original. Il le compare à d’autres textes d’après son taux de similitude avec eux. Il est possible d’effectuer ce contrôle avant même que votre texte ne soit mis en ligne.
- MozBar s’assure du bon fonctionnement de votre site web. Il vérifie également les redirection et balise canonique.
- Google Search Console vous offre un rapport sur la présence de contenus dupliqués sur votre site.
Comment repérer la copie de contenu sans outil ?
Vous l’aurez compris, la majorité des duplications de contenu sont involontaires. Vous pouvez vérifier en toute simplicité si votre site internet n’en possède pas :
- Écrivez votre URL avec HTTP et HTTPS pour vous assurer que vous êtes dirigé vers la version sécurisée de votre site,
- Écrivez votre URL avec et sans www. Cela vous permet de découvrir s’il existe une variante dupliquée.
Si une version de votre site a été indexée involontairement, il est possible de résoudre cette erreur grâce au fichier robot.txt ou avec les plugins de maintenance. Sur WordPress, il vous suffit de demander à ne pas indexer le site en allant dans Réglages > Lecture. WordPress fait d’ailleurs partie des CMS qui génèrent des pages considérées comme du duplicate content par les moteurs de recherche, à commencer par Google.
Comment mettre un terme au duplicate content ?
Dans le cadre du plagiat involontaire de textes interne à un site web, il est possible de résoudre ce problème grâce à :
- La redirection 301 vers la page originale,
- La balise canonique rel=canonical,
- Les paramètres SEO du CMS comme Yoast SEO sur WordPress.
Bonjour, je suis Nathalie, responsable des publications du blog Content Rank. Sur le blog, vous trouverez différents articles sur la thématique du marketing digital pour vous aidez à comprendre ce domaine technique.