Qu’appelle ton du contenu dupliqué ?
L’impact du contenu dupliqué en SEO
Le contenu dupliqué est un problème récurrent dans le domaine du référencement naturel
En effet, les sites web qui possèdent des doublons risquent d’être pénalisés par les moteurs de recherche. Découvrons ensemble ce phénomène, ses dangers et les solutions qui existent pour s’en débarrasser grâce à ce guide.
Définition du contenu dupliqué
Le contenu dupliqué, ou duplicate content, est un contenu identique ou très semblable qui est présent sur plusieurs URL. Ce contenu peut ainsi être présent à plusieurs endroits sur plusieurs pages d’un site internet ou sur un site différent. Google définit lui-même le duplicate content comme « des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires ».
Les multiples origines du contenu dupliqué
La duplication de contenu peut être interne à un site, sur des pages aux URL différentes et externe, avec d’autres sites qui reprennent le contenu à l’identique. Bien souvent, le duplicate content est involontaire puisqu’il est issu d’une erreur. Toutefois, il arrive qu’il soit fait dans l’intention de nuire à la notoriété d’un site et il révèle ainsi être du plagiat.
Le contenu dupliqué interne
Le contenu dupliqué interne à un même site internet est généralement la conséquence d’une erreur humaine ou technique. À titre d’exemple, le duplicate content peut être causé par un problème de paramètres de votre CMS (Content Management System) ou suite à un bug de version du site. Les sites internet les plus touchés sont les e-commerces à cause de leurs fiches produits qui peuvent être très proches (notamment lorsque le produit est identique et que seule la taille change).
Le duplicate content interne est moins pénalisé par Google que la duplication de contenu externe. Toutefois, elle risque de rendre l’exploration et l’indexation difficile, aussi bien pour les internautes que pour les moteurs de recherche. Il est donc important de garder à l’esprit ce schéma : 1 page web = 1 URL = 1 contenu unique.
Le contenu dupliqué externe
Le contenu dupliqué externe peut être issu d’une simple erreur, mais il peut également être volontaire. En effet, si vous reprenez le contenu d’un de vos fournisseurs, cela est considéré comme du plagiat. Ses conséquences ne sont pas à sous-estimer puisqu’une personne coupable de plagiat encourt des sanctions juridiques pour violation des droits d’auteur.
De son côté, Google se montre impartial puisque le duplicate content peut entraîner la désindexation d’une page web dupliquée. Elle ne sera alors plus visible dans les pages de résultats des moteurs de recherche si bien que sa visibilité auprès des internautes sera nulle.
Dans les cas les plus graves, la duplication de contenu est faite intentionnellement pour nuire à un site concurrent. C’est ce qu’on appelle le Negative SEO. L’auteur du plagiat se revendique ensuite comme l’auteur original du contenu, ce qui peut avoir des conséquences graves pour le site victime.
Les conséquences du contenu dupliqué
Vous l’aurez compris, la duplication de contenu peut être lourde de conséquences, notamment si elle est reconnue comme volontaire.
L’impact SEO du duplicate content
Le problème du duplicate content est étudié depuis plusieurs années par Google. En effet, en 2011, le moteur de recherche a lancé Google Panda. Il s’agit d’un algorithme qui étudie la qualité du contenu des pages web. Grâce à lui, Google est capable de repérer les sites qui ne respectent pas les différentes règles instaurées par le moteur de recherche et il peut même les pénaliser.
Par ailleurs, le contenu dupliqué aura pour conséquence de brouiller les robots de crawl de Google. Pour rappel, l’objectif d’un crawler est d’analyser les pages et les liens d’un site web afin de pouvoir l’indexer correctement dans les SERP. En cas de pages dupliquées, un crawl risque de ne pas analyser toutes les pages de votre site, au risque de lui donner un mauvais positionnement dans le classement d’une SERP.
L’impact du contenu dupliqué sur l’expérience utilisateur
Lorsqu’un internaute s’aperçoit qu’une page est dupliquée, il risque de quitter le site web en question en ayant une image négative de lui. Il risque ainsi d’aller vers d’autres sites concurrents à cause de la mauvaise image qu’il aura de lui. En effet, le contenu dupliqué peut nuire à la réputation et à l’image d’un site. Celui-ci perd ainsi en crédibilité auprès des internautes et risque même d’avoir une mauvaise réputation.
Les meilleurs outils pour lutter contre les contenus dupliqués
Quel que soit l’âge de votre site, il peut être concerné par la copie de contenu. Il est donc important de connaître les recours possibles afin de ne pas pénaliser votre classement SEO ou votre crédibilité auprès de votre audience.
Faites des vérifications régulières de votre site web
Le meilleur outil à votre disposition est la prévention ! Examinez régulièrement votre site pour vous assurer que vos textes sont toujours uniques. Pour cela, plusieurs outils sont disponibles pour explorer vos URLs, à la recherche de duplication de contenu :
- Siteliner,
- Copyscape
- Screaming Frog,
- Oncrawl,
- KillDuplicate.
L’utilisation de la balise canonique
La balise canonique vous permet d’indiquer aux moteurs de recherche qu’une page est très similaire à une autre en indiquant l’URL de celle-ci. Les robots de crawl seront ainsi capables d’indexer les bonnes pages sans que les autres ne soient considérées comme dupliquées. Votre référencement naturel ne sera donc pas impacté. Cette balise est particulièrement utile pour les fiches produits des sites d’e-commerce.
La mise en place de la redirection 301
Si plusieurs pages d’un site possèdent des contenus identiques, la redirection 301 permet de rediriger automatiquement celles-ci vers la page principale. Le crawler saura ainsi quelle est la bonne page à indexer. Il est toutefois à noter que la redirection 301 entraîne la suppression d’une page de l’index de Google. Cela signifie qu’elle sera invisible auprès des internautes. Cette technique doit donc être utilisée avec parcimonie, dans le cadre de la suppression de pages spécifiques ou de produits. En-dehors de ces deux cas de figure, la balise canonique et la création de textes uniques sont recommandés.