Tout propriétaire d’un site internet, qui s’intéresse un tant soit peu au SEO, sait qu’un contenu dupliqué, qu’il soit intentionnel ou non, pénalise son référencement.

Mais une question, simple au demeurant, est souvent source de désaccord : « Est-ce qu’un contenu traduit est-il considéré, par Google, comme du Duplicate Content ? »  

La réponse est, en fait, un peu plus complexe qu’il n’y parait.

Après avoir défini ce qu’est le contenu dupliqué, nous verrons ses conséquences négatives et les moyens pour le résoudre.
Enfin, il sera bon de savoir si la traduction de contenu web peut faire cas de Duplicate Content.

Sommaire

Qu'est-ce que le Duplicate Content ?

Contenu dupliqué
Contenu dupliqué SEO - Duplicate Content SEO

Le contenu dupliqué est défini par Google, comme ceci :

 Par contenu en double, on entend généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires.

En clair, le contenu dupliqué, ou en anglais Duplicate Content, est un contenu textuel qui apparaît plusieurs fois sur Internet sous des URLs différentes, et a deux origines :

  1. Interne.
  2. Externe.

1. Le contenu dupliqué interne

Le contenu dupliqué interne, comme son nom l’indique, est un contenu textuel dupliqué à l’intérieur d’un même site WordPress ou autre CMS (Shopify, Wix, Prestashop, etc).

La duplication de contenu interne est soit intentionnelle, soit causée par une mauvaise optimisation SEO.

Intentionnel

Le contenu dupliqué interne intentionnel peut être dû à des :

  • Blocs de textes identiques ou similaires se trouvant sur deux ou plusieurs pages.
  • Pages très ou trop similaires (cela est souvent le cas sur des sites E-Commerce ou certaines fiches produits ne diffèrent, par exemple, que par la couleur ou la taille). 

Mauvaise optimisation SEO

Le contenu en double interne causé par une mauvaise optimisation SEO, souvent rencontré dans mes audits SEO, est couramment dû à des :

  • Mauvais paramétrages d’URLs (identifiants de session, suivi de clics, avec ou sans slash de fin).
  • Différentes versions du site (HTTP et HTTPS ou avec WWW et sans WWW).
  • Versions imprimables du contenu.
  • Versions PDF (Portable Document Format).
  • Absence de signalement des versions localisées.
  • Doublons des balises Méta (Title, meta-description, H1). 
  • Utilisation des étiquettes (tags, mots-clés) WordPress. 

2. Le contenu dupliqué externe

Le contenu dupliqué externe, est, quant à lui, un contenu éditorial identique qui se trouve sur plusieurs sites web.

Cela survient, souvent, quand les propriétaires de sites de commerce électronique (WooCommerce, etc), qui par faute de temps ou de moyens financiers, recopient intégralement les fiches produits (descriptif et caractéristiques techniques) fournies par le fabricant ou leur fournisseur.

La duplication de contenu externe arrive, aussi, lorsqu’un propriétaire d’un site e-commerce avec des fiches produits au contenu unique, met en vente ses produits sur Amazon et recopie sur la marketplace ses descriptifs originaux.  

Enfin, le contenu en double externe peut, malheureusement aussi, arriver lorsqu’une personne pille tout ou partie d’un contenu sur un site concurrent pour le mettre sur son propre site web.

Dans le monde du SEO (Search Engine Optimization), on appelle cela du scraping de contenu. 

Si le contenu copié est original, le terme juridique de ce plagiat est la contrefaçon selon les articles L335-2 et suivants du Code de la propriété intellectuelle (CPI), et est punie de trois ans d’emprisonnement et de 300 000 euros d’amende.

Au regard de l’article L112-2 du CPI, un site internet, sous réserve de son originalité, est en lui-même une œuvre protégée par le droit d’auteur.

Quelles sont les conséquences négatives du Duplicate Content ?

Outre les sanctions juridiques pour contrefaçon, le Duplicate Content est problématique pour les moteurs de recherches, mais aussi pour le propriétaire du site internet. 

1. Pour les moteurs de recherche

Le contenu dupliqué qu’il soit interne ou externe cause deux problèmes aux moteurs de recherche (Google, Bing, Ecosia, Qwant, DuckDuckGo, etc) :

  • Incapacité de décider quel contenu inclure (ou exclure) dans leurs index.
  • Difficulté à classer le contenu dans leurs pages de résultats naturels de recherche (SERP).

2. Pour les propriétaires de sites web

Google, voulant devenir un véritable moteur de réponses et non plus un moteur de recherche parmi tant d’autres, va éviter, autant que possible, d’afficher des contenus identiques au sein d’une même SERP (Search Engine Result Page).

En cas de contenus dupliqués non-intentionnels, une pénalité Google ne vous sera pas infligée, mais le moteur de recherche choisira, à sa discrétion, lequel est original, qualitatif, et, en conséquence, qui mérite un bon positionnement dans ses premiers résultats organiques, et lequel il positionnera sur sa deuxième page et suivantes, synonyme de quasi-invisibilité. 

Les critères de choix, que prend en compte, Google sont principalement :

  • La date d’indexation.
  • L’autorité du site (définit par son PageRank).

En outre, une autre conséquence du Duplicate Content est une dilution de liens, en ce sens que les domaines référents devront également choisir à quel contenu ils souhaitent faire leurs backlinks.
Cela est dommageable, car les liens entrants sont un important facteur de classement pour Google, donc de visibilité.

À noter que le moteur de recherche peut retirer votre site définitivement de son index, (synonyme de sa disparation immédiate dans la SERP), s’il constate, via son filtre algorithmique Google Panda, que le contenu dupliqué est créé uniquement pour manipuler son classement.

Moins de visibilité, moins de trafic, moins de ventes !

Comment résoudre le problème du Duplicate content ?

Solutions pour remédier au Duplicate Content
Solutions pour remédier au Duplicate Content

La solution optimale pour éviter le problème du Duplicate Content est de créer un contenu original, unique et qualitatif en le personnalisant au maximum (ton, style, mise en page) pour qu’il reflète au mieux l’identité de la marque tout en répondant exactement à l‘intention de recherche de l’internaute.

À défaut, si le contenu dupliqué est interne, il faudra utiliser des :

  • Redirections permanentes (redirection 301).
  • Balises canoniques (rel=canonical).
  • Balises Meta robots (noindex).
  • Balises hreflang (à utiliser également quand le contenu éditorial est publié dans plusieurs pays différents, mais dont la langue est identique, à l’exception de quelques variantes régionales (exemple : France, Belgique, Suisse)).

Si le contenu dupliqué est externe, il faudra :

  • Envoyer une lettre au propriétaire du site en demandant de retirer le contenu indûment copié ou, au pire, qu’il fasse un backlink en dofollow vers votre site.
  • Signaler le contenu dupliqué à Google pour violation des droits d’auteur, si votre lettre précédente est restée sans réponse (malheureusement, cela est très souvent le cas).
  • Envoyer une lettre de mise en demeure, par l’intermédiaire d’un avocat, pour faire appliquer les articles de lois précités.

Le contenu traduit est-il du Duplicate Content ?

Contenu traduit
Contenu traduit - Traduction de contenu

Maintenant que l’on sait, qu’au niveau SEO, le contenu en double est à éviter, une question pertinente revient souvent, et est source de discordance :  « Est-ce que le contenu traduit est considéré, par Google, comme du Duplicate Content ? »

John Mueller, Senior Webmaster Trends Analyst chez Google, a (re)confirmé le 28 mai 2021 que :

Un contenu traduit n’est pas du contenu en double.
Le contenu traduit est un contenu unique.
Ce sont des mots différents, des lettres différentes sur la page, c’est donc un contenu différent.

Dont acte !

Toutefois, il a apporté, à cette occasion, une nuance selon la méthode de traduction utilisée.

  • Si le contenu traduit a été écrit manuellement par un professionnel de la traduction (traducteur, agence de traduction), la traduction sera, obligatoirement, d’une excellente qualité et comprise aisément par tout un chacun.
    Donc il n’y a, dans ce cas, aucun risque de contenu dupliqué, ni d’action manuelle.

  • Si le contenu traduit a été obtenu via, d’une part, l’utilisation d’un outil de traduction automatique en ligne, tel que Google Translate, et, d’autre part, d’un travail de relecture effectué par un rédacteur web bilingue ou une personne de langue maternelle par exemple, alors la traduction sera de bonne qualité et compréhensible par tous.
    Donc il n’y a, non plus, en l’espèce, aucun risque de duplicate content, ni d’action manuelle.

  • Si le contenu traduit a été obtenu uniquement via l’utilisation de Google Traduction ou autre traducteur automatique en ligne, sans relecture et correction éventuelle postérieure, la traduction sera logiquement de qualité inférieure (on peut le constater, très souvent, sur les traductions des sous-titrages sur YouTube où la sémantique laisse vraiment à désirer).
    Donc il n’y a, non plus, en l’espèce, aucun risque de duplication de contenu, ni d’action manuelle.
    La conséquence sera plutôt une mauvaise expérience utilisateur, et donc que l’internaute quittera très rapidement le site internet.

  • Si la quasi-intégralité du contenu d’un site internet a été générée via l’utilisation d’un traducteur automatique gratuit en ligne, sans relecture et correction postérieure, alors il y a un très grand risque que Google inflige, à son égard, une pénalité manuelle pour spam.
    Cette action manuelle, synonyme d’invisibilité temporaire, sera signalée dans la Search Console.

Conclusion

Le contenu traduit n’est pas considéré par Google comme duplicate content.
Mais malgré, d’une part, la qualité actuelle de Google Translate et consorts, et, d’autre part, les progrès exponentiels de l’intelligence artificielle (Google MUM en est un très bon exemple), pour réussir une bonne stratégie de contenu, évitez les simples copier-traduire-coller, car rien ne remplacera l’humain pour garantir une traduction de contenu web de la plus grande qualité.

Si vous avez aimé cet article sur le contenu traduit est-il synonyme de Duplicate Content ?, laissez-moi un petit commentaire.

Laisser un commentaire