Le référencement des sites en plusieurs langues

Les référencement des sites en plusieurs langues a toujours donné lieu à des nombreuses discutions. Quelle est la structure la mieux adaptée au référencement ?

Un article récent de Xavier deMorales sur Google Webmaster Central traite du sujet.

Un site multilingue est un site qui regroupe plusieurs langues pour un même nom de domaine. Par exemple, un site qui proposerait des pages en Anglais et en Français. Un site multilingue a bien évidemment tout son sens quand il s’adresse à des internautes utilisant les langues qu’il propose.
Google tente de déterminer de façon automatisée la langue de chacune des pages de votre site. Pour cela, le robot va se baser sur les contenu éditorial de la page. Comme l’importance de connaitre la langue d’une page n’est plus a démonter pour le référencement, Google recommande donc de ne pas utiliser plus d’une seule langue par page.

Ce qu’il ne faut pas faire :

  • Utiliser plus d’une langue par page.
  • Utiliser trop de mots anglophones sur une page en Français.
  • Ne pas mettre le même texte en deux (ou plus) langues sur une même page.
  • Utiliser une langue différente pour les différents éléments de la page (header, menu, contenu, etc.)

Il faut également garder à l’esprit que Google ne tient absolument pas compte des informations de langage données dans le Doctype, le DTD ou alors l’attribut “lang” de certaines balises du header de la page pour déterminer la langue d’une page. Google explique ce choix par le fait que de nombreux logiciels d’édition de code créés ces éléments de façon automatisé et qu’ils ne sont pas fiables car non représentatifs du contenu réel de la page.

Pour la structure du site en lui-même, Google déclare qu’aucune structure particulière n’est nécessaire. Cependant, même si cela n’apporte rien au référencement, cela peut être utile de conserver une certaine logique pour les internautes eux-mêmes.

Par exemple :

  • http://www.domain.tld/fr/page1.html
  • http://fr.domain.tld/page2.html
  • http://www.domain.tld/en/page1.html
  • http://en.domain.tld/page2.html

Permettra à l’internaute de savoir dans quelle section de langue il se trouve sur le site, contrairement à :

  • http://www.domain.tld/page1.html
  • http://www.domain.tld/page2.html

Pour une bonne indexation des pages, il est recommandé de ne pas utiliser un outil automatisé de traduction. Pourquoi ? Tout simplement car ce genre d’outils ne fait qu’un travail approximatif et n’oublions pas que les pages sont d’abord destinées à être lues par des internautes, et ensuite une traduction automatisée à la volée peut engendrer des contenus légèrement différents à chaque passage du robot et que cela pourrait-être considéré comme du spam (et non pas comme comme une mise à jour du contenu …)
Il est conseillé de faire des liens page-à-page de contenu identique mais dans des langues différentes. Ceci renforcera et améliorera l’indexation globale du site tout en permettant de faire savoir à GoogleBot que le site est en plusieurs langues dont qu’il est susceptible d’intéresser des internautes dans plusieurs régions. (Pour mémoire, Google considère une région non pas uniquement géographiquement mais aussi de part la langue utilisée dans la région).

L’utilisation de redirection automatique en fonction de la langue du navigateur n’est pas une bonne idée. En effet, si vous redirigez vos visiteurs en fonction de la langue, vous prenez le risque de voir qu’une partie de vos pages indexées. De plus, un internaute anglophone consultant un site multilingue sur le navigateur de son ami Français ne pourra pas accéder facilement à la version anglaise du site et sera donc pénalisé.
Enfin, et c’est certainement aussi un point très important, utilisez toujours des URL différentes pour les différentes versions de langue de vos pages. N’utilisez jamais un cookies pour sélectionner la version de langue d’une page et si vous utilisez un paramètre dans l’URL pour déterminer la langue, pensez à faire de la réécriture d’URL. Par exemple :

Déconseillé, langue en paramètre :

  • http://www.domain.tld/index.php?langue=fr
  • http://www.domain.tld/index.php?langue=en

Conseillé, URL réécrite :

  • http://www.domain.tld/index-fr.html
  • http://www.domain.tld/index-en.html

Pour conclure, la mise en œuvre d’un site multilingue est très simple et demande juste un peu de rigueur. En appliquant ces conseils, l’ensemble de vos pages seront indexées par les moteurs de recherche, tout en étant agréable à consulter par vos internautes. Que demander de plus ?

Laissez nous un commentaire ou posez votre question

Current day month ye@r *