Page d'accueil du blog      Flux RSS du blog Adifco Flux RSS      Suivez notre page sur Facebook Adifco sur Facebook      Suiviez nous sur Twitter Adifco sur Twitter      http://www.wikio.fr

Archive pour mars 2010

Effets de la géolocalisation du serveur sur le référencement naturel

Mercredi 31 mars 2010

La situation géographique d’un serveur d’hébergement, est importante pour le référencement naturel des sites qu’il héberge. Dans cette vidéo, Matt Cutts nous confirme cette information, et nous glisse quelques conseils supplémentaires (vidéo en anglais, voir notre transcription un peu plus bas).

Question: Pourriez-vous nous confirmer si l’emplacement physique du serveur est un critère significatif pour le référencement ?

Réponse: Oui, bien sur car nous vérifions l’adresse IP du serveur. Si celui-ci se trouve en Allemagne, nous penserons que le contenu du site est plus intéressant pour les utilisateurs allemands. Mais on ne va pas se limiter à ce pays, on va inclure ce site dans les pages de résultats d’autres pays.
Nous allons aussi examiner les TLD, s’il s’agit d’un .fr ou d’un .de
Vous pouvez aussi spécifier dans les Webmaster Tools que vous souhaitez que votre domaine, quel que soit son TLD ( un .com par exemple), appartient à un pays en particulier. C’est très intéressant d’utiliser cet outil car vous pouvez attacher des parties concrètes du site à différents pays.
Si vous trouvez une offre d’hébergement intéressante dans un pays, vous pouvez l’utiliser sans problème. Mais je vous conseille cependant de changer l’emplacement géographique du serveur (changer d’I.P.) car cela peut être utile pour certains pays.

Critères de crawl et d’indexation d’une page par Google (partie 2)

Mardi 30 mars 2010

Suite de notre article…

Le contenu dupliqué est également un facteur important pour le crawl et l’indexation des pages d’un site Internet. En effet, si au cours d’un crawl, le robot de Google détecte que plusieurs pages ont un contenu trop similaire, seule l’une de ces pages sera indexée et crawlée par la suite. Les autres pages sont purement écartées et ignorées.
Le « duplicate content » peut engendrer un double problème. Le crawl de pages similaires consomme de la bande passante. Si en plus, celle-ci est limitée (voir notre article précédent sur le sujet), des pages à forte valeur ajoutée risquent de ne pas être crawlées en raison de la limitation du « crédit crawl » du site.

Si le « duplicate content » ne peut pas être résolu directement en modifiant le contenu, Google recommande d’utiliser une redirection 301 de toutes les pages concernées vers une unique page qui regrouperait l’ensemble du contenu similaire. Ceci nous semble assez surprenant. Bien que la redirection 301 permette de pallier le contenu dupliqué tout en transmettant le jus de liens des pages redirigées, cela ne nous semble guère faisable pour les sites e-commerces proposant de nombreuses variantes d’un même produit. L’utilisation de l’attribut rel= »canonical » nous semble plus judicieuse dans ce cas.

Les identifiants de session sont également un élément pouvant limiter le crawl des pages de façon significative.  En plus d’être inesthétique pour l’utilisateur (il faut toujours penser également à vos visiteurs), l’usage des ID de sessions dans les URL complique la tâche des robots des moteurs de recherche : multiplication de pages totalement similaires (à chaque passage du robot, l’ID de session, donc l’URL, sera différent pour la même page) mais aussi consommation inutile de bande passante et du  « crédit craw » du site.
Google propose un outil très pratique pour gérer les paramètres d’URL et ainsi permettre de dire à GoogleBot de ne pas tenir compte de certains paramètres. L’utilisation de cet outil, dans Google Webmaster Tools > Configuration du site > Paramètres > Traitement des paramètres, permet donc très facilement d’ignorer les identifiants de session et d’améliorer ainsi de façon très significative le crawl des sites utilisant des ID de session.
Malgré tout, Google recommande quand même de ne pas utiliser les ID de session dans les URL, car le risque de contenu dupliqué reste fort.

Le cas particulier des affiliations peut également être un gros problème pour l’indexation en fonction des éléments mis à disposition. Bien souvent, les affilieurs mettent un contenu identique à la disposition de leurs affiliés, par différentes méthodes. Généralement ce sont les iframes qui sont employés. Bien qu’ils permettent une indexation d’un contenu externe comme étant celui de la page, l’utilisation d’iframes, comporte un très fort risque de contenu dupliqué. Le contenu dupliqué ayant les conséquences que nous avons développées au début de cet article.
Le co-branding n’offre pas une meilleure solution. En effet, dans ce cas très peu de choses changent (un logo, une accroche) et le contenu est d’autant plus identique. Cependant, Google aurait la capacité de reconnaître ce type d’affiliation et de regrouper les contenus dupliqués en un seul.

La suite, bientôt…

Critères de crawl et d’indexation d’une page par Google (partie 1)

Lundi 29 mars 2010

Qui ne se pose pas souvent la question : mais pourquoi Google n’indexe pas toutes les pages de mon site ?

A cette question, il peut avoir plusieurs réponses que nous allons essayer de traiter ici. Nous ne parlerons pas des classiques comme les meta robots ou le fichier « robots.txt ». Ces éléments ne sont déjà que trop traités sur le Web et généralement très bien connus et maîtrisés.

Beaucoup pensent que le nombre de pages crawlées par Google sur un site est fixé à l’avance et quand le nombre est atteint, le robot passe au site suivant. Ceci est bien évidemment faux. C’est peut-être vrai pour des robots peu évolués, mais les robots de principaux moteurs de recherche ont leurs propres critères décisionnels pour savoir ce qu’ils vont crawler et indexer.
L’un des principaux paramètres qui va déterminer le nombre de pages de votre site qui vont être crawlé par Google est le PageRank. Il n’est plus à démontrer qu’un backlink vers votre page d’accueil en provenance d’une page à fort Pagerank en permettra le crawl et l’indexation par Google en quelques minutes. Votre page d’accueil fait elle-même un lien vers plusieurs pages de premier niveau qui seront elles-mêmes crawlées. Plus les liens seront profonds, plus le Pagerank redistribué sera faible et moins ces pages auront tendance à être crawlées. Il faut également, en plus de PageRank de la page, parler de l’aspect concurrentiel d’une page. Plus une page aura des pages similaires dont le PageRank est supérieur, moins cette page sera crawlée fréquemment. De fait, une page sans PageRank ne sera donc jamais ou très rarement crawlée par Google.
On peut donc en conclure qu’il est très important d’avir des backlinks sur toutes les pages de son site. Revenons à notre sujet.

Un autre paramètre essentiel et qui peut paraître surprenant, c’est la bande passante disponible sur votre hébergement. La bande passante détermine le nombre de connexions simultanées possible à un serveur. Si votre site se trouve sur un serveur avec une IP qui héberge de très nombreux sites, le nombre de crawl possibles sur cette IP sera théoriquement déterminé par la bande passante disponible. Si seulement quelques pages d’un site peuvent être crawlées à un moment donné, les autres pages seront alors ignorées et il faudra attendre un autre passage du robot pour que ces pages soient elles aussi crawlées, si la bande passante le permet …

Nous avons mis en avant jusqu’ici deux critères : le PageRank de chaque page et la bande passante disponible sur le serveur d’hébergement. L’impact de l’hébergement n’est pas négligeable et même un site très populaire, avec de forts PageRank pour de nombreuses pages, pourrait être fortement pénalisé et termes de crawl et d’indexation, par un hébergement de mauvaise qualité ou sur lequel il y aurait trop de sites qui se partagent le même serveur.

Dans le prochain article consacré au sujet, nous parlerons de l’influence du contenu dupliqué sur le crawl de Googlebot. La suite, bientôt …

Patrick.

Google Bookmarks

Jeudi 25 mars 2010

Google a remodelé l’application « Bookmarks« .
bookmarks-Google
Pour ceux qui ne connaissent pas cet énième produit Google, il s’agit d’un système de marque-pages enregistrés en ligne, ce qui a l’avantage qu’ils sont disponibles depuis n’importe quel poste (au travail, à la maison, …) sans avoir besoin de les synchroniser.
Il ne s’agit pas d’une initiative originale, car il existent d’autres services du même type dont l’excellent del.ici.ous (qui a été racheté par Yahoo!). Peut-être en s’inspirant de ce dernier, Google Bookmarks propose maintenant la création de listes de marque-pages que vous pouvez partager avec vos amis.
Pour vous en servir vous n’avez besoin que d’un compte Google, et vous pourrez commencer à marquer des pages en cliquant sur l’étoile de la Google Toolbar ou en l’ajoutant directement dans le site de Google Bookmarks. Il est intéressant d’utiliser les « Labels » (tags) car il s’agit d’un système de classement très puissant et flexible. Pour plus d’informations rendez-vous ici.

Le référencement des sites en plusieurs langues

Mercredi 24 mars 2010

Les référencement des sites en plusieurs langues a toujours donné lieu à des nombreuses discutions. Quelle est la structure la mieux adaptée au référencement ?

Un article récent de Xavier deMorales sur Google Webmaster Central traite du sujet.

Un site multilingue est un site qui regroupe plusieurs langues pour un même nom de domaine. Par exemple, un site qui proposerait des pages en Anglais et en Français. Un site multilingue a bien évidemment tout son sens quand il s’adresse à des internautes utilisant les langues qu’il propose.
Google tente de déterminer de façon automatisée la langue de chacune des pages de votre site. Pour cela, le robot va se baser sur les contenu éditorial de la page. Comme l’importance de connaitre la langue d’une page n’est plus a démonter pour le référencement, Google recommande donc de ne pas utiliser plus d’une seule langue par page.

Ce qu’il ne faut pas faire :

  • Utiliser plus d’une langue par page.
  • Utiliser trop de mots anglophones sur une page en Français.
  • Ne pas mettre le même texte en deux (ou plus) langues sur une même page.
  • Utiliser une langue différente pour les différents éléments de la page (header, menu, contenu, etc.)

Il faut également garder à l’esprit que Google ne tient absolument pas compte des informations de langage données dans le Doctype, le DTD ou alors l’attribut « lang » de certaines balises du header de la page pour déterminer la langue d’une page. Google explique ce choix par le fait que de nombreux logiciels d’édition de code créés ces éléments de façon automatisé et qu’ils ne sont pas fiables car non représentatifs du contenu réel de la page.

Pour la structure du site en lui-même, Google déclare qu’aucune structure particulière n’est nécessaire. Cependant, même si cela n’apporte rien au référencement, cela peut être utile de conserver une certaine logique pour les internautes eux-mêmes.

Par exemple :

  • http://www.domain.tld/fr/page1.html
  • http://fr.domain.tld/page2.html
  • http://www.domain.tld/en/page1.html
  • http://en.domain.tld/page2.html

Permettra à l’internaute de savoir dans quelle section de langue il se trouve sur le site, contrairement à :

  • http://www.domain.tld/page1.html
  • http://www.domain.tld/page2.html

Pour une bonne indexation des pages, il est recommandé de ne pas utiliser un outil automatisé de traduction. Pourquoi ? Tout simplement car ce genre d’outils ne fait qu’un travail approximatif et n’oublions pas que les pages sont d’abord destinées à être lues par des internautes, et ensuite une traduction automatisée à la volée peut engendrer des contenus légèrement différents à chaque passage du robot et que cela pourrait-être considéré comme du spam (et non pas comme comme une mise à jour du contenu …)
Il est conseillé de faire des liens page-à-page de contenu identique mais dans des langues différentes. Ceci renforcera et améliorera l’indexation globale du site tout en permettant de faire savoir à GoogleBot que le site est en plusieurs langues dont qu’il est susceptible d’intéresser des internautes dans plusieurs régions. (Pour mémoire, Google considère une région non pas uniquement géographiquement mais aussi de part la langue utilisée dans la région).

L’utilisation de redirection automatique en fonction de la langue du navigateur n’est pas une bonne idée. En effet, si vous redirigez vos visiteurs en fonction de la langue, vous prenez le risque de voir qu’une partie de vos pages indexées. De plus, un internaute anglophone consultant un site multilingue sur le navigateur de son ami Français ne pourra pas accéder facilement à la version anglaise du site et sera donc pénalisé.
Enfin, et c’est certainement aussi un point très important, utilisez toujours des URL différentes pour les différentes versions de langue de vos pages. N’utilisez jamais un cookies pour sélectionner la version de langue d’une page et si vous utilisez un paramètre dans l’URL pour déterminer la langue, pensez à faire de la réécriture d’URL. Par exemple :

Déconseillé, langue en paramètre :

  • http://www.domain.tld/index.php?langue=fr
  • http://www.domain.tld/index.php?langue=en

Conseillé, URL réécrite :

  • http://www.domain.tld/index-fr.html
  • http://www.domain.tld/index-en.html

Pour conclure, la mise en œuvre d’un site multilingue est très simple et demande juste un peu de rigueur. En appliquant ces conseils, l’ensemble de vos pages seront indexées par les moteurs de recherche, tout en étant agréable à consulter par vos internautes. Que demander de plus ?


Société ADIFCO

Méthodologie, Références, Partenaires, Revendeurs, F.A.Q, Outils gratuits

Services

Création de site, Analyse de trafic, Webmarketing, Conseil, Formations

Blog

Forfait référencement ?

Pourquoi choisir un forfait référencement (offre packagée) plutôt qu'un référencement sur mesure ?
Les offres packagées sont étudiées pour "coller" aux besoins du plus grand nombre de sites. De fait ces offres sont généralement bien moins chères que les prestations sur mesure. De plus, il est toujours possible d'adapter une offre packagées aux besoins spécifiques d'un site. En effet, elles ne sont pas figées.

A propos d'adifco

Copyright © ADIFCO ™ sarl 2003 - . Tous droits réservés.

ADIFCO, 14E rue Pierre de Coubertin, Parc de Mirande, 21000 DIJON - France - Téléphone : 03 80 65 30 22

ADIFCO, sarl au capital de 10 000 euros - SIREN 451 292 544 RCS Dijon - NAF 6201Z

Centre de formation au référencement ADIFCO : numéro d'agrément 26210233721

Référencement ADIFCO

Conditions générales de vente | Informations légales | Echange de liens | Référencement professionnel

contact