Page d'accueil du blog      Flux RSS du blog Adifco Flux RSS      Suivez notre page sur Facebook Adifco sur Facebook      Suiviez nous sur Twitter Adifco sur Twitter      http://www.wikio.fr

Archive pour mars 2010

Effets de la géolocalisation du serveur sur le référencement naturel

Mercredi 31 mars 2010

La situation géographique d’un serveur d’hébergement, est importante pour le référencement naturel des sites qu’il héberge. Dans cette vidéo, Matt Cutts nous confirme cette information, et nous glisse quelques conseils supplémentaires (vidéo en anglais, voir notre transcription un peu plus bas).

Question: Pourriez-vous nous confirmer si l’emplacement physique du serveur est un critère significatif pour le référencement ?

Réponse: Oui, bien sur car nous vérifions l’adresse IP du serveur. Si celui-ci se trouve en Allemagne, nous penserons que le contenu du site est plus intéressant pour les utilisateurs allemands. Mais on ne va pas se limiter à ce pays, on va inclure ce site dans les pages de résultats d’autres pays.
Nous allons aussi examiner les TLD, s’il s’agit d’un .fr ou d’un .de
Vous pouvez aussi spécifier dans les Webmaster Tools que vous souhaitez que votre domaine, quel que soit son TLD ( un .com par exemple), appartient à un pays en particulier. C’est très intéressant d’utiliser cet outil car vous pouvez attacher des parties concrètes du site à différents pays.
Si vous trouvez une offre d’hébergement intéressante dans un pays, vous pouvez l’utiliser sans problème. Mais je vous conseille cependant de changer l’emplacement géographique du serveur (changer d’I.P.) car cela peut être utile pour certains pays.

Critères de crawl et d’indexation d’une page par Google (partie 2)

Mardi 30 mars 2010

Suite de notre article…

Le contenu dupliqué est également un facteur important pour le crawl et l’indexation des pages d’un site Internet. En effet, si au cours d’un crawl, le robot de Google détecte que plusieurs pages ont un contenu trop similaire, seule l’une de ces pages sera indexée et crawlée par la suite. Les autres pages sont purement écartées et ignorées.
Le « duplicate content » peut engendrer un double problème. Le crawl de pages similaires consomme de la bande passante. Si en plus, celle-ci est limitée (voir notre article précédent sur le sujet), des pages à forte valeur ajoutée risquent de ne pas être crawlées en raison de la limitation du « crédit crawl » du site.

Si le « duplicate content » ne peut pas être résolu directement en modifiant le contenu, Google recommande d’utiliser une redirection 301 de toutes les pages concernées vers une unique page qui regrouperait l’ensemble du contenu similaire. Ceci nous semble assez surprenant. Bien que la redirection 301 permette de pallier le contenu dupliqué tout en transmettant le jus de liens des pages redirigées, cela ne nous semble guère faisable pour les sites e-commerces proposant de nombreuses variantes d’un même produit. L’utilisation de l’attribut rel= »canonical » nous semble plus judicieuse dans ce cas.

Les identifiants de session sont également un élément pouvant limiter le crawl des pages de façon significative.  En plus d’être inesthétique pour l’utilisateur (il faut toujours penser également à vos visiteurs), l’usage des ID de sessions dans les URL complique la tâche des robots des moteurs de recherche : multiplication de pages totalement similaires (à chaque passage du robot, l’ID de session, donc l’URL, sera différent pour la même page) mais aussi consommation inutile de bande passante et du  « crédit craw » du site.
Google propose un outil très pratique pour gérer les paramètres d’URL et ainsi permettre de dire à GoogleBot de ne pas tenir compte de certains paramètres. L’utilisation de cet outil, dans Google Webmaster Tools > Configuration du site > Paramètres > Traitement des paramètres, permet donc très facilement d’ignorer les identifiants de session et d’améliorer ainsi de façon très significative le crawl des sites utilisant des ID de session.
Malgré tout, Google recommande quand même de ne pas utiliser les ID de session dans les URL, car le risque de contenu dupliqué reste fort.

Le cas particulier des affiliations peut également être un gros problème pour l’indexation en fonction des éléments mis à disposition. Bien souvent, les affilieurs mettent un contenu identique à la disposition de leurs affiliés, par différentes méthodes. Généralement ce sont les iframes qui sont employés. Bien qu’ils permettent une indexation d’un contenu externe comme étant celui de la page, l’utilisation d’iframes, comporte un très fort risque de contenu dupliqué. Le contenu dupliqué ayant les conséquences que nous avons développées au début de cet article.
Le co-branding n’offre pas une meilleure solution. En effet, dans ce cas très peu de choses changent (un logo, une accroche) et le contenu est d’autant plus identique. Cependant, Google aurait la capacité de reconnaître ce type d’affiliation et de regrouper les contenus dupliqués en un seul.

La suite, bientôt…

Critères de crawl et d’indexation d’une page par Google (partie 1)

Lundi 29 mars 2010

Qui ne se pose pas souvent la question : mais pourquoi Google n’indexe pas toutes les pages de mon site ?

A cette question, il peut avoir plusieurs réponses que nous allons essayer de traiter ici. Nous ne parlerons pas des classiques comme les meta robots ou le fichier « robots.txt ». Ces éléments ne sont déjà que trop traités sur le Web et généralement très bien connus et maîtrisés.

Beaucoup pensent que le nombre de pages crawlées par Google sur un site est fixé à l’avance et quand le nombre est atteint, le robot passe au site suivant. Ceci est bien évidemment faux. C’est peut-être vrai pour des robots peu évolués, mais les robots de principaux moteurs de recherche ont leurs propres critères décisionnels pour savoir ce qu’ils vont crawler et indexer.
L’un des principaux paramètres qui va déterminer le nombre de pages de votre site qui vont être crawlé par Google est le PageRank. Il n’est plus à démontrer qu’un backlink vers votre page d’accueil en provenance d’une page à fort Pagerank en permettra le crawl et l’indexation par Google en quelques minutes. Votre page d’accueil fait elle-même un lien vers plusieurs pages de premier niveau qui seront elles-mêmes crawlées. Plus les liens seront profonds, plus le Pagerank redistribué sera faible et moins ces pages auront tendance à être crawlées. Il faut également, en plus de PageRank de la page, parler de l’aspect concurrentiel d’une page. Plus une page aura des pages similaires dont le PageRank est supérieur, moins cette page sera crawlée fréquemment. De fait, une page sans PageRank ne sera donc jamais ou très rarement crawlée par Google.
On peut donc en conclure qu’il est très important d’avir des backlinks sur toutes les pages de son site. Revenons à notre sujet.

Un autre paramètre essentiel et qui peut paraître surprenant, c’est la bande passante disponible sur votre hébergement. La bande passante détermine le nombre de connexions simultanées possible à un serveur. Si votre site se trouve sur un serveur avec une IP qui héberge de très nombreux sites, le nombre de crawl possibles sur cette IP sera théoriquement déterminé par la bande passante disponible. Si seulement quelques pages d’un site peuvent être crawlées à un moment donné, les autres pages seront alors ignorées et il faudra attendre un autre passage du robot pour que ces pages soient elles aussi crawlées, si la bande passante le permet …

Nous avons mis en avant jusqu’ici deux critères : le PageRank de chaque page et la bande passante disponible sur le serveur d’hébergement. L’impact de l’hébergement n’est pas négligeable et même un site très populaire, avec de forts PageRank pour de nombreuses pages, pourrait être fortement pénalisé et termes de crawl et d’indexation, par un hébergement de mauvaise qualité ou sur lequel il y aurait trop de sites qui se partagent le même serveur.

Dans le prochain article consacré au sujet, nous parlerons de l’influence du contenu dupliqué sur le crawl de Googlebot. La suite, bientôt …

Patrick.

Google Bookmarks

Jeudi 25 mars 2010

Google a remodelé l’application « Bookmarks« .
bookmarks-Google
Pour ceux qui ne connaissent pas cet énième produit Google, il s’agit d’un système de marque-pages enregistrés en ligne, ce qui a l’avantage qu’ils sont disponibles depuis n’importe quel poste (au travail, à la maison, …) sans avoir besoin de les synchroniser.
Il ne s’agit pas d’une initiative originale, car il existent d’autres services du même type dont l’excellent del.ici.ous (qui a été racheté par Yahoo!). Peut-être en s’inspirant de ce dernier, Google Bookmarks propose maintenant la création de listes de marque-pages que vous pouvez partager avec vos amis.
Pour vous en servir vous n’avez besoin que d’un compte Google, et vous pourrez commencer à marquer des pages en cliquant sur l’étoile de la Google Toolbar ou en l’ajoutant directement dans le site de Google Bookmarks. Il est intéressant d’utiliser les « Labels » (tags) car il s’agit d’un système de classement très puissant et flexible. Pour plus d’informations rendez-vous ici.

Le référencement des sites en plusieurs langues

Mercredi 24 mars 2010

Les référencement des sites en plusieurs langues a toujours donné lieu à des nombreuses discutions. Quelle est la structure la mieux adaptée au référencement ?

Un article récent de Xavier deMorales sur Google Webmaster Central traite du sujet.

Un site multilingue est un site qui regroupe plusieurs langues pour un même nom de domaine. Par exemple, un site qui proposerait des pages en Anglais et en Français. Un site multilingue a bien évidemment tout son sens quand il s’adresse à des internautes utilisant les langues qu’il propose.
Google tente de déterminer de façon automatisée la langue de chacune des pages de votre site. Pour cela, le robot va se baser sur les contenu éditorial de la page. Comme l’importance de connaitre la langue d’une page n’est plus a démonter pour le référencement, Google recommande donc de ne pas utiliser plus d’une seule langue par page.

Ce qu’il ne faut pas faire :

  • Utiliser plus d’une langue par page.
  • Utiliser trop de mots anglophones sur une page en Français.
  • Ne pas mettre le même texte en deux (ou plus) langues sur une même page.
  • Utiliser une langue différente pour les différents éléments de la page (header, menu, contenu, etc.)

Il faut également garder à l’esprit que Google ne tient absolument pas compte des informations de langage données dans le Doctype, le DTD ou alors l’attribut « lang » de certaines balises du header de la page pour déterminer la langue d’une page. Google explique ce choix par le fait que de nombreux logiciels d’édition de code créés ces éléments de façon automatisé et qu’ils ne sont pas fiables car non représentatifs du contenu réel de la page.

Pour la structure du site en lui-même, Google déclare qu’aucune structure particulière n’est nécessaire. Cependant, même si cela n’apporte rien au référencement, cela peut être utile de conserver une certaine logique pour les internautes eux-mêmes.

Par exemple :

  • http://www.domain.tld/fr/page1.html
  • http://fr.domain.tld/page2.html
  • http://www.domain.tld/en/page1.html
  • http://en.domain.tld/page2.html

Permettra à l’internaute de savoir dans quelle section de langue il se trouve sur le site, contrairement à :

  • http://www.domain.tld/page1.html
  • http://www.domain.tld/page2.html

Pour une bonne indexation des pages, il est recommandé de ne pas utiliser un outil automatisé de traduction. Pourquoi ? Tout simplement car ce genre d’outils ne fait qu’un travail approximatif et n’oublions pas que les pages sont d’abord destinées à être lues par des internautes, et ensuite une traduction automatisée à la volée peut engendrer des contenus légèrement différents à chaque passage du robot et que cela pourrait-être considéré comme du spam (et non pas comme comme une mise à jour du contenu …)
Il est conseillé de faire des liens page-à-page de contenu identique mais dans des langues différentes. Ceci renforcera et améliorera l’indexation globale du site tout en permettant de faire savoir à GoogleBot que le site est en plusieurs langues dont qu’il est susceptible d’intéresser des internautes dans plusieurs régions. (Pour mémoire, Google considère une région non pas uniquement géographiquement mais aussi de part la langue utilisée dans la région).

L’utilisation de redirection automatique en fonction de la langue du navigateur n’est pas une bonne idée. En effet, si vous redirigez vos visiteurs en fonction de la langue, vous prenez le risque de voir qu’une partie de vos pages indexées. De plus, un internaute anglophone consultant un site multilingue sur le navigateur de son ami Français ne pourra pas accéder facilement à la version anglaise du site et sera donc pénalisé.
Enfin, et c’est certainement aussi un point très important, utilisez toujours des URL différentes pour les différentes versions de langue de vos pages. N’utilisez jamais un cookies pour sélectionner la version de langue d’une page et si vous utilisez un paramètre dans l’URL pour déterminer la langue, pensez à faire de la réécriture d’URL. Par exemple :

Déconseillé, langue en paramètre :

  • http://www.domain.tld/index.php?langue=fr
  • http://www.domain.tld/index.php?langue=en

Conseillé, URL réécrite :

  • http://www.domain.tld/index-fr.html
  • http://www.domain.tld/index-en.html

Pour conclure, la mise en œuvre d’un site multilingue est très simple et demande juste un peu de rigueur. En appliquant ces conseils, l’ensemble de vos pages seront indexées par les moteurs de recherche, tout en étant agréable à consulter par vos internautes. Que demander de plus ?

Changements dans le PageRank Sculpting

Mardi 23 mars 2010

Depuis cet été Google a (probablement) changé la façon dont il gérait le PageRank Sculpting. Ce système est employé depuis 2007 pour « promouvoir » certaines pages d’un site par rapport à celles qui sont moins intéressantes. Search Engine Land a fait référence des changements dans cet article.

Le PageRank Sculpting c’est quoi?

Chaque page web possède une popularité (appelée également « jus » ou « jus de lien ») qu’elle peut distribuer aux autres pages par le moyen des liens. Le PageRank Sculpting est une façon de réguler la distribution de ce jus.

PageRank-Sculpting

Prenons un exemple très simple : imaginons qu’on a une bouteille d’un litre d’un excellent cru de Bourgogne. Si l’on dispose de 5 verres, on peut distribuer 20cl par verre. Si l’on bloque la distribution à l’un des verres, on pourra alors verser 25cl a chacun des autres verres. Pour mettre en œuvre le PageRank Sculpting, on peut bloquer la distribution avec l’attribut nofollow de la balise « a », et avec les liens en JavaScript.

Le signal de départ pour le PageRank Sculpting fut donné par Matt Cutts lors d’une discussion en 2007 lorsqu’il a dévoilé comment YouTube utilisait le PageRank Sculpting.

Après quelques années où le PageRank Sculpting fût longuement mis en œuvre, questionné et critiqué, on a appris cet été qu’il n’était plus utile. Lors du SMX Advanced Matt Cutts (à nouveau) a dit que le Sculpting ne sert plus à donner de l’importance aux pages non bloquées. En gros, si l’on fait un nofollow sur un lien, les autres liens ne verront pas augmenter proportionnellement leur importance.

PageRank-Sculpting maintenant

Bien qu’il a annoncé cela comme ça, au moment où il a été questionné à propos de l’usage correct de l’attribut nofollow, il a répondu que « … pour bloquer les pages qui ne sont pas intéressantes comme par exemple une page d’inscription. Googlebot n’est pas intéressé par ce type de page, alors pourquoi utiliser du PageRank avec elles ? ». Matt reconnait implicitement que même si le PageRank Sculpting n’est plus possible, le PageRank est quelque chose qui peut être « épargné » et « dépensé » sur d’autres pages.

En conclusion, la possibilité de faire du Sculpting semble finie. Au moins avec les attributs nofollow. Mais que-est-il des liens en JavaScript? On le verra demain?

Joomla ou WordPress pour le référencement?

Lundi 22 mars 2010

Si l’un des thèmes récurrents entre les développeurs, est le choix du langage (pensez au nombre de forums avec des discussions du style « java vs ruby vs php vs python… »), un autre thème controversé est le choix d’un CMS open source pour les développeurs PHP. On a pas de données à propos de leur popularité, mais on peut dire que WordPress et Joomla semblent être les plus populaires. Comment choisir entre les deux en ayant le référencement comme priorité?

Le blog d’Hobo a fait  un article très court (Joomla or WordPress for SEO) qui essaie de répondre à cette question. On en tire les conclusions suivantes :
- Tous les deux permettent de faire des sites optimisés pour le SEO.
- Joomla est à priori mieux organisé pour les projets plus vastes.
- WordPress reste néanmoins plus simple à mettre en œuvre.
- A moins d’avoir beaucoup de compétences avec Joomla, l’optimisation SEO de ce CMS peut vous donner quelques maux de tête.
- Etant en principe plus complet et complexe, utiliser Joomla peut revenir plus cher, car le temps passé à le configurer et l’adapter à vos besoins, sera forcement plus long.

Voilà, la réponse n’a rien à voir avec le référencement (tous les deux sont capables de donner de bons résultats), mais la différence ce fait plutôt du coté de la mise en œuvre. Vous avez des bonnes connaissances en Joomla et la taille du projet justifie son utilisation? Allez-y avec Joomla. Vous voulez de la  simplicité et une mise en œuvre rapide ? Utilisez WordPress.


Société ADIFCO

Méthodologie, Références, Partenaires, Revendeurs, F.A.Q, Outils gratuits

Services

Création de site, Analyse de trafic, Webmarketing, Conseil, Formations

Blog

 
Copyright © 2012 - ADIFCO sarl. Reproduction interdite.