Page d'accueil du blog      Flux RSS du blog Adifco Flux RSS      Suivez notre page sur Facebook Adifco sur Facebook      Suiviez nous sur Twitter Adifco sur Twitter      http://www.wikio.fr

Archive pour la catégorie ‘Référencement’

Un sitemap pour vos images

Vendredi 9 avril 2010

Les sitemaps ne sont plus à présenter. Il est clairement admis qu’ils représentent une source importante d’informations pour les moteurs de recherche. Un sitemap permet de facilement mettre en avant un contenu important ainsi que de permettre aux robots de rapidement les crawler.
Suivant la thématique de votre site, les images peuvent représenter une part importante du contenu et il peut être bénéfique pour le référencement de votre site que les moteurs de recherche les indexent.
Généralement, peut-être par effet de mode, les sites présentent une miniature d’une image et un JavaScript permet d’afficher l’image. Cette technique est très souvent utilisée pour des albums de toute nature.

Il est maintenant possible d’utiliser un sitemap pour fournir l’ensemble de votre contenu « image » à Google. Pour chaque URL d’image, il est possible d’ajouter des informations complémentaires. De plus, il n’est pas nécessaire de créer un sitemap dédié à vos images, vous pouvez tout simplement ajouter vos images au sitemap de vos pages. Voyez l’exemple ci-dessous :


<?xml version= »1.0″ encoding= »UTF-8″?>
<urlset xmlns= »http://www.sitemaps.org/schemas/sitemap/0.9″
xmlns:image= »http://www.google.com/schemas/sitemap-image/1.1″>
<url>
<loc>http://example.com/sample.html</loc>
<image:image>
<image:loc>http://example.com/image.jpg</image:loc>
</image:image>
</url>
</urlset>

Balises du sitemap « image »

Balise Obligatoire Description
<image:image> Oui Délimite toutes les informations propres à une seule image. Chaque URL (balise <loc>) peut contenir jusqu’à 1000 balises <image:image>.
<image:loc> Oui L’URL de l’image.
<image:caption> Optionnel La légende de l’image.
<image:geo_location> Optionnel La localisation du contenu de l’image. Par exemple : <image:geo_location>Limerick</geo_location>.
<image:title> Optionnel Le titre de l’image.
<image:license> Optionnel L’URL vers la licence de l’image.

Prenez le temps de modifier votre sitemap, cela pourra être très utile pour le référencement de votre site.

Si vous désirez en savoir plus, vous pouvez vous rendre dans l’aide de Google Webmaster Tools (en anglais). Source de l’article.

Utiliser Facebook et Twitter pour améliorer le référencement de votre site

Mercredi 7 avril 2010

Le contenu que vous rédigez sur Facebook, Twitter ou un autre réseau vous est propre, il vous appartient. Ce contenu se trouve sur différents sites qui ne vous apportent rien pour le référencement de votre propre site.
Certes, ce contenu contribue à votre popularité sur la toile, à vous faire connaître, à développer votre réseau et c’est exactement ce que l’on demande à Facebook, Twitter et consort. Seulement voilà : le temps que vous passez à rédiger du contenu pour vos pages Facebook et vos Twits, vous ne le passez pas à mettre à jour le contenu des pages de votre site. De plus, le contenu des réseaux sociaux, même si vous pouvez le faire pointer vers vos pages ne vous apporte rien au niveau contenu et tous les effets bénéfiques de la longue traîne sont pour… les réseaux sociaux et pas votre site !
Le constat est clair : le contenu mis sur les réseaux sociaux n’est pas SEO friendly pour le référencement de votre site !

Il est donc nécessaire de trouver un moyen de vous réapproprier le contenu écrits sur les réseaux sociaux et de faire en sorte que ce contenu soit profitable à la mise à jour de votre site.
Il est possible de le faire en utilisant, par exemple, le flux RSS de vos Twitts ou le flux RSS de vos articles sur Facebook. Ok, bien c’est simple à faire, on récupère les flux, on les intègre dans une pages de notre site. Ne risque-t-on pas un problème de Duplicate Content ?
Non, si vous travaillez un peu le contenu des flux par une mise en forme, une mise en page et un mix des sources qui vous serait propre.

Une autre solution est d’utiliser les API mises à disposition des réseaux sociaux pour en récupérer le contenu. Vous pouvez ainsi choisir le contenu que vous allez afficher sur votre page dédiée « contenu réseaux » sur votre site, pouvoir en adapter facilement la mise en forme, mixer le contenu, etc. Vous n’imaginez pas tout ce que vous pouvez faire avec l’API Facebook !

Cela demande un peu de travail, mais maintenant, le contenu que vous passez de si longues heures à créer sur vos réseaux sociaux sera également bénéfique pour le référencement de votre site en proposant aux moteurs de recherche un contenu riche, diversifié et toujours actualisé. L’effet longue traîne est pour vous !

La question mérite diversité

Mardi 6 avril 2010

Derrière ce titre un peu bizarre (qui est en fait une traduction assez directe de « Query Deserves Diversity », QDD), se cache un petit algorithme qui nuance les SERPS (les pages des résultats).

Requête ambigüe

Sa raison d’être est de essayer de face à un terme un peu ambigu, essayer de donner une réponse aux différentes significations de la requête. L’exemple classique est celui d’une faute de frappe que le moteur tente de combler:

qdd-bing

Bing croit que je cherchais « Gateau York » et non pas « gateau yort » et il ajoute des résultats dans ce sens.
qdd-google
Google me propose par contre des résultats qui correspondent strictement à ma requête (gateau yort), mais aussi à celle qu’il croit que je voulais taper (gâteau yaourt).

Résultats complémentaires

Parfois les moteurs de recherche nous proposent de résultats qui ne correspondent pas exactement à notre requête, mais qu’ils estiment complémentaires. Ainsi une recherche sur le mot-clé « tourisme », nous donne une première page de résultats composée comme suit:

Position Page Backlinks de la page Backlinks du domaine
1 www.tourisme.fr/ 74 118 1 573 421
2 www.tourisme.gouv.fr/ 23 096 31 920
3 fr.wikipedia.org/wiki/Tourisme 995 322 545 306
4 www.francetourisme.fr/ 2 378 65 966
5 www.france-voyage.com/ 42 364 1 367 040
6 www.jedecouvrelafrance.com/ 8 406 191 488
7 www.parisinfo.com/ 56 256 2 907 165
8 www.franche-comte.org/ 3 850 1 685 697
9 www.tourisme-yonne.com/ 9 529 52 126
10 www.tourisme-midi-pyrenees.com/ 4 878 56 168

Les six premiers résultats sont des sites de tourisme généralistes, que Google positionne (entre autres!) en fonction du nombre de backlinks de la page et du domaine.
Mais on voit à partir de la septième place des résultats de tourisme dans certaines villes et régions (Paris, Franche comte, Yonne et Midi-Pyrénées). Ce n’était pas l’objet de ma requête, mais Google estime pertinent de me les présenter parce que peut-être je peux être intéressé par ces sites.

Il présente quand même ces suggestions en nombre réduit (4 dans mon exemple) et leur positionnement ne suit pas en principe les même règles que les 6 premiers: à la vue du nombre de backlinks de paris-info, on pourrait s’attendre de le voir mieux positionné.

Query Deserves Diversity

Alors, est-ce que le Query Deserves Diversity (ou QDD) existe et influence réellement les résultats affichés par les moteurs de recherche ? Faut-il en tenir compte dans une stratégie globale de référencement ?

Le principe du QDF (Query Deserves Freshness) est bien connu des référenceurs depuis plusieurs années et cela reste un fait admis que Google favorise temporairement la fraicheur d’un site dans ses résultats.
Plusieurs expérimentations ont été menées depuis 2008 pour essayer de savoir si Google pouvait adapter son algorithme de positionnement en fonction de l’ambiguïté de certaines requêtes. Mon avis personnel est que oui le QDF existe bien dans l’algorithme de Google et le QDF peut modifier le contenu des SERP de façon plus ou moins nette et à divers degrés.

J’aimerai poursuivre ce débat avec d’autres personnes et avoir votre avis sur la question, alors n’hésitez pas à commenter cet article.

Effets de la géolocalisation du serveur sur le référencement naturel

Mercredi 31 mars 2010

La situation géographique d’un serveur d’hébergement, est importante pour le référencement naturel des sites qu’il héberge. Dans cette vidéo, Matt Cutts nous confirme cette information, et nous glisse quelques conseils supplémentaires (vidéo en anglais, voir notre transcription un peu plus bas).

Question: Pourriez-vous nous confirmer si l’emplacement physique du serveur est un critère significatif pour le référencement ?

Réponse: Oui, bien sur car nous vérifions l’adresse IP du serveur. Si celui-ci se trouve en Allemagne, nous penserons que le contenu du site est plus intéressant pour les utilisateurs allemands. Mais on ne va pas se limiter à ce pays, on va inclure ce site dans les pages de résultats d’autres pays.
Nous allons aussi examiner les TLD, s’il s’agit d’un .fr ou d’un .de
Vous pouvez aussi spécifier dans les Webmaster Tools que vous souhaitez que votre domaine, quel que soit son TLD ( un .com par exemple), appartient à un pays en particulier. C’est très intéressant d’utiliser cet outil car vous pouvez attacher des parties concrètes du site à différents pays.
Si vous trouvez une offre d’hébergement intéressante dans un pays, vous pouvez l’utiliser sans problème. Mais je vous conseille cependant de changer l’emplacement géographique du serveur (changer d’I.P.) car cela peut être utile pour certains pays.

Critères de crawl et d’indexation d’une page par Google (partie 2)

Mardi 30 mars 2010

Suite de notre article…

Le contenu dupliqué est également un facteur important pour le crawl et l’indexation des pages d’un site Internet. En effet, si au cours d’un crawl, le robot de Google détecte que plusieurs pages ont un contenu trop similaire, seule l’une de ces pages sera indexée et crawlée par la suite. Les autres pages sont purement écartées et ignorées.
Le « duplicate content » peut engendrer un double problème. Le crawl de pages similaires consomme de la bande passante. Si en plus, celle-ci est limitée (voir notre article précédent sur le sujet), des pages à forte valeur ajoutée risquent de ne pas être crawlées en raison de la limitation du « crédit crawl » du site.

Si le « duplicate content » ne peut pas être résolu directement en modifiant le contenu, Google recommande d’utiliser une redirection 301 de toutes les pages concernées vers une unique page qui regrouperait l’ensemble du contenu similaire. Ceci nous semble assez surprenant. Bien que la redirection 301 permette de pallier le contenu dupliqué tout en transmettant le jus de liens des pages redirigées, cela ne nous semble guère faisable pour les sites e-commerces proposant de nombreuses variantes d’un même produit. L’utilisation de l’attribut rel= »canonical » nous semble plus judicieuse dans ce cas.

Les identifiants de session sont également un élément pouvant limiter le crawl des pages de façon significative.  En plus d’être inesthétique pour l’utilisateur (il faut toujours penser également à vos visiteurs), l’usage des ID de sessions dans les URL complique la tâche des robots des moteurs de recherche : multiplication de pages totalement similaires (à chaque passage du robot, l’ID de session, donc l’URL, sera différent pour la même page) mais aussi consommation inutile de bande passante et du  « crédit craw » du site.
Google propose un outil très pratique pour gérer les paramètres d’URL et ainsi permettre de dire à GoogleBot de ne pas tenir compte de certains paramètres. L’utilisation de cet outil, dans Google Webmaster Tools > Configuration du site > Paramètres > Traitement des paramètres, permet donc très facilement d’ignorer les identifiants de session et d’améliorer ainsi de façon très significative le crawl des sites utilisant des ID de session.
Malgré tout, Google recommande quand même de ne pas utiliser les ID de session dans les URL, car le risque de contenu dupliqué reste fort.

Le cas particulier des affiliations peut également être un gros problème pour l’indexation en fonction des éléments mis à disposition. Bien souvent, les affilieurs mettent un contenu identique à la disposition de leurs affiliés, par différentes méthodes. Généralement ce sont les iframes qui sont employés. Bien qu’ils permettent une indexation d’un contenu externe comme étant celui de la page, l’utilisation d’iframes, comporte un très fort risque de contenu dupliqué. Le contenu dupliqué ayant les conséquences que nous avons développées au début de cet article.
Le co-branding n’offre pas une meilleure solution. En effet, dans ce cas très peu de choses changent (un logo, une accroche) et le contenu est d’autant plus identique. Cependant, Google aurait la capacité de reconnaître ce type d’affiliation et de regrouper les contenus dupliqués en un seul.

La suite, bientôt…

Critères de crawl et d’indexation d’une page par Google (partie 1)

Lundi 29 mars 2010

Qui ne se pose pas souvent la question : mais pourquoi Google n’indexe pas toutes les pages de mon site ?

A cette question, il peut avoir plusieurs réponses que nous allons essayer de traiter ici. Nous ne parlerons pas des classiques comme les meta robots ou le fichier « robots.txt ». Ces éléments ne sont déjà que trop traités sur le Web et généralement très bien connus et maîtrisés.

Beaucoup pensent que le nombre de pages crawlées par Google sur un site est fixé à l’avance et quand le nombre est atteint, le robot passe au site suivant. Ceci est bien évidemment faux. C’est peut-être vrai pour des robots peu évolués, mais les robots de principaux moteurs de recherche ont leurs propres critères décisionnels pour savoir ce qu’ils vont crawler et indexer.
L’un des principaux paramètres qui va déterminer le nombre de pages de votre site qui vont être crawlé par Google est le PageRank. Il n’est plus à démontrer qu’un backlink vers votre page d’accueil en provenance d’une page à fort Pagerank en permettra le crawl et l’indexation par Google en quelques minutes. Votre page d’accueil fait elle-même un lien vers plusieurs pages de premier niveau qui seront elles-mêmes crawlées. Plus les liens seront profonds, plus le Pagerank redistribué sera faible et moins ces pages auront tendance à être crawlées. Il faut également, en plus de PageRank de la page, parler de l’aspect concurrentiel d’une page. Plus une page aura des pages similaires dont le PageRank est supérieur, moins cette page sera crawlée fréquemment. De fait, une page sans PageRank ne sera donc jamais ou très rarement crawlée par Google.
On peut donc en conclure qu’il est très important d’avir des backlinks sur toutes les pages de son site. Revenons à notre sujet.

Un autre paramètre essentiel et qui peut paraître surprenant, c’est la bande passante disponible sur votre hébergement. La bande passante détermine le nombre de connexions simultanées possible à un serveur. Si votre site se trouve sur un serveur avec une IP qui héberge de très nombreux sites, le nombre de crawl possibles sur cette IP sera théoriquement déterminé par la bande passante disponible. Si seulement quelques pages d’un site peuvent être crawlées à un moment donné, les autres pages seront alors ignorées et il faudra attendre un autre passage du robot pour que ces pages soient elles aussi crawlées, si la bande passante le permet …

Nous avons mis en avant jusqu’ici deux critères : le PageRank de chaque page et la bande passante disponible sur le serveur d’hébergement. L’impact de l’hébergement n’est pas négligeable et même un site très populaire, avec de forts PageRank pour de nombreuses pages, pourrait être fortement pénalisé et termes de crawl et d’indexation, par un hébergement de mauvaise qualité ou sur lequel il y aurait trop de sites qui se partagent le même serveur.

Dans le prochain article consacré au sujet, nous parlerons de l’influence du contenu dupliqué sur le crawl de Googlebot. La suite, bientôt …

Patrick.

Le référencement des sites en plusieurs langues

Mercredi 24 mars 2010

Les référencement des sites en plusieurs langues a toujours donné lieu à des nombreuses discutions. Quelle est la structure la mieux adaptée au référencement ?

Un article récent de Xavier deMorales sur Google Webmaster Central traite du sujet.

Un site multilingue est un site qui regroupe plusieurs langues pour un même nom de domaine. Par exemple, un site qui proposerait des pages en Anglais et en Français. Un site multilingue a bien évidemment tout son sens quand il s’adresse à des internautes utilisant les langues qu’il propose.
Google tente de déterminer de façon automatisée la langue de chacune des pages de votre site. Pour cela, le robot va se baser sur les contenu éditorial de la page. Comme l’importance de connaitre la langue d’une page n’est plus a démonter pour le référencement, Google recommande donc de ne pas utiliser plus d’une seule langue par page.

Ce qu’il ne faut pas faire :

  • Utiliser plus d’une langue par page.
  • Utiliser trop de mots anglophones sur une page en Français.
  • Ne pas mettre le même texte en deux (ou plus) langues sur une même page.
  • Utiliser une langue différente pour les différents éléments de la page (header, menu, contenu, etc.)

Il faut également garder à l’esprit que Google ne tient absolument pas compte des informations de langage données dans le Doctype, le DTD ou alors l’attribut « lang » de certaines balises du header de la page pour déterminer la langue d’une page. Google explique ce choix par le fait que de nombreux logiciels d’édition de code créés ces éléments de façon automatisé et qu’ils ne sont pas fiables car non représentatifs du contenu réel de la page.

Pour la structure du site en lui-même, Google déclare qu’aucune structure particulière n’est nécessaire. Cependant, même si cela n’apporte rien au référencement, cela peut être utile de conserver une certaine logique pour les internautes eux-mêmes.

Par exemple :

  • http://www.domain.tld/fr/page1.html
  • http://fr.domain.tld/page2.html
  • http://www.domain.tld/en/page1.html
  • http://en.domain.tld/page2.html

Permettra à l’internaute de savoir dans quelle section de langue il se trouve sur le site, contrairement à :

  • http://www.domain.tld/page1.html
  • http://www.domain.tld/page2.html

Pour une bonne indexation des pages, il est recommandé de ne pas utiliser un outil automatisé de traduction. Pourquoi ? Tout simplement car ce genre d’outils ne fait qu’un travail approximatif et n’oublions pas que les pages sont d’abord destinées à être lues par des internautes, et ensuite une traduction automatisée à la volée peut engendrer des contenus légèrement différents à chaque passage du robot et que cela pourrait-être considéré comme du spam (et non pas comme comme une mise à jour du contenu …)
Il est conseillé de faire des liens page-à-page de contenu identique mais dans des langues différentes. Ceci renforcera et améliorera l’indexation globale du site tout en permettant de faire savoir à GoogleBot que le site est en plusieurs langues dont qu’il est susceptible d’intéresser des internautes dans plusieurs régions. (Pour mémoire, Google considère une région non pas uniquement géographiquement mais aussi de part la langue utilisée dans la région).

L’utilisation de redirection automatique en fonction de la langue du navigateur n’est pas une bonne idée. En effet, si vous redirigez vos visiteurs en fonction de la langue, vous prenez le risque de voir qu’une partie de vos pages indexées. De plus, un internaute anglophone consultant un site multilingue sur le navigateur de son ami Français ne pourra pas accéder facilement à la version anglaise du site et sera donc pénalisé.
Enfin, et c’est certainement aussi un point très important, utilisez toujours des URL différentes pour les différentes versions de langue de vos pages. N’utilisez jamais un cookies pour sélectionner la version de langue d’une page et si vous utilisez un paramètre dans l’URL pour déterminer la langue, pensez à faire de la réécriture d’URL. Par exemple :

Déconseillé, langue en paramètre :

  • http://www.domain.tld/index.php?langue=fr
  • http://www.domain.tld/index.php?langue=en

Conseillé, URL réécrite :

  • http://www.domain.tld/index-fr.html
  • http://www.domain.tld/index-en.html

Pour conclure, la mise en œuvre d’un site multilingue est très simple et demande juste un peu de rigueur. En appliquant ces conseils, l’ensemble de vos pages seront indexées par les moteurs de recherche, tout en étant agréable à consulter par vos internautes. Que demander de plus ?


Société ADIFCO

Méthodologie, Références, Partenaires, Revendeurs, F.A.Q, Outils gratuits

Services

Création de site, Analyse de trafic, Webmarketing, Conseil, Formations

Blog

 
Copyright © 2012 - ADIFCO sarl. Reproduction interdite.