Page d'accueil du blog      Flux RSS du blog Adifco Flux RSS      Suivez notre page sur Facebook Adifco sur Facebook      Suiviez nous sur Twitter Adifco sur Twitter      http://www.wikio.fr

Archive pour janvier 2010

Mais combien de pages connaisent les moteurs de mon site?

Jeudi 28 janvier 2010

En voilà une question. Il y a plusieurs façons de essayer de répondre. Pour illustrer les exemples on va donner les résultats réels de d’un petit site Internet :

Commande « site: »

Si l’on tape sur la barre de recherche de Google ou de Yahoo!, la commande « site:monsite.fr », ces moteurs auront la gentillesse de nous donner une chiffre correspondant au nombre total de pages qu’ils ont indexées sur notre site. Problème: si l’on refait la requête au bout de quelques jours (voir heures) on peut avoir une chiffre qui peut varier du simple au double!. Ce chiffre n’est donc pas fiable, et n’est pas utilisable face aux clients, car comment expliquer au propriétaire d’une boutique que son index de produits à passé de 3 500 à 2 100 en 24 heures? Il va s’imaginer que site souffre d’une quelconque sanction. Notre site d’exemple possède selon cette méthode 64 pages indexées chez Yahoo!, et 45 chez Google.

Webmaster Tools

Nous avons créé un sitemap avec 15 URLs pour le site en question, et nous avons soumis à Google via l’interface de Webmaster Tools. Au bou d’un certain temps, Google avait indexé les 15 URLs. La question se pose alors, d’où sortait Google alors les 30 URLs restantes? des anciennes pages gardées en cache, des erreurs de statistique…

Une donnée utile: les « pages de destination »

Randfish de Seomoz donne une piste intéressant avec les « pages de destination« . Si vous avez un compte Google Analytics, allez dans Sources de trafic > Moteurs de recherche.

indexation avec analytics - etape 1

Cliquez l’un des moteurs qui vous apportent du trafic, puis sur « Pages de destination ».

indexation avec analytics - etape 2
indexation avec analytics - etape 3

Ce chiffre correspond aux pages du site qu’on reçu du trafic mesuré par Google Analytics. En voilà un vrai chiffre pratique et utile qui nous donne une indication mesurable de l’usage que les internautes font du site. De plus ce chiffre ne fait pas des changements invraisemblables comme ceux données par la commande site.

Contenu dupliqué: paramètres à vérifier

Mardi 26 janvier 2010

On a vu dans un précédant article quelle était la politique de Google à propos du contenu dupliqué, les « mythes » à propos des sanctions qui risquent les sites qui le génèrent, et le coût en termes de référencement.

Pour faire suite et pour ceux dont la facilité de la modification peut justifier l’intervention, voici une petite liste des paramètres qui peuvent générer ce contenu dupliqué:

  • Utilisation d’un contrôleur frontal qui génère le même contenu pour plusieurs URL différentes:
    http://www.monsite.fr/pantalon-bleu
    
    http://www.monsite.fr/pantalon-bleu/
    
    http://www.monsite.fr/index.php?id=123
  • Les versions pour l’imprimante des pages du site:
    http://www.monsite.fr/pantalon-bleu
    
    http://www.monsite.fr/impression/pantalon-bleu
  • Les identifiants de session. Attention, si votre site ajoute ces identifiants dans l’URL lorsque vos clients sont loggés, Google ne les verra pas:
    http://www.monsite.fr/pantalon-bleu
    
    http://www.monsite.fr/pantalon-bleu?SESSID=123456789

Outils contre le contenu dupliqué

Le contenu dupliqué peut être géré à l’aide de quelques outils. Voici les plus simples à utiliser:

  • Empêcher l’indexation des URL dupliquées avec la balise meta robots
    meta name="robots" content="noindex, follow"
  • Choisir l’URL canonique. Il s’agit de l’URL qui doit être indexée par rapport à des URL avec du contenu identique.
    link href="http://www.monsite.fr/pantalon-bleu" rel="canonical" 
  • Faire des redirections 301
  • Utiliser les outils de Google Webmaster Tools

Lancement du site Sarl Vernisse

Jeudi 21 janvier 2010

La création de sites étant l’une de nos activités, on vous présente le premier site livré cette année : SARL Vernisse.

sarl-vernisse

Il s’agit d’un site de présentation d’une société de charpente et couverture basée à La Verne. Il se caractérise surtout par une présentation visuelle des réalisations de la société. A ce fin on a mis en place des galeries « Lightbox ». Nous avons réalisé la conception graphique ainsi au le développement XHTML.

Lecteurs d’écran et accessibilité

Mardi 19 janvier 2010

L’une des idées les plus répandues en matière d’accessibilité est que les lecteurs d’écran, ne peuvent pas gérer le javacript. Le contenu généré par ce type de script ne serait donc pas visible pour les personnes qui s’en servent de ce type de navigateur. Pour remédier à cela, on doit soit proposer une alternative si javascript n’est pas activé, ou utiliser javascript de façon à qu’il « dégrade progressivement », sans empêcher l’accès au contenu important.
javascript-enabled
Le site WebAIM, spécialisé en accessibilité, vient de sortir une étude qui porte sur 655 utilisateurs de lecteurs d’écran. Entre 75% et 90% de ces utilisateurs naviguent avec javascript habilité. Cela veut dire qu’ils vont trouver le contenu généré avec javascript, et remet en cause une croyance très repandue chez les développeurs.
La question que l’on se pose par la suite, tient à voir avec le référencement. Le javascript est-il vraiment une trappe à robots?

Que lisent vos visiteurs sur votre site?

Lundi 18 janvier 2010

Dans cet article, Jakob Nielsen, analyse une étude à propos du pourcentage de texte lu par les visiteurs des sites Internet (en anglais).

Cette étude, réalisée par Harald Weinreich, est basée sur l’examen de comment 59,573 pages ont été lues. Ces pages possèdent entre 30 et 1 250 mots. Voici un aperçu de la relation entre le temps passé à lire la page, et le nombre de mots que contient celle-ci:

page-visit-time-per-word-count

Cet image nous montre que le fait d’ajouter des mots à une page, n’augmente pas proportionnellement le temps passé sur celle-ci. Une explication peut être le fait que les gens scannent les pages (Steve Krug) au lieu de les lire, et dans le cas où il y a énormément de texte, c’est encore plus vraie.

Et combien de mots lisent les gens en moyenne? Si vous voulez que les gens lisent tout le contenu d’une page regardez bien cette image:

percent-of-text-read

On voit dans cette image comment le pourcentage de lecture chute très rapidement. Cela signifie plus précisément que les gens lisent en moyenne un maximum de 111 mots par page. Il semble être la barrière au delà de laquelle les pages seront scannées.

Pour ce qui concerne le référencement, on a tendance à étoffer les pages avec des mots pour les faire réactives au plus grand nombre de mot-clés. Ceci n’est pas l’encontre avec ce qu’on bien de voir. Il suffirait de placer cette centaine de mots, au début de la page.

L’importance des liens pour le référencement

Jeudi 14 janvier 2010

Pour ceux qui commencent à appendre les subtilités du référencement, il peut être déroutant d’appendre que la plus grosse partie du positionnement de sont site se joue sur d’autres sites : les liens que ces autres sites font vers le notre.

L’origine de ce système est le PageRank, algorithme créé par Larry Page co-fondateur de Google. Cet algorithme compte les liens comme des votes de popularité. Les pages avec plus de liens entrants sont les plus populaires, et les mieux positionnées dans les résultats.

La popularité est mesurée par les liens car l’autre unité de mesure, le trafic, est difficilement évaluable par les moteurs de recherche. En même temps les liens sont faciles à compter.

Aujourd’hui, les moteurs de recherche ne se limitent pas à compter les liens. L’influence des liens dans le référencement d’un site, est telle que une analyse plus poussée est de rigueur. Il sont analysés entre autres:

  • La popularité de la page qui nous fait le lien.
  • La concordance des sujets entre la page qui fait le lien, et celle qui le reçoit.
  • Le texte utilisé pour faire le lien.
  • La quantité de liens de la même page.
  • Le nombre de domaines différents qui nous font un lien.
  • La confiance donnée au domaine qui nous fait à lien par les moteurs de recherche.
  • Le nombre de textes différents utilisés pour nous faire un lien vers la même page.
  • Le fait d’exister ou pas une relation de propriété entre les deux domaines.

Avec ces éléments on a un début d’aperçu, du facteurs les plus important pour le référencement de notre site: les liens.

Faire cohabiter les versions clasique et mobile de votre site

Mercredi 13 janvier 2010

Si vous disposez d’un site Internet avec une version standard et une version pour mobile, il y a deux situations que vous désirez éviter: a) qu’un utilisateur avec un ordinateur trouve votre site pour mobile, et b) qu’un utilisateur trouve votre site standard depuis son mobile. Pour faire face à ces situations, nous allons suivre les conseils de Jun Mukai, Software Engineer, du Mobile Search Team de Google.

1.- Envoyer les utilisateurs vers la version adéquate.

a) Si un utilisateur, ou un robot d’indexation (comme « Googlebot-Mobile ») trouve la version standard d’une URL de votre site, on peut faire une redirection vers l’URL « mobile » équivalente. Attention il n’est pas recommandable de faire juste une redirection vers la page d’accueil du site pour mobiles car cela génère une expérience négative chez les utilisateurs, et peut être considéré comme une tentative d’amélioration « artificiel » du référencement.

b) Dans le cas contraire, où un utilisateur avec un ordinateur tombe sur le site pour mobiles, il n’est pas nécessaire de faire un redirection. Par contre il est convenable d’ajouter un lien vers la version standard, si celle-ci est plus complète ou  propose davantage de fonctionnalités.

2.- Fournir un contenu différent en fonction du User-Agent

Dans ce cas il n’y pas de redirection. Les versions standard et mobiles sont accessibles depuis la même URL. En détectant le user-agent, on fourni une ou autre version du contenu.

Il y a quand même un risque si ce système n’est pas configuré correctement. Si vous fournissez un contenu aux utilisateurs et un autre à « Googlebot-Mobile » vous risquez de faire du cloacking, et faire blacklister votre site. Plus précisément, Google va indexer votre version standard avec « Googlebot », et la version mobile avec « Googlebot-Mobile ». Une bonne configuration passe par offrir aux utilisateurs d’ordinateurs la même version que vous proposez à « Googlebot », et à ceux qui se servent d’un mobile celle qu’indexera « Googlebot-Mobile ».

Mukai nous donne un exemple qui est considéré comme du cloaking même si dans la plupart des cas n’est pas intentionnel:
Imaginez que vous donnez aux navigateurs classiques le message « SVP accédez au site depuis votre mobile ». Mais si vous n’avez pas pris la précaution d’envoyer le même contenu à « Googlebot », et que celu-ci accède par contre au même contenu que « Googlebot-Mobile », nous serions dans un cas de cloacking.

Plus d’informations sur le blog pour webmasters de Google.


Société ADIFCO

Méthodologie, Références, Partenaires, Revendeurs, F.A.Q, Outils gratuits

Services

Création de site, Analyse de trafic, Webmarketing, Conseil, Formations

Blog

 
Copyright © 2012 - ADIFCO sarl. Reproduction interdite.