@position - SEPTEMBRE 2007
chiffres clés zoom sur... actualité études en cours... dossier
rechercher dans le site
 
faq
Les différentes formes de référencement sur les outils de recherche

inscription
votre adresse email
html texte
inscription à la revue du référencement
 
sondage
La recherche d'images, vous l'utilisez ? 
Jamais
Parfois
Souvent
 
archives
archives dossiers
archives études
archives interviews
archives chiffres clés
archives en cours
archives clin d'oeil
archives zoom
archives FAQ

Voir aussi :
Le grand prix de la visibilité dans le monde du tourisme @position - Janvier 2007
Le référencement et la mesure de visibilité - 1 / 3 @position - mai 2003
Etudier les brevets pour comprendre les évolutions des moteurs de recherche - Janvier 2007
Quel référencement pour quel site ? @position - mars 2003
Sémantique et Mots-Clés Partie I : usages et expressions
@position - novembre 2002

version imprimable
dossier
Comment lire et comprendre les chiffres clés ?
@position - juillet 2002
A l'heure où les chiffres clés couvrent l'essentiel des marchés de l'Internet en France et à l'International, de nombreux écarts d'analyse viennent souligner les différentes méthodologies employées. Quelles en sont les causes et les conséquences ?
L’interprétation de ces chiffres est souvent sujette à controverse issue des confusions faites entre les différentes approches. L’explication des sources de ces chiffres paraît aujourd’hui être une nécessité pour les internautes : quelles sont les principales différences entre les données « site-centric » et les données « user-centric » ? Que comportent et ne comportent pas ces données ? Comment interpréter les écarts révélés ? etc…

Les différentes sources
Aujourd'hui, deux principales sources coexistent sur le marché : les sources issues de la constitution de panels d'internautes ("user-centric") et celles issues des visites réelles des internautes ("site-centric"). Ces deux approches ont chacune leurs valeurs ajoutées et il n'est pas question alors de valoriser l'une par rapport à l'autre. Néanmoins, leurs méthodologies présentent des caractéristiques bien différentes et sont, en règle générale, l'explication précise des écarts constatés.
La méthodologie fondée sur un principe "user-centric" révèle les comportements d'internautes sélectionnés et suivis régulièrement. Il s'agit d'observer de façon automatique et systématique, le comportement de panels d'internautes. Ces panels sont constitués de façon à être représentatifs d'une certaine catégorie de la population. Les données qui en découlent alors ne décrivent pas l'analyse d'un site mais le comportement d'un internaute sur ce site via un outil installé sur son ordinateur. Toutes les visites d'un site ne sont donc pas enregistrées. En parallèle, d'autres mesures peuvent être effectuées auprès des internautes via des enquêtes téléphoniques ou des questionnaires en ligne.
La méthodologie fondée sur un principe "site-centric" repose sur l'analyse de trafic d'un site. Deux outils de mesure sont aujourd'hui disponibles : les "logs" (analyse du fichier journal du serveur d'hébergement) et les "tags" (balise de comptage placée sur toutes les pages à mesurer). Les visites ainsi calculées donnent un aperçu exhaustif du trafic d'un site mais ne donnent que peu d'information sur la navigation générale de l'internaute.
Il semble donc évident que ces sources d'analyse sont complémentaires. Dans la mesure où ces méthodologies ne calculent pas de la même façon les mêmes informations, les résultats des analyses en seront d'autant plus différents.

L'influence des méthodologies sur les chiffres
Les différences de mesures révélées par les experts de l'une ou l'autre méthodologie montrent l'influence particulière qu'a chacune d'elle dans l'interprétation et l'analyse des données. Cette influence est inhérente au système de mesure. On ne peut donc pas réduire le débat sur la pertinence des chiffres aux simples  " vrais ou faux ? ".
Tournée vers la qualification a priori des internautes (panels) et vers leur navigation globale (sur tous les sites visités), la méthodologie "user-centric" décrit des comportements généraux de visites, de parcours, d'utilisation du web.
Tournée vers l'identification a posteriori du trafic d'un site, la méthodologie "site-centric" décrit l'audience d'un site par les visites, le nombre de pages vues, la provenance, etc. des internautes sur ce site.
approche user-centric approche site-centric

Dans un mode "user-centric", les mesures s'établissent à partir d'un recueil de données issues d'une sélection d'internautes. La qualification est alors plus précise que dans un mode "site-centric". En revanche la précision des mesures pouvant être faites sur un site est souvent beaucoup plus faible (du fait de la restriction du panel).

Comment lire les chiffres-clés ?

Les chiffres clés publiés dans La Revue du Référencement sont issus des analyses faites à partir de plus de 40 000 000 de visites constatées sur plus de 50 000 sites dont l’audience a été mesurée par eStat sur une période d'un mois. L'exhaustivité des données recueillies permet de dresser des tendances significatives du marché sur des questions et problématiques précises : quels sont les outils de recherche les plus utilisés ? d'où proviennent les visites sur un site ? etc. La tendance, constatée depuis quelques mois dorénavant par tous les prestataires de mesures "site-centric", confirme l'évolution marquante du moteur de recherche Google.
Inversement, c'est Yahoo! qui prend la tête des classements pour les prestataires de mesures "user-centric". Les mêmes écarts de pourcentage se retrouvent dans d'autres analyses : répartition du trafic entrant, fournisseurs d'accès, navigateurs, systèmes d'exploitation, etc.
Pour le cas précis des outils de recherche, les différences sont inhérentes aux analyses effectuées : il semble justifié que Yahoo! (le portail annuaire) est une audience supérieur à celui de Google (le moteur de recherche). En revanche, le nombre de recherches effectuées sur Google est supérieur au nombre de recherches effectuées sur Yahoo! (Yahoo!, contrairement à Google, propose de nombreux autres services sur son portail (chat, email, finance, infos...). Autant de services comptabilisés dans les visites de Yahoo! mais ne correspondant pas à des recherches effectuées sur l'annuaire). En terme d'audience donc, Yahoo! semble générer plus de trafic que Google. Les mesures abondant dans ce sens ne veulent pas minimiser le rôle de Google : elles ne décrivent simplement pas les mêmes utilisations des internautes. La mesure "site-centric" dans ce cas décrit les actes de recherches effectuées sur les moteurs ou annuaires. La mesure "user-centric" décrit le comportement général des internautes sur ces outils de recherche.
En conclusion, les mesures "user-centric" (panels d'utilisateurs) cherchent à répondre à la question "combien de personnes utilisent tel site ?" à la différence des mesures "site-centric" (panels de sites) cherchant à répondre à la question "combien d'utilisations sont faites de tel service ?".
Il est donc nécessaire, avant toute interprétation de ces chiffres, de les replacer dans leur contexte d'étude (à la fois QUI effectue les mesures et COMMENT sont elles recueillies). Les modes "déclaratif" ou "constaté" ont chacun leur pertinence dans un cadre précis. Leur comparaison sur des thématiques communes ne devrait que faire évoluer les méthodologies vers un travail commun qui semble aujourd'hui nécessaire aux internautes.
 

Le point de vue "site-centric" - Laurent Bazet (eStat)

"La question de la fiabilité des mesures effectuées est fondamentale. La fiabilité des mesures repose d’une part bien entendu sur la performance technique et la capacité de l’outil mis en œuvre à traiter les informations qui lui sont confiées quels qu’en soient les volumes et les variations. Pour être fiable un outil doit effectivement mesurer ni plus ni moins que le nombre exact des visites. eStat est par exemple dimensionné pour assumer le double du volume courant de l’audience générée par ses clients. Cette précaution élémentaire nous permet d’assumer sans encombre et sans baisse de qualité de service les pics d’audience qui peuvent être générés de façon prévisible (comme pour les évènements sportifs) ou complètement inattendue (selon les aléas de l’actualité).
La fiabilité des mesures repose également sur la capacité des outils du marché à fonctionner en respectant les mêmes terminologies et les mêmes normes. Dans ce domaine, les organisations professionnelles telles que le CESP (Centre d’Etude des Supports Publicitaires) et l’OJD (Diffusion Contrôle) jouent leur rôle de régulateur, certificateur et contrôleur du marché en organisant les discussions permettant d’aboutir à la mise au point de normes et de règles, et en assumant leur mission de contrôle des pratiques employées. Diffusion Contrôle délivre des certificats aux sites en faisant la demande et répondant sans faille aux exigences de fiabilité.
Enfin, la fiabilité des informations repose aussi sur la qualité de mise en œuvre des dispositifs de mesure. Par exemple, il est primordial de définir précisément le périmètre des sites mesurés : il n’est pas question en effet d’inclure dans le calcul du nombre de pages vues sur un site les pages qui répondent à une autre URL ou le nombre des e-mails adressés dans le cadre de la newsletter hebdomadaire à 80 000 exemplaires. Intervenant aussi comme garant de la qualité du marquage des pages de ses clients, eStat les assiste dans la phase de mise en place des marqueurs de façon à permettre la production d’informations dont la fiabilité est incontestable."
 
la revue du référencement - - -
copyright @position 2006 - tous droits de reproduction réservés
contact crédits plan du site