|
|
|
 |
| dossier |
Sémantique et Mots-Clés -
Partie I : usages et expressions
Sémantique et Mots-Clés - Partie II :
les liens sémantiques
@position - novembre 2002 |
 |
Les recherches des internautes sont aussi diversifiées
que leurs comportements. Néanmoins, les études menées par la revue
du référencement sur le nombre de mots-clés par expression
recherchée et l’accentuation de ces mêmes mots révèlent des
tendances particulières quant aux formulations de ces expressions de
recherche.
Globalement, quatre grands groupes d’expressions peuvent être mis à
jour : les expressions décrivant une activité « métier »
(référencement par exemple), les expressions décrivant des noms de
marques, de produits ou d’entreprises, les expressions incitant à
une « réponse précise » (interview Bill Gates juin 01) et les expressions
incitant à un « acte volontaire » (acheter dvd Stars Wars, louer
villa marseille…).
Chacun de ces « groupes sémantiques » est à combiner avec d’autres
facteurs influant soit sur la recherche même de l’internaute, soit
sur les réponses des outils de recherche : 1, 2, 3 … mots clés ?
l’ordre des mots ? les accents ? etc…
Lors de sa recherche, l’internaute ne pose finalement pas une
question mais formule déjà une réponse (la formulation de la
question est en amont de sa recherche afin d’affiner plus encore la
réponse qu’il souhaite trouver). Il est alors trop tard pour
rediriger (réécrire) l’expression de recherche ; la satisfaction ou
l’insatisfaction des réponses des outils de recherche forceront
ainsi l’internaute à la reformulation de l’expression de recherche.
C’est sur les méthodes d’évaluation de la pertinence des contenus
que les algorithmes des outils de recherche divergent le plus. C’est
aussi le critère le plus secret car il joue beaucoup dans l’avantage
concurrentiel de chacun.
En règle générale, la pertinence d’une page n’est pas calculée au
moment de sa capture. Un filtre est néanmoins appliqué dès cet
instant pour rejeter les pages "trop pauvres" (peu de contenu
textuel), ou manifestement inintéressantes (une liste de codes sans
phrases par exemple). Une page rejetée dès cette phase est
pénalisante car elle empêche la découverte des pages qui seraient
"derrière" (liées depuis cette page).
Les méthodes traditionnelles de référencement par "méta-tags"
influent de moins en moins dans le classement des pages de contenus.
Ces balises peuvent permettre d’indiquer à l’outil d’indexation
quelles expression privilégier dans ses calculs, mais ne permettent
pas de classer une page sur des expressions absentes du contenu.
Les outils de recherche cherchent à indexer les messages que voient
réellement les internautes. Ainsi toutes les zones "invisibles" des
pages HTML perdent peu à peu de leur pertinence (meta tags, balises
noframe, noscript, noembed, commentaires …). Les outils les plus
modernes éliminent directement ces zones sans les lire.
Les outils d’indexation cherchent à déterminer quelle est la
structure du document, où sont les titres, zones de menus,
paragraphes et mots mis en valeur.
|
| |
| Les usages
"généraux" |
|
Le nombre de mot-clé |
| Les recherches sont souvent précises : près de 51 % des requêtes
recherchées sur Google.fr contiennent 3 mots ou plus (les autres
moteurs de recherche n’ont que 37 % de leurs requêtes contenant 3
mots ou plus). De plus, les utilisateurs trouvent vite les réponses souhaitées :
76 % des utilisateurs trouvent le site recherché dès la première
page de résultats et plus de 39 % d’entre eux qui tapent des requêtes
contenant 3 mots ou plus trouvent le résultat escompté dès la
première page de résultats. |
| nombre de mots |
pourcentage |
| 1 mot |
16 % |
| 2 mots |
33 % |
| 3 mots ou plus |
51 % |
|
| |
|
Les accents |
| Selon l’analyse de données menée par eStat et @position au cours
des requêtes du mois d'avril 2002, une moyenne de 47% seulement des
mots-clés sont recherchés avec une accentuation correcte. Ce chiffre évolue
fortement selon le moteur de recherche utilisé : Google arrive en tête
de liste des outils avec 49,2 % de ses requêtes accentuées correctement,
suivi immédiatement de Lycos où ce chiffre atteint 47,4 % des requêtes.
Yahoo et Nomade ferment la marche avec respectivement 43,3 % et 42,7
% de leurs requêtes accentuées correctement. |
| moteur |
nb de mots |
mots accentués |
% |
| Nomade |
30 462 |
12 993 |
42,70 % |
| Yahoo |
143 203 |
61 980 |
43,30 % |
| Wanadoo |
138 528 |
60 897 |
44,00 % |
| AOL |
24 763 |
10 972 |
44,30 % |
| Voilà |
87 657 |
39 133 |
44,60 % |
| MSN |
49 866 |
23 022 |
46,20 % |
| Lycos |
59 072 |
27 985 |
47,40 % |
| Google |
625 799 |
308 198 |
49,20 % |
| Total |
1 159 350 |
545 180 |
47,00 % |
|
|
| Les expressions |
| Les expressions
"métier" |
|
Le "métier", entendu comme la ou les activités professionnelles
principales d'une entreprise, reste le plus souvent difficile à
définir et à affiner tant certaines expressions le constituant sont
très concurrentielles : presse féminine, grande surface, audit et
conseil, etc. Le caractère "universel" des professions prédispose
chaque entreprise à asseoir et à crédibiliser sa visibilité sur ses
activités. Ces termes sont donc généralement très concurrentiels et
les moteurs de recherche ont peine à déceler les pertinences
distinctes entre les sites. Pour des expressions à fort potentiel
concurrentiel, les annuaires de recherche restent les plus adaptés
pour s'assurer d'un minimum de visibilité. Les solutions de liens
sponsorisés favorisent aussi les entreprises pouvant se permettre
"d'imposer" leur présence sur ces expressions. |
|
|
| Les expressions
"marques" |
|
Généralement propriétaire, les expressions décrivant une marque, un
produit ou un nom d'entreprise sont, a contrario des expressions
"métier", beaucoup plus facilement assimilables à un site. La
combinaison des marques et/ou produits et/ou entreprises
fonctionnant le plus souvent par binôme voire trinôme, la visibilité
des sites sur ces expressions est globalement très bonne. Néanmoins,
l'utilisation abusive de ces expressions par tout autre entité que
le propriétaire est souvent passible de sévères sanctions par les
outils de recherche (le position squatting). Au même titre que les
expressions "métier", ces termes caractérisent pour la plupart un
ensemble d'autres termes. Images génériques d'une entreprise sur
Internet, les expressions "marques" renvoient généralement vers une
réponse pertinente mais peu précise (home page). |
|
|
| Les expressions
"fines" |
|
Les expressions "fines", définies comme étant des requêtes précises
appelant à une réponse tout aussi précise (papier photo brillant,
circuit karting Yvelines, etc.) sont celles généralement les plus
recherchées (2 mots / 3 mots ou plus). Si le "métier" et les
"marques" peuvent se résumer à 1 ou 2 mots clés, la précision de la
requête "fine" engendre, si elle existe, la même précision dans la
réponse des moteurs de recherche. Ceux-ci sont alors les plus aptes
à répondre à ces requêtes (en comparaison aux annuaires de
recherche). Le référencement de contenu permet ainsi de drainer un
publique très qualifié vers le site mais il reste ensuite à
transformer ses visites en leads. Pour augmenter le taux de
transformation, il faut que chaque internaute qui arrive sur le site
en ayant posé une requête "fine" aboutisse sur une page
correspondant réellement à sa requête (et pas sur la page d’accueil
où il devrait reposer sa requête, par exemple). Il faut s’assurer de
la cohérence entre le contenu présenté au moteur et le contenu
présenté à l’internaute. |
|
|
| Les expressions
"actes" |
|
Les expressions "actes" décrivent le comportement et la volonté
d'action de l'internaute : acheter..., s'abonner..., louer..., etc.
Ces expressions représentent celles dont le taux de transformation,
sur site, est le plus fort. Si l'outil de recherche et le site sont
capables de répondre de façon précise à la requête, la validation
(acte d'achat par exemple) de l'internaute en sera d'autant plus
simplifiée. Alliant à la fois l'acte volontaire de l'internaute
cherchant à valider une action et les notions d'expressions "fines",
ces requêtes, quand elles sont optimisées, sont faites pour générer
un trafic très qualifié et un fort taux d'acquisition associé. La
comparaison Amazon / Fnac pour ces expressions est significatives :
avec plus de 3 500 000 de pages amazon.com indexées dans google.com
contre seulement 4 pour la Fnac, le distributeur Amazon répond de
façon très pertinente aux requêtes d'achat des internautes... près
de 900 000 fois plus de chance de vendre en ligne... |
|
|
| Suite du dossier en décembre |
| Les sémantiques |
| la sémantique « client » (son choix) |
| la sémantique des internautes en fonction de la sémantique «
client » |
| la sémantique entreprise/marque/produit |
| la sémantique « dictionnaire » |
| la sémantique du contenu du site |
| la sémantique « trafic » et « marketing » (expressions couplées
pour vendre) |
| la sémantique « concurrentielle » |
| la sémantique « événementielle » |
| |
| Les « liens » sémantiques |
| la rédaction des expressions |
| la pertinence des expressions liées |
| le choix des liens |
| la pertinence du contenu |
|
|
|