 |
 |
| en cours |
|
Google: le retour de la sméantique
@position - février 2005
|
|
|
 |
En mars 2004 nous écrivions un article sur la
sémantique. Dimanche 6 février 2005, Google a effectué une nouvelle mise à jour
de son moteur, intégrant de nouveaux éléments de sémantique. Au delà des fluctuations de
trafic que de nombreux sites ont constatés, c'est surtout bientôt l'apparition d'une nouvelle façon
d'effectuer ses recherches, de trouver ses réponses, et donc de référencer.
Depuis quelques mois, voire quelques années pour les précurseurs, les moteurs testent
régulièrement la déclinaison des mots. Ainsi un internaute qui cherche "sport" voit sa requête
étendue à "sports" lorsque la fonctionnalité est activée. Dans certains cas la déclinaison
s'étend à de nombreux mots ayant la même racine: "sportif", "sportive", ...
Sur la requête "~sport" Google propose aujourd'hui des réponses dans lesquelles il ressort les
mots "tennis", "football, fitness,...

En terme d'usage des outils de recherche, cette évolution est en fait une révolution.
Car si aujourd'hui les outils de recherche ont montré leur pertinence à présenter une
réponse sur une requête précise et comportant les mots utilisés dans la question, il est
encore des pans entiers sur lesquels ils sont inadaptés. Par exemple ils ne proposent pas (plus)
de synthèses sur un sujet large ou sur un domaine d'activité, possibilité qu'offrent d'une certaine
manière les annuaires.
Dans le cas de "~sport" la nouvelle fonctionnalité ouvre cette voie.
Cependant la réelle nouveauté réside dans la façon dont l'internaute va construire sa question.
Jusqu'à présent l'internaute doit construire sa question en fonction de la supposée forme de la
réponse. Par exemple la question doit idéalement comporter des mots de la réponse. En
caricaturant ce raisonnement, l'internaute doit décrire la réponse à sa question pour
que le moteur propose la page qui reprend cette description et qu'un maximum d'autres sites
"reconnus" plébiscitent: la réponse sera alors naturellement le titre de la page proposée.
Voilà peut-être une piste d'explication de l'importance de la balise titre...
Dans cette démarche il est par exemple difficile de trouver une réponse pertinente à la question
"portable" lorsqu'on cherche un téléphone portable. Vous auriez du savoir qu'un téléphone
portable est en fait un "mobile", et que le mot "portable" désigne plus des ordinateurs
portables. A présent vous n'avez plus besoin de connaître ces
subtilités du langage.
De moins en théorie, car la requête "portable" sur Google ne donne que des ordinateurs, et "~portable"
que des téléphones...
Plus efficacement, si vous cherchez "~musique" sur Google, vous verrez apparaître en gras le mot "MP3" ce
qui laisse sous entendre qu'il s'agit d'un terme utiliser dans ce secteur. Pour un internaute cherchant
une réponse dans un secteur qu'il ne connait pas -ou très peu-, cette information a de la valeur: "Subway"
apparaît sur une requête "~train", "Microsoft" sur "~freeware". Dans ce dernier cas il s'agit bien
d'une réelle ouverture à d'autres sujets que celui de la question !
Plus sérieusement la requête ~positioning met en évidence placement, optimization,
submission, position, ...
Dorénavant, le moteur est capable de reformuler la question. La question peut donc être rédigée
librement par l'internaute, d'autant plus librement que cette technologie se développe. Et la réponse
est construite en fonction de la question et non plus l'inverse.
L'utilisation des moteurs de recherche par les internautes va changer en conséquence. Le métier du
référencement va lui aussi poursuivre sa mutation: la démarche qui consiste à travailler sur un
ensemble limité de requêtes prédéfinies pourrait devenir obsolète à terme. Grâce à cette
nouvelle fonctionnalité, l'optimisation sur une requête peut engendrer des résultats aussi sur
d'autres requêtes. Cependant une bonne optimisation de la visibilité d'un site, et surtout
sa compréhension, passeront certainement par une notion plus large de l'environnement
thématique qu'un nombre limité de requêtes prédéfinies.
Parallèlement, et sur la même lancée, les outils de recherche vont être bientôt en mesure de trier
plus finement les doublons. En particulier, ils vont détecter les pages construites sans contenu
et dans un but unique: être optimisées sur une requête donnée pour les outils de recherche.
Ainsi il est raisonnable de penser que nous allons assister à une régression sensible des amas
de pages sans contenu, produits dans le seul objectif de produire du volume pour occuper les
outils de recherche. Ce n'est plus le volume de pages qui importera, mais bien leur qualité.
Le référenceur s'attache(ra) à accroître la densité et la valeur sémantique du contenu du site
et non pas favoriser la prolifération de pages "vides".
De même, les outils de recherche se penchent aujourd'hui plus dans le tri des réponses présentées
que dans l'accroissement du nombre de réponses possibles.
Finalement la nouveauté de Google illustre bien la démarche actuelle des outils de recherche:
un travail sur la qualité des réponses plus qu'une course à la quantité de documents disponibles.
Si la reformulation implicite de la requête ressemble à première vue à une fonctionnalité pour
l'utilisateur du moteur, elle est probablement d'abord une nouvelle façon d'identifier les
pages redondantes ou sans contenu propre.
|
|
|
|
|