|
|
|
 |
| en cours |
|
Les outils de recherche interne et externe
@position - octobre 2004
|
|
|
 |
|
Avec le lancement par Google de Google Desktop, les outils de recherche
franchissent une nouvelle étape. Dans quelle dynamique s'inscrit cette étape?
Quelles différences cela introduit-il dans les fonctionnalités? Où Google
trouve-t-il son intérêt dans un service apparemment gratuit? Quel rôle pour le
référencement dans ce cadre? |
De l'évolution des outils de recherche
Quelle est la différence entre
Altavista fr 2000,
Altavista fr 2001 et...
Altavista fr 2003 et...Altavista
2004?
Les outils de recherche connaissent un phénomène de pendule (aussi appelé la
"roue du commerce" dans le marketing traditionnel). Ils se différentient des
autres, suivant les époques, par une offre élargie de services (conception
"portail") ou, au contraire, par un caractère épuré extrême (conception "Moteur
pur"). L'évolution d'Altavista, comme montrée au travers des différentes
captures d'écran, est à ce titre assez éloquente. Mais on aurait pu montrer
l'exemple inverse! Par exemple,
Lycos 1997,
Lycos 1998,
Lycos 1999,
Lycos 2000...
Dans un univers chargé et envahissant, l'approche "boite de recherche" est un
facteur différentiant. Google s'est ainsi positionné, en arrivant sur le
marché, en opposition aux "portails" comme Yahoo, MSN, AOL... Ce positionnement
semble sans prétention, "pur", simple. La recherche y est centrale. Le message
véhiculé est clair : mon métier est la recherche d'informations.
L'internaute
est un chercheur, qui croise le chemin de l'outil le temps de la recherche. La
fidélisation ne peut se faire que sur le différentiel de pertinence des
résultats qu'il peut exister avec les autres outils de recherche.
La croissance
aidant, le challenger devient leader. La problématique de pénétration fait
place à celle de fidélisation. D'innovant, excentrique, original, le modèle
devient une référence. Les autres outils de recherche s'adaptent. Les
algorithmes s'adaptent, le différentiel de pertinence se réduit, la
présentation sobre est reprise par certains outils. Comment, dans ces
conditions, fidéliser? C'est aujourd'hui la problématique de Google. La
solution, traditionnellement, est d'aller se battre sur les services.
Innover dans la continuité
L'innovation de Google se fait ainsi dans la continuité d'un glissement d'une
"boite de recherche" vers un véritable portail (qui cache son nom derrière une
présentation épurée grâce aux onglets?).
Les premiers services, assez communs
pour les outils de recherche, sont apparus. Puis la Toolbar, 1er service
original avec le fameux Page Rank. Via l'installation sur le poste de
l'internaute, Google réalisait son premier pas pour pénétrer dans l'intimité du
poste de l'utilisateur. Sans passer par une étape "portail" personnalisé, il
évitait d'effrayer les internautes.
L'arrivée du Desktop search est une autre
grande étape. Déjà égratignée par les Google News, la conception de
l'internaute "chercheur" fait place à celle d'usager à fidéliser. En
s'attaquant au disque dur de l'internaute, Google s'ouvre de nouvelles
perspectives dans son évolution. Il est possible que cet outil ne soit pas
qu'un outil de "fidélisation" de plus, comme pourrait l'être une messagerie
instantanée ou la fourniture d'informations. Cela pourrait être une première
étape vers "autre chose". Il est vrai que Gmail avait déjà, au delà du coup
marketing génial des 1 Giga, fait couler de l'encre sur les risques d'un
potentiel "Big Brother Google". Il est amusant de voir que dans cette course,
il ait pris de vitesse Microsoft.
A moins que le géant en butte a ses problèmes
de monopoles n'ai pas souhaité être le premier à lancer cet outil. Quelle
serait l'étape suivante dans cette généralisation de Google? Le Peer to Peer?
la recherche par communautés d'intérêts? Il est encore tôt pour le savoir.
En terme de théorie de la recherche, le fonctionnement d'un moteur de recherche
interne (sur les éléments contenus dans le PC) et externe (les données
extérieures au PC) ne devrait pas suivre les mêmes orientations. Si de nombreux
éléments sont communs aux deux types de recherche, il existe pourtant des
différences fondamentales :
la capacité d'analyse des objets en recherche interne est très largement
supérieure à celle consacrée à la recherche externe. Si les outils de recherche
conçus pour les intranet sont puissants, c'est aussi parce qu'ils sont très
gourmands. Ils peuvent se permettre des
analyses sémantiques, quand les outils de recherche les plus en avance
dans ce domaine (comme Exalead) se limitent à une
analyse statistique.
L'utilisation des outils peut même être différente. Généralement, un
utilisateur d'un outil de recherche interne cherche un document qu'il connaît
et dont il cherche l'emplacement. La requête a donc très à la recherche d'un
objet. En revanche, lors de l'utilisation d'un outil de recherche externe, la
recherche est liée à la satisfaction d'un besoin. L'objet final, le plus
souvent, n'est pas identifié avant sa découverte.
Cette différence devrait entraîner des types de recherche différents. Le poids
de la sémantique, de la thématique, des "éléments de requêtes" (boléens,
langues etc.) ont des poids très différent selon le type de recherche. Et donc
les technologies doivent en prendre acte.
Que devient le référencement ?
Les règles de référencement s'appliquent sur un outil interne comme sur un
outil externe. Pour bien référencer des informations, il convient de prendre
conscience de la logique des moteurs de recherche internes.
-La première étape est que le contenu que vous produisez soit accessible aux
méthodes de classification de votre moteur. Si vous travaillez une image, son
nom doit être révélateur de son contenu, mais aussi permettre de répondre au
besoin d'information que vous éprouverez. Un récipicé d'impôt "récipicé
n°205123524125" sera inaccessible alors que "récipicé déclaration impôt 2003"
sera facilement retrouvable. Avant chaque nommage, il convient donc de
s'interoger sur les requêtes qui pourront concerner ce document.
-La deuxième
étape est la compréhension du fonctionnement de l'outil concerné. Que met-il en
avant? Quels sont ses points de référence, ses critères d'indexation? Cette étape est d'autant plus importante lorsque la documentation est abondante sur une thématique. Il convient alors non seulement de trouver un résultat, un élément recherché, mais aussi de le trouver dans un délai raisonnable, sans "éplucher" des pages de résultats de recherche.
-La troisième étape est d'identifier les limites du système d'indexation. Quels sont les éléments (ou les parties d'éléments) qui ne sont pas pris en compte? Cela peut être lié à la nature du documents : les images, les animations, le flash etc. Cela peut aussi être lié aux propriétés des documents : documents accessibles à certaines personnes seulement, par exemple.
Comment déterminer ces éléments? Si les problématiques peuvent être énoncées clairement, la démarche de résolution est plus complexe. Il s'agit avant tout de réaliser un grand nombre d'expériences et d'en tirer des conclusions.
Aussi, le référencement auprès des outils de recherche, tant internes qu'externes, est une question de démarche... mais aussi une habitude d'interprétation des résultats observés.
|
|
|
|