|
Le mois de décembre 2003 a été marqué par
une mise à jour majeure de la base de données
du moteur Inktomi (HotBot, MSN, ...). Google
conserve son rythme d'indexation permanente
et les bases Inktomi, Altavista et Alltheweb
se rapprochent étrangement. |
page 1/2 :
étude de Altavista, Alltheweb, Google et
Inktomi
page 2/2 :
la
mise à jour d'Inktomi en détail
|
|
Méthodologie de l’étude
|
Nous avons mesuré quotidiennement, depuis le
11 août 2003, le nombre de pages créées à
une certaine date et présentes le jour de la
mesure dans la base de données de chaque
outil.
Afin de ne pas surcharger les outils de
recherche avec des interrogations
automatiques, nous avons limité l’étude aux
pages créées dans les 250 jours précédant
la date de la mesure (soit un peu plus de 8
mois).
A partir de ces mesures quotidiennes, nous
avons calculé l’âge moyen des pages
présentes. Notez bien qu’il s’agit d’une
étude portant sur les nouvelles pages
ajoutées dans les bases de données et non
pas des mises à jour de pages existantes qui
sont parfois traitées différemment.
|
|
Résultats et interprétations :
|
Depuis le 11 août 2003, nous avons constaté les évolutions suivantes :
Google est toujours le moteur proposant
les informations les plus récentes. Les
documents référencés dans sa base ont
été créés en moyenne il y a 110 jours.
Google parvient à ce résultat en
indexant, quasi-quotidiennement, de
nouveaux documents dans ses différentes
bases de données.
Dans l'ensemble les autres outils de
recherche ont un fonctionnement plus
classique en 3 étapes. L'ensemble des
documents est tout d'abord capturé; Cette
étape dure généralement un mois. Les
documents sont ensuite analysés et
classés; La durée de cette étape est
variable. Une fois la nouvelle base
construite, elle est publiée et remplace
l'ancienne. Cette mise à jour complète
est visible sur nos courbes car elle
provoque une chute instantanée de l'âge
moyen des pages référencées.
Le mois de décembre a été marqué par une
très importante mise à jour de la base Inktomi. Avant cette mise à jour Inktomi
était le moteur de recherche proposant
les informations les moins récentes. A
cette date, l'âge moyen d'une page était
de 201 jours.
Le 8 décembre cet âge moyen tombe
brusquement à 145 jours, il s'agit de la
mise à jour la plus significative que
nous ayons observée depuis que nous
effectuons ces mesures. Pour la première
fois Inktomi semble faire jeu égal sur
ce point avec les autres outils de
recherche.
Depuis le 8 décembre les bases Inktomi
et Altavista ont très sensiblement le
même âge (les courbes semblent
confondues). Ceci peut faire penser à
une mise en commun de certaines données
ou méthodes au sein de ces deux outils.
Cette publication survient trop tôt pour
vérifier si Altavista conserve son
rythme régulier d'une publication tous
les deux mois environ. Elle aurait
alors lieu au cours du mois de janvier 2004.
La dernière mise à jour date du 16
novembre 2003.
|
|
suite : la 'Inktomi dance' de
décembre en détail :
|
|
|
page 2 :
étude détaillée de la mise à jour de
la base Inktomi, comparaison des bases
Inktomi et Altavista (au 10
janvier 2004). |
| |
voir aussi :
octobre 2003 : La danse Altavista à la loupe
|
|
décembre 2003 :
1 an de
référencement avec Google |