@position retour : Les mises à jours des outils de recherche - Inktomi dance décembre 2003

étude
Le fonctionnement des outils de recherche :
Le rafraîchissement des bases de données des principaux moteurs en 2003
janvier 2004 / @position
Le mois de décembre 2003 a été marqué par une mise à jour majeure de la base de données du moteur Inktomi (HotBot, MSN, ...). Google conserve son rythme d'indexation permanente et les bases Inktomi, Altavista et Alltheweb se rapprochent étrangement.

page 1/2 : étude de Altavista, Alltheweb, Google et Inktomi
page 2/2 : la mise à jour d'Inktomi en détail
 
Méthodologie de l’étude

Nous avons mesuré quotidiennement, depuis le 11 août 2003, le nombre de pages créées à une certaine date et présentes le jour de la mesure dans la base de données de chaque outil.

Afin de ne pas surcharger les outils de recherche avec des interrogations automatiques, nous avons limité l’étude aux pages créées dans les 250 jours précédant la date de la mesure (soit un peu plus de 8 mois).

A partir de ces mesures quotidiennes, nous avons calculé l’âge moyen des pages présentes. Notez bien qu’il s’agit d’une étude portant sur les nouvelles pages ajoutées dans les bases de données et non pas des mises à jour de pages existantes qui sont parfois traitées différemment.


Résultats et interprétations :

Depuis le 11 août 2003, nous avons constaté les évolutions suivantes :



  • Google est toujours le moteur proposant les informations les plus récentes. Les documents référencés dans sa base ont été créés en moyenne il y a 110 jours.
     
  • Google parvient à ce résultat en indexant, quasi-quotidiennement, de nouveaux documents dans ses différentes bases de données.
     
  • Dans l'ensemble les autres outils de recherche ont un fonctionnement plus classique en 3 étapes. L'ensemble des documents est tout d'abord capturé; Cette étape dure généralement un mois. Les documents sont ensuite analysés et classés; La durée de cette étape est variable. Une fois la nouvelle base construite, elle est publiée et remplace l'ancienne. Cette mise à jour complète est visible sur nos courbes car elle provoque une chute instantanée de l'âge moyen des pages référencées.

  • Le mois de décembre a été marqué par une très importante mise à jour de la base Inktomi. Avant cette mise à jour Inktomi était le moteur de recherche proposant les informations les moins récentes. A cette date, l'âge moyen d'une page était de 201 jours.

    Le 8 décembre cet âge moyen tombe brusquement à 145 jours, il s'agit de la mise à jour la plus significative que nous ayons observée depuis que nous effectuons ces mesures. Pour la première fois Inktomi semble faire jeu égal sur ce point avec les autres outils de recherche.

  • Depuis le 8 décembre les bases Inktomi et Altavista ont très sensiblement le même âge (les courbes semblent confondues). Ceci peut faire penser à une mise en commun de certaines données ou méthodes au sein de ces deux outils.

  • Cette publication survient trop tôt pour vérifier si Altavista conserve son rythme régulier d'une publication tous les deux mois environ. Elle aurait alors lieu au cours du mois de janvier 2004. La dernière mise à jour date du 16 novembre 2003.


  • suite : la 'Inktomi dance' de décembre en détail :

    page 2 : étude détaillée de la  mise à jour de la base Inktomi, comparaison des bases Inktomi et Altavista (au 10 janvier 2004).

     

     
    voir aussi :
    octobre 2003 : La danse Altavista à la loupe
    décembre 2003 : 1 an de référencement avec Google
     
    la revue du référencement
    www.aposition.com - www.aposition.fr - www.aposition.co.uk
    copyright @position 2005 - tous droits de reproduction réservés