@position - SEPTEMBRE 2007
chiffres clés zoom sur... actualité études en cours... dossier
rechercher dans le site
 
faq
Les différentes formes de référencement sur les outils de recherche

inscription
votre adresse email
html texte
inscription à la revue du référencement
 
sondage
La recherche d'images, vous l'utilisez ? 
Jamais
Parfois
Souvent
 
archives
archives dossiers
archives études
archives interviews
archives chiffres clés
archives en cours
archives clin d'oeil
archives zoom
archives FAQ

Voir aussi :
Comment utiliser les mots cles "longue traine" pour ameliorer son roi. @position - Septembre 2007
L'effet Googlearchy @position - Janvier 2007
FAQ: Les liens sponsorisés Avril 2004
FAQ: Le référencement vu par les responsables de site Décembre 2003
Google : les chiffres en détail Dossier eStat/@position - juin/juillet 2002

version imprimable
étude
Le fonctionnement des outils de recherche :
Mise à jour majeure du moteur Inktomi en décembre 2003
janvier 2004 / @position
Le mois de décembre 2003 a été marqué par une mise à jour majeure de la base de donnée du moteur Inktomi (HotBot, MSN, ...).

page 1/2 : étude de Altavista, Alltheweb, Google et Inktomi
page 2/2 : la mise à jour d'Inktomi en détail
 
Les pages référencées par Inktomi avant et après le 8 décembre :

Les deux courbes suivantes permettent de comparer l'âge des pages référencées par Inktomi avant et après la dance du mois de décembre 2003.



  • Le 7 décembre l'âge moyen des pages contenues dans la base était de 201 jours. On voit sur la courbe que la majorité des pages dataient du dernier crawl (mai et juin 2003)

    l'analyse de la courbe présentant la date de création des pages contenues dans la base après le 8 décembre permet les constatations suivantes :
     
  • La publication du 8 décembre concerne des pages créées en majorité au mois de septembre 2003 et au tout début du mois d'octobre. La dernière capture (crawl) d'Inktomi a donc duré environ un mois pour se terminer le 15 Octobre.
     
  • La précédente publication de la base Inktomi date du 24 octobre et les pages avaient été capturées en Juin (voir la revue du référencement de novembre 2003 : Inktomi dance)

    Inktomi réalise donc un crawl avant de publier les résultats du crawl précédent. Ce type de fonctionnement peut indiquer que la phase de calcul est particulièrement longue.
     
  • Deux mois ont été nécessaires à Inktomi pour publier le résultat du crawl, le calcul pour la capture précédente avait duré quatre mois. Cette différence explique la soudaine 'fraîcheur' de la base de données Inktomi. Les pages les plus récentes de la mise à jour de décembre datent de deux mois seulement.


  • Comparaison Inktomi / Altavista:

    Depuis le 8 décembre les bases de données des moteurs Atavista et Inktomi ont sensiblement la même fraîcheur moyenne. Cette similarité pourrait indiquer que les deux bases sont identiques ou construites à partir des mêmes documents (crawl commun).

    Les courbes suivantes permettent une comparaison du contenu de ces deux moteurs à la même date (10 janvier 2004).

    Les deux bases de données n'ayant pas la même taille (revue du référencement, juin 2003 : la taille des outils de recherche), nous représentons sur l'axe vertical le pourcentage de pages créées à une date donnée qui sont référencées par l'outil. Cette présentation permet une comparaison.(lecture : 1.2% des pages référencées par Inktomi dans les 250 derniers jours ont été crées le 1er octobre)


     

    Il apparaît clairement sur ces courbes que Inktomi n'utilise pas la même base de données qu'Altavista.

    Le crawl d'Inktomi est plus jeune d'environ un mois mais il contient aussi une partie d'un crawl plus ancien. Ces deux facteurs créent une moyenne identique mais il ne s'agit que d'une coïncidence.


     

     
    voir aussi :
    octobre 2003 : La danse Altavista à la loupe
    décembre 2003 : 1 an de référencement avec Google
     
    la revue du référencement - - -
    copyright @position 2006 - tous droits de reproduction réservés
    contact crédits plan du site