|
Le mois de décembre 2003 a été marqué par
une mise à jour majeure de la base de donnée
du moteur Inktomi (HotBot, MSN, ...). |
page 1/2 :
étude de Altavista, Alltheweb, Google et Inktomi
page 2/2 :
la mise à
jour d'Inktomi en détail
|
|
Les pages référencées par Inktomi avant
et après le 8 décembre :
|
Les deux courbes suivantes permettent de
comparer l'âge des pages référencées par Inktomi
avant et après la dance du mois de décembre
2003.
Le 7 décembre l'âge moyen des pages
contenues dans la base était de 201
jours. On voit sur la courbe que la
majorité des pages dataient du dernier
crawl (mai et juin 2003)
l'analyse de la courbe présentant la
date de création des pages contenues
dans la base après le 8 décembre permet
les constatations suivantes :
La publication du 8 décembre concerne
des pages créées en majorité au mois de
septembre 2003 et au tout début du mois
d'octobre. La dernière capture (crawl)
d'Inktomi a donc duré environ un mois
pour se terminer le 15 Octobre.
La précédente publication de la base
Inktomi date du 24 octobre et les pages
avaient été capturées en Juin (voir la
revue du référencement de novembre 2003
:
Inktomi dance)
Inktomi réalise donc un crawl avant de
publier les résultats du crawl
précédent. Ce type de fonctionnement
peut indiquer que la phase de calcul est
particulièrement longue.
Deux mois ont été nécessaires à Inktomi
pour publier le résultat du crawl, le
calcul pour la capture précédente avait
duré quatre mois. Cette différence explique
la soudaine 'fraîcheur' de la base de
données Inktomi. Les pages les plus
récentes de la mise à jour de décembre
datent de deux mois seulement.
|
|
Comparaison Inktomi / Altavista:
|
|
|
Depuis le 8 décembre les bases de données
des moteurs Atavista et Inktomi ont
sensiblement la même fraîcheur moyenne.
Cette similarité pourrait indiquer que les
deux bases sont identiques ou construites à
partir des mêmes documents (crawl commun).
Les courbes suivantes permettent une
comparaison du contenu de ces deux moteurs à
la même date (10 janvier 2004).
Les deux bases de données n'ayant pas la
même taille (revue du référencement, juin
2003 :
la taille des outils de recherche),
nous représentons sur l'axe vertical le
pourcentage de pages créées à une date donnée
qui sont référencées par l'outil. Cette
présentation permet une comparaison.(lecture
: 1.2% des pages référencées par Inktomi
dans les 250 derniers jours ont été crées le
1er octobre)

Il apparaît clairement sur ces
courbes que Inktomi n'utilise pas la même
base de données qu'Altavista.
Le crawl d'Inktomi est plus jeune d'environ
un mois mais il contient aussi une partie
d'un crawl plus ancien. Ces deux facteurs
créent une moyenne identique mais il ne
s'agit que d'une coïncidence.
|
| |
voir aussi :
octobre 2003 : La danse Altavista à la loupe
|
|
décembre 2003 :
1 an de référencement avec Google |