| Le 26 mars 2004 les utilisateurs du moteur de recherche Alltheweb.com ont vu
les résultats proposés par l'outil changer brusquement. Nous étudions
graphiquement cette évolution afin de déterminer d'où proviennent les nouveaux
résultats Alltheweb.
Surprise, il semble que Yahoo ne se contente pas de remplacer Alltheweb mais
utilise l'ancienne base Alltheweb dans ses propres résultats. |
page 1/4 : La toute première Yahoo-Dance
page 2/4 : La disparition de la base Altavista
page 3/4 : L'intégration des pages référencées par Alltheweb
page 4/4 : Le nouveau Google est plus frais !
|
| 1 - La disparition
de la technologie FAST/Alltheweb |
| Le 26 mars Yahoo Search Technology (YST)
est mise en place sur le portail Alltheweb.com |
|
Le graphique ci-dessous représente le contenu de la base du moteur Alltheweb entre le
24
mars et le 15 Avril. Chaque courbe indique le nombre de pages référencées par le
moteur dont la date de création est indiquée sur l'axe horizontal.

|
- Jusqu'au 26 mars la courbe représente ce que nous connaissons de la base
Alltheweb que nous avons eu l'occasion d'étudier à de nombreuses reprises.
(voir
la
revue du référencement de mars, les bases fraîches).
- Le 26 mars la base de données est mise à jour. La courbe indique
un changement inhabituel dans la distribution des pages référencées.
- La courbe est identique à celle observée dans le moteur du portail
Yahoo, elle est identique aussi à ce que nous observerons pour Altavista 5
jours plus tard.
- Le changement par rapport à l'ancienne base n'est pour autant pas très
marqué, ce qui pourrait indiquer que la base de données de Yahoo a intégrée
les pages indexées par Alltheweb avant de remplacer le moteur.
- Les pages ont été capturées à nouveau par Yahoo à partir de la liste
des Urls référencées dans Alltheweb, ce qui explique la légère
différence après la mise à jour. Cette capture a du être nécessaire afin de
construire la base de documents utilisée pour présenter la version 'en
cache' proposée dans les pages de résultats.
- Seules les urls les plus récentes, datant du dernier crawl de Alltheweb
ont été utilisées, les plus anciennes ont été ignorées.
|
| 2 - Conséquences sur
la fraîcheur des résultats Alltheweb |
|
Le graphique ci-dessous représente l'évolution de l'age moyen des pages
indexées dans la base de données du moteur Alltheweb depuis le 1er janvier.
L'age moyen est calculé pour des pages créées durant les 250 jours précédant la
mesure.

- Le graphique indique que la dernière mise à jour de la base de données
du moteur datait du 14 janvier 2004. A cette date l'age moyen des pages
référencées était de 147 jours (environ 5 mois)
- Depuis cette mise à jour la base de données a vieillit progressivement
pour atteindre 160 jours.
- Le remplacement de la base par les données issues de Yahoo permet un
rajeunissement sensible des informations présentées aux internautes. L'age
moyen des pages référencées au 26 mars est de 147 jours.
|
| 3- Conséquences pour
le référencement dans Alltheweb |
|
- Alltheweb utilise les pages référencées dans le moteur Yahoo et ne
dispose probablement plus de son propre crawler (les prochaines études
pourront confirmer ce point). Le référencement dans la base Yahoo est donc
la première condition pour apparaître dans les résultats du portail
Alltheweb.
- Le nombre de réponses proposées par Alltheweb est cependant inférieur à
ce que nous obtenons, pour les mêmes recherches, avec Yahoo. Une sélection
doit donc être effectuée pour le référencement dans l'outil.
- Encore une fois les réponses proposées par les deux portails ne sont pas
identiques et il est probable qu'Alltheweb continue à utiliser des critères
de classements et des options de recherche différents .
|
|
suite : Le nouveau Google est plus frais ! |