|
|
|
 |
| Zoom sur... |
| La mécanique quantique au service des outils de recherche d'information
|
 |
La Recherche d'Information est devenue au fil du temps une véritable science, mais ses applications précèdent souvent l'édification des théories qui expliquent les mécanismes sous jacents. Les méthodes les plus utilisées par les moteurs de recherche grand public sont d'ailleurs souvent critiquées pour leur manque de solidité sur le plan théorique.
A l'heure actuelle, les chercheurs ont élaboré trois grandes familles de modèles théoriques pour la recherche d'information : les espaces vectoriels (Salton), le modèle probabiliste, et le modèle logique. Chaque modèle a permis d'élaborer des méthodes pour extraire des informations pertinentes d'un corpus en réponse à une requête donnée. Mais à chaque fois, le modèle révèle des limites, et les chercheurs les plus en pointe dans ce domaine rêvent d'une théorie unificatrice, certains estimant avoir besoin des résultats des trois modèles pour obtenir des outils de recherche performant.
L'analogie quantique
C. J. van Rijsbergen, l'un des spécialistes les plus connus dans ce domaine, s'est mis lui aussi en quête de cette théorie unificatrice. Mais existe t'il un paradigme dans lequel on retrouve à la fois des espaces vectoriels, des mathématiques probabilistes et une forte prégnance de la logique formelle ?
La réponse est oui : l'analogie avec les mathématiques à la base de la Mécanique Quantique a sauté aux yeux de l'universitaire du Groupe de Glasgow.
Les travaux de van Rijsbergen démontrent que l'on peut représenter un document comme un vecteur dans un espace de Hilbert. A partir de là, les mathématiques appliquées aux espaces de Hilbert comme les opérateurs Hermitiens peuvent être utilisées pour fournir des informations sur ce qui est observable, comme la pertinence, ou l' à propos des résultats trouvés.
Les résultats obtenus démontrent que les mathématiques de la mécanique quantique fournissent une série d'outils très commodes pour décrire l'univers de la recherche d'information. Par exemple, le théorème de Gleason, qui permet de construire un algorithme de calcul des probabilité dans un sous espace de Hilbert, et qui joue un rôle majeur en mécanique quantique, peut aussi être utilisé pour effectuer des calculs de probabilités dans un outil de recherche. D'une manière générale, les théorèmes standards sur les espaces de Hilbert fournissent directement des résultats exploitables pour décrire de manière différente les mécanismes à l'oeuvre dans les problèmes de retour de pertinence, ou de "pseudo relevance feedback", ou de pertinence ostensive (dans lequel la mesure de l'incertitude joue un rôle clé).
Si la mécanique quantique est une théorie physique, c'est à dire censée décrire l'univers qui nous entoure, il s'agit surtout d'un modèle mathématique, qui peut donc tout à fait être utilisée pour décrire un univers artificiel, comme celui dans lequel baignent les outils de recherche. Les épistémologues et les cosmologistes glosent toujours d'ailleurs sur le caractère "réel" des phénomènes prévus par les équations de la mécanique quantique.
[illustration possible : http://talbot.lsmc.u-bordeaux.fr/~pab/illustrations/ ]
Les développements possibles de cette théorie
La supériorité de la Mécanique Quantique sur les modèles classiques semble réelle dès que l'on touche à des notions difficiles comme les problèmes de pertinence ou la mesure de l'incertitude. Le Groupe de Glasgow a déjà montré que l'on pouvait définir plusieurs manières de décrire la pertinence au sein du cadre théorique quantique, et que cela fournissait à chaque fois des pistes prometteuses pour manipuler ce concept qui restait "flou" dans les modèles classiques.
Cet axe de recherche reste pour le moment embryonnaire : mais il est possible qu'il soit à la base d'une première théorie complète décrivant l'univers de la recherche d'information.
Philippe YONNET
[encadré bio : C.J. van RIJSBERGEN]
C. J. "Keith" van Rijsbergen (Cornelis Joost van Rijsbergen) est professeur d'informatique. Il est l'animateur du Glasgow Information Retrieval Group au sein de l'université de Glasgow. Il est l'un des pères fondateurs des théories modernes sur la recherche d'infomation, et l'auteur de la monographie "Information Retrieval" et du livre "The Geometry of Information Retrieval". En 2003 il a été admis comme membre éminent de l'Association for Computing Machinery.
Photo disponible
[fin encadré bio]
BIBLIOGRAPHIE
RIJSBERGEN C. J. van; The geometry of information retrieval Cambridge University Press
K. van Rijsbergen: Information Retrieval. Butterworths, London (UK), 1979.
R. Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval. ACM Press, New York (NY), 1999.
G. Salton: Automatic Text Processing. Addison-Wesley, Reading (MA), 1989.
Bernard d'Espagnat : "Le réel voilé, Analyse des concepts quantiques", Fayard, 1994
POUR EN SAVOIR PLUS
The Glasgow Information Retrieval Group : http://ir.dcs.gla.ac.uk/
|
|
|