Chargement de la fenêtre
Chargement des résultats
Ce moteur-ci s'appelle "clusty", et son nom suggère ce qu'il fait : Après exécution de votre requête, la liste des résultats est passée au crible d'un
algorithme de "clustering". Ainsi toutes les entrées qui se ressemblent par l'emploi du vocabulaire sont regroupées dans une catégorie appelée "cluster" et mentionnée en gras à gauche.
Un bon moteur de recherche se distingue d'abord par le nombre de pages stockées, c'est-à-dire sa couverture. Cela justifie par exemple la prédominance de Google et de Yahoo, mais pas la discrétion d'AltaVista, qui a sensiblement la même couverture que Google et des principes algorithmiques similaires. De plus en plus, la deuxième exigence portant sur un moteur est le traitement qu'il effectue sur les résultats. D'une couverture de plusieurs milliards de pages, la requête d'un utilisateur en extrait quelques dizaines, centaines ou milliers. Comment naviguer parmi ces résultats ?
- La première idée est de disposer d'un critère de pertinence, de sorte que les pages réputées les plus intéressantes pour l'utilisateur sortent en premier. On préjuge ainsi des intentions de l'utilisateur, ce qui explique le succès relatif des différents moteurs concurrents (démarche a priori).
- La seconde idée est d'analyser à la volée l'ensemble des résultats pour y déceler des structures permettant l'examen global et la navigation (démarche a posteriori). C'est précisément ce que je propose dans les liens qui suivent
Enfin, pour financer tous ces travaux d'extension de la couverture ou de traitement des résultats, les fournisseurs d'information se rétribuent soit avec de la publicité insérée dans les résultats, soit en vendant un clone de leur moteur à destination des réseaux d'entreprise. J'ai pu programmer la mise en place de ces moteurs sur le site en acceptant la première solution.