Administration et communication

Sommaire des productions

BTS Assistant de gestion de PME-PMI  /
  Application bureautique et informatique
La différence entre Moteurs de recherche et Annuaires

L'objet de ce document est la recherche d'un site Web ou de pages sur un site, susceptibles de nous fournir une information dont on a besoin. Il ne s'agit pas de la consultation d'une banque de données particulière en ligne sur Internet.

Ce document s'inspire largement d'une documentation d'aide en ligne, de Wanadoo d'une part et du site de la Bibliothèque de l'Université de Laval (Canada), d'autre part.

1 - Les annuaires : la recherche est guidée

2 - Les moteurs de recherche : la recherche est libre

3 - Les agents intelligents

4 - Les multi-moteurs (ou méta-index)


Il est important de bien délimiter son sujet. En fonction du sujet, on recherchera plutôt dans un Annuaire ou plutôt avec un Moteur de recherche. En effet deux catégories de services se partagent la recherche de l'information sur Internet.

D'apparence similaire, ce sont tous les deux des sites Web dotés d'une fenêtre de saisie (ou formulaire de saisie) destinée à recueillir l'objet de votre requête. Les deux outils se distinguent cependant par leur façon de recenser et d'organiser l'information disponible sur le Web. Ils se ressemblent aussi dans leur façon de donner l'information in-fine : une liste de services susceptibles d'offrir les pages d'information voulues.

Certains services offrent les deux systèmes.

Le haut de l'écran correspond à la recherche dans un annuaire et le bas, à la recherche avec un moteur de recherche.

1. La recherche guidée dans les annuaires

Les annuaires sélectionnent les sites et les rangent dans des catégories thématiques (finances, sports, tourisme, etc.). Celles-ci, qui sont cliquables, vont du plus large au plus précis. Par exemple, la rubrique principale "Santé" de Yahoo donne naissance à une trentaine de sous-catégories ("Assurances", "Hôpitaux", "Magazines", etc.) qui elles-mêmes se divisent en plusieurs autres parties et ainsi de suite.

Outre la navigation, certains de ces grands catalogues offrent aussi une fonction de recherche par interrogation à l'aide d'un formulaire de recherche. Leur contenu est donc indexé par des personnes et non par des robots informatiques. Le contenu de leurs bases est certes moins considérable que celui amassé par un robot, mais leurs bases sont plus cohérentes et posent moins de problèmes de bruit au moment de la recherche.

 

Si vos idées de recherche sont vagues, cliquez sur une rubrique et laissez-vous guider.

Si votre recherche est générale (le droit constitutionnel ou la musique créole), posez votre question dans le formulaire d'un annuaire. Vous serez ainsi orienté et les sites sélectionnés correspondront toujours à votre recherche initiale.

 Les annuaires utilisent la syntaxe logique mais leur fonctionnement est en général beaucoup plus intuitif que sur les moteurs. Ils s'accommodent très bien de la recherche "jazz piano" sans qu'il y ait besoin d'ajouter "+" ou bien "ET".

 Autre truc : si vous avez trouvé une adresse intéressante avec une recherche par mots-clés, cliquez sur la rubrique associée pour voir s'il existe d'autres sites du même type.

Si votre recherche est pointue, par exemple : la Documentation en ligne de l'Institut d'Etudes Politique de la ville de ..., il faut faire une recherche croisée qui combine les deux approches précédentes en associant leurs avantages (voir l'exemple donné par Wanadoo).

- Yahoo!  (cliquer pour aller à la présentation de ce service de recherche).
C'est un bon annuaire. De plus, ce site est doté d'un bon interface de recherche par interrogation à l'aide d'un formulaire. Il est associé à Alta Vista, puissant moteur de recherche sur lecontenu des pages (voir ci-dessous). Pour le monde francophone, il y a Yahoo.fr.

 

2. Les moteurs de recherche

Un "moteur de recherche" comporte trois modules : l'explorateur de sites, l'indexeur des pages lues, le fournisseur de réponses. Un moteur de recherche gère une banque immense constituée automatiquement par le "robot informatique" (des programmes) de l'explorateur qui visite automatiquement les sites serveurs sur WWW.
Toutes les pages Web visitées sont indexées automatiquement.   On ne sait pas si les robots parcourent les sites de tous les pays et en toutes les langues. Les fréquences de mise à jour varient selon les robots. L'indexation change aussi selon les robots et n'est pas toujours précisée. C'est pourquoi on trouve une quantité non négligeable d'adresses URL périmées dans les résultats de recherches.

 

2.1 - Comment lancer la recherche ?

Pour une recherche pointue, on utilise un moteur de recherche. Mais attention, pour ne pas être submergé par les "bruits", c'est à dire des réponses non pertinenetes, on doit formuler la requête avec précision.

Vous disposez pour cela d'opérateurs logiques et d'éléments de syntaxe. Les plus connus sont les "opérateurs booléens". Il s'agit de mots ou de signes (ET, OU, +, -...) destinés à filtrer logiquement la recherche. Ainsi, si vous entrez les mots "jazz + piano" dans une fenêtre de recherche, le moteur vous sortira toutes les pages où ces deux mots figurent. Chaque moteur possède sa propre façon d'utiliser les opérateurs. Lisez attentivement leur rubrique d'aide.

Plusieurs serveurs de recherche peuvent lancer une recherche sur une phrase ou un groupe de mots. Si vous êtes en quête de sites sur les vins de la Loire, par exemple, n'entrez pas à la suite les quatre mots vins de la loire (la majuscule n'a pas d'importance). Le moteur recherchera en effet séparément chaque mot significatif c'est à dire vin et loire et vous obtiendrez des centaines de réponses dont beaucoup sont sans rapport avec votre sujet. Tapez plutôt "vins de la Loire" entre guillemets, le serveur affichera uniquement les pages contenant la phrase entière.

 

2.2 - Les principaux sites de moteur de recherche

- Alta Vista

Nous mentionnons ce site en premier car il reçoit les meilleures critiques, tant pour son vaste contenu que pour sa procédure de recherche. Le contenu est mis à jour quotidiennement. Remarquez qu'il offre la possibilité de chercher dans deux banques distinctes: "The Web" pour les pages des sites W3 et "Usenet" pour les forums de discussion. Il offre aussi deux niveaux de procédure de recherche: "Simple query" et "Advanced query", chacune des formules étant documentée par des pages d'aide. AltaVista indexe le contenu entier des documents. Le bruit y est élevé.

- HotBot

Avec 10 millions de pages W3 indexées par jour, HotBot se présente comme "le robot le plus rapide au monde". Interface d'utilisation particulièrement bien développée (choix de couleurs discutable), avec fonction d'aide exceptionnelle. Plusieurs modes de recherche. Permet l'utilisation d'opérateurs logiques (booléens) et de parenthèses, mais il n'y a pas d'opérateur de proximité. La recherche peut être limitée par l'ajout de critères secondaires.

- Infoseek

Maintenant avec deux modes : ultrasmart et ultraseek. Le premier est un formulaire d'interrogation couplé à un répertoire alors que le second n'inclut que le formulaire. Banques de données multiples incluant nouvelles et profils de compagnies. Logique booléene permise selon un format particulier. Le OU est l'opérateur par défaut. En précédent le mot d'un "+", on optient le ET, le "-" donne le SAUF. Par exemple si on entre science, le document peut contenir le mot science ; avec +science, le document doit contenir ce mot ; avec -science, le document doit ne pas contenir ce mot. À l'affichage des résultats, le système pourra lister, dans la colonne de gauche, des profils de compagnies selon la pertinence avec l'énoncé de recherche.

- Yahoo! (cliquer pour aller à la présentation de ce service de recherche). Ce site, déjà présenté plus haut, est doté d'un bon interface de recherche par interrogation à l'aide d'un formulaire. Pour le monde francophone, il y a Yahoo.fr. De plus, c'est un bon annuaire.

- Open Text's Livelink Pinstripe

Recherche sur les sites intéressants pour le monde des affaires. Outil mettant l'accent sur l'indexation du texte intégral des pages W3. Bonne recherche booléenne, 2 niveaux: "Simple search", "Power search" pour des recherches booléennes plus complexes avec possibilité de spécifier pour chaque terme dans quel champ effectuer la recherche. Chaque mode de recherche est explicité dans des pages d'aide. Mise à jour quotidienne.

- Lycos

Une autre banque de données très vaste. En plus des pages W3, Lycos indexe les documents en mode Gopher et les sites FTP. Recherche booléenne minimale et peu documentée. Cliquer sur "Search options" pour une recherche un peu plus complexe. Vous pouvez limiter la réponse à un maximum de 40 documents, 10 par défaut. Lycos se limite à une indexation partielle des documents.

 

3. Les agents intelligents

Vous pouvez aussi vous servir de logiciels pour vous assister dans vos recherches. Les agents intelligents sont là pour ça. Ces programmes que vous installez sur votre ordinateur fonctionnent un peu comme les sites de recherche sauf que vous formulez votre requête hors connexion. Quand vous avez tapé vos mots-clés, le logiciel se connecte à plusieurs annuaires ou moteurs de recherche, trie et met en forme le résultat et le sauvegarde sur votre disque dur. Vous avez alors tout le temps de consulter les réponses.

D'autres agents peuvent aussi explorer votre cache (les pages Web que vous avez visitées et qui restent stockées dans votre disque). Vous restez cependant limité aux sites consultés récemment.

 

4. Les multi-moteurs (ou méta-index)

Si votre demande est très ciblée, vous pouvez essayer un multi-moteurs (ou méta-index). Ces services de recherche interrogent simultanément (un seul formulaire est rempli) plusieurs moteurs ou annuaires et trient le résultat. Cela évite d'interroger plusieurs serveurs à la suite si les résultats ne sont pas satisfaisants. En revanche, on perd un peu en rapidité et les requêtes doivent rester simples pour s'adapter à tous les moteurs.

SavvySearch peut accéder à presqu'une trentaine de moteurs ou annuaires. Il y a une interface en français. Une option de recherche permet l'élimination des doublons.

MetaCrawler se limite aux sept outils de recherche les plus importants. Le système possède une option Java permettant de contrôler l'exécusion de la recherche, ainsi qu'un mode de recherche rapide.

D'autres multi-moteurs existent.


Les compilations de plusieurs outils de recherche

Puisqu'il faut souvent effectuer une recherche d'information dans les formulaires de plusieurs outils de recherche, certains sites ont regroupé les outils de recherche. C'est pratique. Mais, il ne faut pas oublier que les outils ont chacun leurs particularités. Les compilations deviennent donc utiles une fois que l'on s'est familiarisé d'abord avec chaque outil individuellement avant de les utiliser ensemble.


Exemple de recherche historique

Cet exemple est fourni par le guide en ligne de Wanadoo. Il peut être transposé à des situations de recherche en entreprise.

AltaVista utilise deux modes de recherche : une simple (par défaut) et une évoluée. Cette dernière autorise l'emploi d'opérateurs et de syntaxes d'expression évolués, permet de spécifier une date et de classer les résultats. Imaginons un internaute en quête de sites historiques sur la dynastie Ming. Ne trouvant rien de satisfaisant dans des guides de recherche comme Yahoo !, il tente une recherche simple dans AltaVista avec les mots dynastie ming. Le moteur lui retourne 5 000 sites avec beaucoup de réponses non satisfaisantes. Il lance alors une requête évoluée en cliquant sur l'option "Evoluée" dans la barre de navigation d'AltaVista. Il entre les mots dynasti* AND ming. La troncature (astérisque) permet de rajouter jusqu'à trois lettres à la racine d'un mot. Ainsi il est certain qu'AltaVista cherchera les mots dynastie et dynasties. Le AND (AltaVista est un moteur anglophone, les opérateurs sont donc en anglais) lui garantit que les deux termes figureront ensemble dans une même page. Cette deuxième tentative se solde par la récolte de 900 documents dont beaucoup ne conviennent pas. Il faut encore affiner.

La recherche est de nouveau lancée avec les mots dynasti* AND ming AND histoire.

Ce dernier terme garantit que figureront des pages en français. AltaVista propose 40 documents, un résultat exploitable. Parmi ceux-ci, notre internaute trouve plusieurs pages en français traitant historiquement de cette période.


Retour au Sommaire des productions pédagogiques

Retour à l'Accueil de la spécialité

http://www:ac-grenoble.fr/ecogest/pedago/administration/prodpeda/recherche.htm