Logo de l'Osil

 

 Affiner la recherche


Parce que les moteurs de recherche sont basés sur des index composés d'un nombre inimaginable de mot, leur interrogation peut offrir des résultats assez aléatoires, pas toujours pertinents, et souvent trop nombreux. Dans cette rubrique, nous résumons les différents moyens d'affiner la recherche. Ces méthodes sont présentes sur la plupart des grands moteurs de recherche (Google, Alatvista) à quelques exceptions prêts. Il est toujours conseillé de consulter la rubrique d'aide de chaque moteur pour s'informer des finesses propres à chacun d'eux.



 Les opérateurs booléens

Les opérateurs booléens sont des opérateurs qui permettent de spécifier un lien logique entre deux mots-clés d'une requête. Les booléens s'écrivent toujours en majuscule pour que le moteur puisse les différencier des mots de la requête. Un booléen ne porte que sur le mot-clé suivant. On peut tout à fait contraindre les booléens et les imbriquer en utilisant des parenthèses.


AND :
Opérateur booléen qui permet de spécifier la relation d'inclusion entre les deux mots clés. Dans l'exemple ci-contre, la requête poverty AND crime permet de chercher toutes les pages où les deux mots s'y trouvent simultanément. A noter que AND est généralement l'opérateur par défaut de tous les principaux moteurs de recherche. N.B. AND est parfois remplacé par le signe + .



OR :
Opérateur booléen qui permet de chercher un mot-clé ou un autre, dans une relation correspondant à un "ou" inclusif. Dans l'exemple ci-contre, la requête college OR university recherchera soit des documents qui contiennent le mot college, soit des documents qui contiennent le mot university, soit des documents qui contiennent les deux. Généralement, c'est opérateur à pour effet d'augmenter les résultats de la recherche, mais la couverture est plus grande. Il peut être parfois très utile pour rechercher des synonymes (glossaire OR lexique), ou dans le cas de pluriel irrégulier (woman OR women).

AND NOT ou NOT :
Cet opérateur booléen permet d'exclure un terme de la recherche. Dans l'exemple ci-contre, cats AND NOT dogs ,le moteur recherchera les pages contenant le mot cats sans contenir le mot dogs. Cet opérateur est particulièrement utile pour restreindre une recherche contenant un mot polysémique. Par exemple, si l'on cherche des recettes d'avocat, on peut restreindre la recherche en tapant: avocat AND NOT justice AND NOT bareau . N.B. AND NOT est parfois remplacé par le signe - .


booléens imbriqués
Les booléens imbriqués :
Evidemment, on peut tout à fait imbriquer plusieurs booléens. Pour ce faire, il faut utiliser les parenthèses. Ainsi, l'exemple ci-contre correspond à la requête (A OR B) AND NOT C.

Les guillemets

 
La principale utilisation des guillemets est le traitement de l'adjacence. Deux mots d'une requête peuvent se trouver n'importe où dans le document. Si l'on ajoute des guillemets, cela indique au moteur que l'on veut la chaîne de caractère telle quelle. La requête "banque de sang" permet de trouver l'expression exacte. Cette méthode est particulièrement utile pour checher des noms propres, comme par exemple "Samuel Schmidt".
Dans Altavista, les guillemets présentent également l'avantage de tenir compte de la casse. Ainsi, ce moteur de recherche interprète différement "Tours" et "tours". Ceci est particulièrement utile pour les noms de ville qui sont aussi des noms comuns .


La troncature

La troncature permet de faire une recherche en ne spécifiant pas le ou les derniers caractères d'un mot à l'aide de l'astérisque ( * ).
Cette méthode permet notamment de rechercher des mots en incluant leur flexion ( maison* recherchera les pages contenant les mots maison ou maisons. Ceci s'avère particulièrement utile pour des mots dont seul la terminaison spécifie la langue. Ainsi la recherche gloss* trouvera des pages anglaises (glossary ou glossaries) des pages françaises (glossaire ou glossaires), des pages italiennes ((glossario ou glossari), etc... .

La recherche par champs

Les pages web sont écrites dans un langage codé (le language HTML). Dans ce code se trouvent un grand nombre d'information qu'il est possible d'interroger en priorité pour contraindre la recherche. Par exemple, chaque page possède un titre souvent suffisamment explicite.
Ainsi, lorsque l'on cherche un glossaire terminologique sur l'informatique, il y a de fortes chances pour que les pages qui nous intéressent aient dans leur titre le mot glossaire. Ainsi, on peut restreindre la recherche sur le titre en tapant intitle:glossaire informatique . La balise intitle: permet de contraindre la recherche du mot qui suit dans les titres des pages. Mais attention, pour chaque moteur existe une syntaxe différente. Nous présentons ci-dessous un résumé des balises pour les deux moteurs principaux.
Altavista
Google
title: recherche dans le titre du document
url: recherche dans l’adresse du document
link: recherche dans les liens vers d’autres documents
host: recherche dans les pages d’un serveur donné (p. ex: admin.ch)
domain: recherche dans les domaines spécifiés (.ch, .de, .it, .com, . )
image: recherche dans le nom des images

related: pages similaires à la page pointée
intitle: dans le titre
allintitle: tous les mots de la requête se trouvent dans le titre
inurl: dans l’URL
allinurl: tous les mots de la requête se trouvent dans l’URL
link: pages liées à la page pointée
site: sur un site particulier (admin.ch) ou dans un domaine particulier

Combiner les méthodes

Toutes ces méthodes peuvent aisément  se combiner. Ainsi, plus la requête sera complexe, plus les résultats seront fins. Par exemple, pour chercher un glossaire sur l'aéronautique qui est en allemand et en français  (la Belgique et la Suisse ont souvent des pages bilingues), on peut essayer la requête suivante:
(avec altavista): title: gloss*  AND aeronauti* AND (domain:.ch OR domain:.be)


Last modified: Mon Dec 8 15:40:28 MET 2003
Bruno Cartoni