Il existe une énorme quantité d'informations sur Internet (plusieurs millions ou milliards
de documents), et ces informations sont pour la plupart renouvelées quotidiennement.
Le moteur de recherche est un élément indispensable pour s'y retrouver!
Le moteur de recherche (Searchbot en anglais) est une machine spécifique (matérielle et logicielle) qui visite les sites, les indexe,
les trie, afin que vous puissiez trouver les documents que vous cherchez.
Or des documents apparaissent et disparaissent tous les jours, il faut donc constamment réactualiser
cette base de données. Ainsi, aucun moteur de recherche ne peut parcourir la totalité des pages
en un jour (ce processus peut prendre plusieurs semaines). Chacun adopte donc sa propre
stratégie, certains vont même jusqu'à calculer la fréquence de mise
à jour des sites.
Des robots (logiciels) parcourent des millions de pages Web, et associent l'adresse à des
mots clés qui ont soit été définis en en-tête de la page, soit en piochant
des mots dans la page.
Lorsque l'utilisateur d'un moteur remplit le formulaire, il spécifie les mots qu'il cherche (éventuellement
ceux qu'il ne souhaite pas) grâce aux opérateurs booléens "et", "ou", "non" ... (symbolisés par +, -,...), la requête est envoyée
au moteur qui consulte ses bases de données pour chacun des mots puis affine la recherche en enlevant les pages ne convenant pas,
puis retourne une liste de liens vers des pages, avec le début du texte de la page ou le texte spécifié par le créateur
de la page dans des balises spéciales, appelées méta-tags.
Ces réponses sont classées dans un ordre de pertinence, c'est-à-dire le pourcentage de mots correspondants à vos
critères, et leur indice de densité (le nombre de fois que le moteur a trouvé un de vos mots clés dans la page).
|