Comprendre le fonctionnement des moteurs de recherche

De Wikizen
Aller à : navigation, rechercher

Notes et ressources

Startpage et à son propos


Le(s) moteur(s) de recherche


Il faut de préciser que la notion de moteur de recherche (définie comme un programme qui indexe de façon automatisée le contenu de différentes

ressources Internet permettant à l'internaute de rechercher de l'information via des mots clés) ne prend pas en compte les annuaires, les logiciels client ou encore les métas moteurs.

L'indexation des données collectées est la deuxième étape. C'est le classement automatique des mots rencontrés dans un index. Pour chaque terme utilisé dans

un site, un poids est attribué en fonction de l'endroit où il a été trouvé. Par exemple, le mot aura plus d'importance dans le titre

que dans le corps même du texte. A noter que comme lors de la recherche, une liste de mots est automatiquement exclue dont les articles "le", "la"

Enfin, le traitement des requêtes et le ranking (classement en français) constituent la troisième étape. Selon les critères attribués

lors de l'indexation et selon l'algorithme du moteur, les résultats sont triés automatiquement. Les algorithmes, protégés par leurs auteurs,

diffèrent selon chaque moteur, ce qui explique les disparités des réponses entre eux.

plus le mot apparaît dans le texte d'une page Web, plus cette page aura de chances de ressortir lors d'une requête et l'indice de popularité, qui mesure le nombre de liens amenant vers le site.


Moteur de recherche sémantique


L’analyse sémantique utilise l’occurrence de termes similaires dans la recherche de résultats. Cette évolution vise à améliorer les résultats présentés par un moteur de recherche en se focalisant sur le

sens d’une requête et non strictement sur l’expression recherchée. Le mot ‘voyage’ est ainsi automatiquement associé à des termes sémantiquement proches comme ‘vacances'.

Les annuaires (directory) sont souvent assimilés, à tord, aux moteurs de recherche. Au contraire des moteurs, ils sont créés manuellement. Ce sont des personnes, et non des robots, qui parcourent internet

et référencient dans leur annuaire des sites jugés pertinents pour leur thématique.

Cet outil réalise un inventaire, généralisé ou spécialisé, qui répertorie des sites classés dans des catégories. Il existe par exemple des annuaires spécialisés sur la Belgique, les produits durables ou la

photographie. Un annuaire est ainsi composé d’un nombre importants de liens hypertextes menant vers d’autres sites web ou catégories de l’annuaire.








Cette page est entretenue par Utilisateur: Joël Méreau