Introduction

Cette page explique comment rechercher une page sur Wikipédia. Pour trouver une page, vous pouvez utiliser les méthodes suivantes :

  • Naviguer de page en page en utilisant les liens et les catégories.
  • Entrer le nom désiré dans la boîte de recherche à gauche, et cliquer sur « Consulter » : vous arrivez directement sur la page avec ce nom, si elle existe. Voir Aide:Consultation pour les détails.
  • Entrer le nom désiré dans la boîte de recherche à gauche, et cliquer sur « Rechercher » : une recherche est lancée, les résultats montrent les pages s'approchant le plus de votre recherche. Cette page décrit comment utiliser la recherche au mieux.


Par défaut, les recherches se font avec la recherche interne de Wikipédia. Celle-ci possède trois inconvénients principaux :

  1. Étant toujours en développement, elle peut donner des résultats non pertinents.
  2. Les accents sont ignorés, ce qui facilite la recherche mais empêche de trouver les fautes d'accentuation.
  3. La mise à jour de l'index a été récemment améliorée, mais les articles les plus récents (créés dans les deux derniers jours) peuvent ne pas apparaître dans les résultats. Il est toutefois plus à jour que la plupart des moteurs externes.

Utiliser la recherche interne

La recherche interne va donner une liste de pages, où les termes recherchés apparaissent. Ils peuvent apparaître dans le titre de la page, dans le corps de la page, ou encore être le titre d'une redirection vers une autre page.

Par défaut, la recherche interne trouve les pages comprenant tous les mots cherchés. Si vous cherchez « machin truc », vous trouverez les pages contenant à la fois « machin » et « truc ». Pour trouver les pages contenant « machin », « truc » ou les deux termes ensemble, il faut chercher « machin OR truc ».

Le moteur propose parfois une suggestion d'orthographe qui peut donner davantage de résultats.

Majuscules et minuscules, accents, nombres

La recherche interne ne différencie pas majuscules et minuscules : chercher « CANADA », « canada » ou « CaNAda » donnera les mêmes résultats. De même, la recherche ignore les lettres accentuées : chercher « éléphant », « elephant » donnera les mêmes résultats. Cette fonctionnalité permet de trouver plus facilement les articles utilisant des diacritiques, mais empêche de rechercher les fautes d'orthographe (ceci est actuellement à l'étude, en attendant utilisez un moteur externe).

Il est possible de chercher des nombres, bien que rechercher un nombre avec moins de quatre chiffres risque ne pas donner de résultats très pertinents. Certains caractères spéciaux, et notamment les apostrophes, peuvent poser problème lors de la recherche : essayez de supprimer l'apostrophe ou de la remplacer par une espace.

Choix des mots-clés

Certains termes courants sont ignorés, comme les mots « le », « la », « de », « et », etc. ; de manière générale, évitez d'utiliser des mots courants (« quand », « tout », « pourquoi », etc.) : le plus souvent, les résultats ne seront pas pertinents ou trop nombreux. Sur Médiawiki comme avec d'autres moteurs, il vaut mieux privilégier les mots-clés précis.

Pour inclure tout de même un mot normalement ignoré, ajouter le signe « + » devant lui. Exemple : en cherchant « Louis XI », le « X » risque d'être ignoré ; il vaut mieux rechercher « Louis +XI » pour de meilleurs résultats. Il est aussi possible d'encadrer l'expression de guillemets droits : ainsi, la recherche porte sur l'expression exacte (dans ce cas, il faudrait rechercher « Louis XI » ».

Opérateurs

Opérateurs généraux

Les opérateurs suivants sont utilisables : AND, OR, + et -.

  • AND cherche les pages où les deux termes sont présents, c'est le comportement par défaut : « Zoophilie AND Loi » ne trouvera que les pages contenant à la fois « Zoophilie » et « Loi », et donne le même résultat que « Zoophilie Loi »
  • OR cherche les pages où un des deux termes est présent, et les pages où les deux termes sont présents : « Zoophilie OR Loi » trouve les pages contenant « Zoophilie », celles contenant « Loi », et celles contenant les deux termes.
  • « + » force la recherche à prendre en compte un mot. Exemple : « Zoophilie + Loi » trouve les pages contenant obligatoirement « Zoophilie » et éventuellement « Loi ».
  • « - » permet d'ignorer un mot. Exemple : « Zoophilie - Loi » cherche les pages contenant « Zoophilie » mais ne contenant pas « Loi ».
  • Les guillemets droits recherchent une expression exacte : « "Législation américaine" » trouvera les pages contenant les mots « Législation américaine » ensemble (contrairement à l'opérateur AND, avec lequel les mots peuvent être à différents endroits de la page mais pas nécessairement accolés).

Il est possible de combiner ces opérateurs grâce aux parenthèses : « (Législation AND Américaine) OR (Loi AND France) », par exemple.


Restreindre la recherche

Rechercher dans un titre seulement

En utilisant le mot-clé « intitle: », il est possible de ne rechercher que dans les titres d'articles et pas dans le contenu, ce qui permet d'obtenir des résultats plus ciblés. Par exemple « intitle:français » retourne moins de résultats que « français ».

Rechercher dans des pages commençant par...

Le mot-clé « prefix: » permet de rechercher un mot seulement dans les pages dont le titre commence par ce qui suit « prefix: ». Exemple : rechercher « chicon prefix:Wikipédia:Le Bistro » recherche toutes les pages dont le titre commence « Wikipédia:Le Bistro » et qui contiennent le mot « chicon ». Fonctionne aussi avec « endive », « pain au chocolat », etc.

Rechercher dans une catégorie

On peut limiter la recherche à une catégorie en utilisant le préfixe « incategory: »[1], suivi du nom exact de la catégorie. Par exemple, rechercher « Smith incategory:"Naissance en 1723" » trouvera les pages contenant « Smith » (dans le titre ou le contenu) et se trouvant dans la catégorie Naissance en 1723. Le nom exact de la catégorie doit être utilisé (le mieux étant de le copier-coller).

Avec les opérateurs, il est possible de croiser des catégories : « incategory:"Ministre français" AND incategory:"Décès en 2006" » trouve les ministres français morts en 2006, tandis que « incategory:"Bateau des années 1960" OR incategory:"Bateau des années 1970" » trouve les bateaux construits dans les années 1960 ou 1970.

D'autres outils peuvent être plus adaptés pour explorer les catégories, suivant vos besoins, comme intercat, pour croiser des catégories, ou les outils disponibles dans la « boîte à outils » visible sur chaque catégorie.

Rechercher dans un espace de noms

Pour chercher une page dans un espace de noms donné, utiliser la syntaxe suivante :

  • Rechercher « Utilisateur:Truc » pour trouver toutes les pages contenant « Truc » dans l'espace « Utilisateur: ».
  • Pour chercher dans plusieurs espaces de noms, les séparer avec une virgule : rechercher « Utilisateur,Aide,Discuter:Machin » va trouver les pages contenant « Machin » dans les espaces Utilisateur:, Aide: et Discuter:.
  • On peut aussi utiliser les numéros des espaces de noms, entre crochets : rechercher « [1,2,4]:machin » va trouver les pages contenant « machin » dans les espaces Discuter: (1), Utilisateur: (2) et Wikipédia: (4).
  • On peut utiliser des raccourcis[2], comme « wp:machin » pour « Wikipédia:machin ».
  • Le préfixe « tous: » sert à rechercher dans tous les espaces de noms en même temps (on peut aussi utiliser « tout: » ou « all: »[3]). Exemple « tous:trucmuche »

Sans précision, la recherche porte sur les espaces de noms que vous avez défini dans vos préférences, onglet « Recherche ». Pour les utilisateurs non enregistrés, la recherche ne porte par défaut que sur les articles (espace 0). Vous pouvez aussi utiliser les cases à cocher en bas de page.

Combiner tout ça

Il est possible de combiner tout ça pour faire des recherches vraiment poussées. Par exemple, « chicon AND endive intitle:juin prefix:Wikipédia:Le Bistro » (soit toutes les pages du bistro d'un mois de juin contenant à la fois endive et chicon), ou encore « incategory:"Naissance en 1922" intitle:Smith » (tous les Smith nés en 1922).

Fonctionnement détaillé de la recherche interne

Le moteur de recherche interne est Lucene Search 2.1. À intervalles réguliers, un « index » de la base de données est créé, et la recherche porte sur cet index. En créant l'index, certaines parties sont ignorées, d'autres sont converties (accents, majuscules, translittérations) ; les mots et les nombres sont séparés et indexés. Lors de la recherche, le moteur trouve les pages correspondant aux critères puis les trie en leur attribuant un « score ».

Contenu ignoré

Lors de la construction de l'index pour la recherche, l'intégralité des titres et du contenu des pages est inclus, sauf :

  • Les noms de modèles (mais leurs paramètres sont inclus) ;
  • Les paramètres des images comme thumb ou 200px (mais la légende et le nom de l'image sont inclus) ;
  • Les URL des liens externes (utiliser Special:Linksearch pour les chercher) ;
  • Le code XML ;
  • Les paramètres des tableaux.

Tri des résultats

Les pages sont triées selon plusieurs paramètres. En gros, une page obtient un score plus élevé et donc apparaît plus haut dans les résultats si :

  • son titre contient le mot recherché ;
  • le mot recherché est contenu plusieurs fois dans la page ;
  • la page a beaucoup de « liens entrants » depuis d'autres pages, avec le mot recherché (si ces liens sont situés au début des pages, le score augmente encore) ;
  • elle est longue ;
  • des redirections avec le mot recherché pointent vers cette page.

Lexémisation

Les mots, lors de la construction de l'index, sont lexémisés, c'est-à-dire réduits à l'état de radicaux[4]. Ceci permet de rechercher les formes infléchies des verbes et des noms assez facilement, de même que les féminins et les pluriels. Exemple : chercher « aimé » cherchera également les formes « aimée », « aimés », etc., sauf si l'on précise que l'on veut le mot exact, en l'encadrant de guillemets. La forme recherchée a toutefois priorité dans les résultats.

Redirections

Les redirections ne sont pas montrées par défaut dans les résultats ; leur destination, si elle est pertinente, est par contre affichée. Un option en bas de la page permet de les afficher explicitement.

La page existe, mais le moteur ne la trouve pas

Pour des raisons de performance, les changements très récents ne sont pas toujours pris en compte dans la recherche. À certains moments, le moteur de recherche peut utiliser un index qui n'est pas du tout mis à jour. Cette situation est temporaire.

Recherche dans Wikipédia avec Google

Google met à jour ses index environ une fois par mois, la recherche est donc fondée sur le contenu de Wikipédia à ce moment ainsi que sur le texte affiché par un navigateur, et non sur le texte source tel qu'il apparaît dans la boîte d'édition. La recherche avec Google est plus rapide que celle de Wikipédia.

Après avoir trouvé un article vous pouvez choisir de voir la version actuelle sur Wikipédia ou la version plus ancienne utilisée par Google.

Si vous utilisez fréquemment Google pour effectuer des recherches, vous pouvez envisager d'installer la barre d'outils Google.

Mais la façon la plus complète de rechercher dans Wikipédia avec Google est d'utiliser la page [1].

Notes

  1. Administrateurs : on peut définir des alias dans MediaWiki:Searchincategory, chaque alias sur une nouvelle ligne. Ne pas utiliser « catégorie », qui serait en conflit avec le préfixe pour cet espace de nom.
  2. Administrateurs : ils sont définis dans MediaWiki:Searchaliases.
  3. Administrateurs : cet alias est défini dans MediaWiki:Searchall. Mettre chaque alias sur une nouvelle ligne.
  4. L'algorithme détaillé se trouve sur cette page.

Voir aussi