Faire une recherche avancée dans un ou plusieurs documents PDF

Celles et ceux des lecteurs qui auraient suivi l’un de mes cours le savent, je suis une sorte de maniac de l’encouragement à l’usage des outils de recherche avancée quelle que soit la ressource dont il est question…

L’objet de ce bref billet est de vous montrer tout le temps que vous gagnerez à appliquer ce précepte avec les documents PDF numérisés en plein texte.

En effet, le logiciel de lecture de documents pdf d’adobe (Acrobat Reader) permet de faire une recherche avancée dont les résultats sont présentés de façon très utile.

Lorsque vous êtes dans un document, tapez « Ctrl+F » au clavier afin de faire apparaître le petit module de recherche (ici en haut à droite) :

Celui-ci est déjà très utile, mais il est possible d’aller un peu plus loin en cliquant sur la petite flèche qui pointe vers le bas :

En choisissant « Ouvrir la recherche avancée de Reader » (ce que vous pouvez faire en tapant directement au clavier « Maj+Ctrl+F) vous ouvez une nouvelle fenêtre, indépendante de votre document PDF en cours de lecture :

Je ne détaille pas les différentes possibilités de recherche, elles sont assez explicites ici, pour passer directement à l’affichage des résultats. En effet, les résultats s’affichent dans la fenêtre de recherche avancée, et vous permet de situer le résultat de votre recherche dans le contexte de sa phrase ce qui, le plus souvent vous évitera d’aller lire un paragraphe qui ne correspondra pas forcément à ce qui vous intéresse vraiment :

Dans l’exemple qui précède, j’ai effectué la recherche dans le document actif. Mais si vous le souhaitez, et c’est là que l’intérêt de l’outil prend tout son sens, vous pouvez lancer la recherche sur un dossier complet où vous aurez préalablement réuni votre documentation.

La présentation des résultats vous permet d’identifier les fichiers où les termes recherchés ont été trouvés, ici encore dans leur contexte. Un simple clic sur l’un des résultats ouvre le fichier en question à la page de l’occurrence :

Comme vous pouvez le constater dans les exemples choisis ici, cela fonctionne très bien avec les JO numérisés dont je vous parlais dans le billet précédent – et cela malgré une OCRisation qui n’est pas exempte d’erreurs pour les années 1945-1958 (oubliez notamment le copier-coller de citations, vous irez plus vite en retapant les extraits qui vous intéressent).

J’imagine que les lecteurs libres de PDF permettent le même type d’opérations… N’hésitez donc pas à explorer les fonctions de recherche avancée de vos logiciels préférés – et à les mentionner en commentaires.

3 Comments

Merci du « truc ». Pour ma part, lorsque j’ai besoin d’une recherche sur plusieurs fichiers ou dossiers, PDF compris mais pas seulement, j’utilise Recoll – dont je ne peux plus me passer au quotidien (http://www.lesbonscomptes.com/recoll/).
« Malheureusement », disponible uniquement pour Unix et Linux. Mais les résultats sont sidérants et m’ont fait gagné un temps très précieux dans mon propre travail.
Au passage, merci de ce blog des plus précieux, qui mérite bien son nom !

Répondre