Comment rechercher des mots dans les fichiers PDF

Les fichiers PDF offrent un moyen fiable pour distribuer des documents. Ils ont une petite taille de fichier et sont relativement à l'abri des virus. Plus important encore, ils verrouillent dans la mise en forme. Avec un fichier PDF, vous ne devez pas vous soucier de vos polices, les marges ou le nombre de pages de changer d'ordinateur à ordinateur. Votre document sera exactement la façon dont vous avez l'intention pour qu'il regarde, à tout le monde. Cette portabilité vient à un arbitrage documents PDF sont plus difficiles à modifier et rechercher que des documents de traitement. Pour rechercher du texte, la meilleure méthode dépend du type de fichier PDF que vous avez.


Sommaire











PDF sont des images, Non Renderable texte

  • Pour comprendre comment fonctionne le texte dans un fichier PDF, pensez à le format PDF comme un fichier image plutôt que d'un document de traitement de texte. Ceci est la façon dont les fichiers PDF conservent leur mise en forme. des documents de traitement de texte peuvent modifier l'apparence d'un ordinateur à, selon le logiciel utilisé pour les voir, mais les images regarder toujours la même. Bien que les images peuvent avoir des représentations de texte, ce texte est illisible ordinateur, et vous ne pouvez pas modifier ou rechercher la manière que vous pourrait dans un document de traitement de texte. Beaucoup de fichiers PDF résoudre ce problème en incluant une couche invisible de texte lisible par ordinateur - parfois appelé renderable ou codée machine texte - qui correspond au texte que vous voyez sur l'écran. Autres fichiers PDF ne disposent pas de cette couche de texte supplémentaire.

Recherche Renderable PDF texte

  • Pour les fichiers PDF avec du texte lisible par un ordinateur, vous pouvez rechercher du texte directement en utilisant l'outil de recherche texte intégré qui vient avec Adobe Acrobat ou Reader ou avec le logiciel PDF de votre choix. Dans le logiciel Adobe Reader, cliquez sur "Éditer" sur la barre de menu et choisissez "Trouver" ou appuyez sur "Ctrl-F" sur le clavier. Tapez le texte que vous voulez trouver dans la boîte de recherche. Vous pouvez également effectuer une recherche avancée en cliquant "Éditer" et "Recherche Avancée" ou en appuyant sur "Maj + Ctrl + F" sur le clavier. La recherche avancée vous donne plus d'options, telles que la recherche avec sensibilité à la casse, à la recherche des mots entiers et la recherche de plusieurs fichiers PDF à la fois. Notez que si le document comporte des images incorporées, les légendes et les étiquettes sur ces images pourraient ne pas apparaître dans une recherche de texte si l'ordinateur ne peut pas lire ces morceaux de texte.

Pourquoi certains fichiers PDF ne disposons pas des texte Renderable

  • Autres fichiers PDF ne sont pas renderable texte. Dans ce cas, même si vous pouvez ouvrir ces documents et de voir le texte pour vous-même, le logiciel ne reconnaît pas comme tel. Cela se produit lorsque quelqu'un crée un document en le numérisant texte, plutôt que de taper, et ne pas utiliser un logiciel de reconnaissance de caractères pour encoder le fichier PDF avec un calque de texte lisible par ordinateur. Il peut aussi arriver quand quelqu'un crée un fichier PDF à partir d'un format d'image qui utilise des graphiques vectoriels.

Recherche non-Renderable PDF texte

  • Pour rechercher un fichier PDF qui n'a pas renderable texte, vous aurez à compléter l'étape que le créateur de PDF d'origine ignorée. Cela signifie en utilisant un logiciel de reconnaissance de caractères optique pour balayer le fichier PDF et créer un calque de texte lisible par ordinateur. Adobe Acrobat lui-même peut le faire, et de nombreux programmes de logiciels libres le faire aussi bien, y compris PDF OCR X, FreeOCR et OCR en ligne. Notez que le logiciel de reconnaissance de caractères est imparfaite et commet des erreurs à un taux qui dépend de la façon dont le texte est tronqué dans le fichier PDF original.

» » » » Comment rechercher des mots dans les fichiers PDF