Looking for Computer Science  & Information Technology online courses ?
Check my new web site: https://www.yesik.it !

File:PDF.png

Le format PDF (Portable Document Format) est le standard de facto pour l'échange de documents numériques établi par la société Adobe depuis 1993.

Parmi les avantages des fichiers PDF, il y a la possibilité de visualiser un document sans avoir à posséder le logiciel qui a servi à le produire. De plus, le document apparaîtra identique à l'original – ou très proche – et cela indépendemment du système d'exploitation, l'environnement (polices de caractères) ou les caractéristiques matérielles de la machine sur laquelle il est visualisé.

Le format PDF est d'autant plus répandu que depuis 2008 il est devenu un standard ouvert normalisé par l'ISO sous la référence ISO/IEC 32000-1:2008.

Historiquement, un pseudo-pilote d'impression était nécessaire pour générer un PDF à partir de n'importe quelle application capable d'imprimer. Mais, aujourd'hui de plus en plus de logiciels sont directement capables d'exporter leurs documents au format PDF. Pour toutes ces raisons, le format PDF est très commun pour l'échange de documents.

Par contre, un problème se pose quand plusieurs documents PDF doivent être réunis. En effet, un simple copier-coller n'est pas possible – contrairement à ce que l'on pourrait faire avec des fichiers de traitement de texte, par exemple.

Une solution est d'utiliser GhostScript. Il s'agit d'un interpréteur capable de relire des documents PDF (et PostScript) pour les convertir ensuite dans un autre format graphique. Par exemple, pour les imprimer sur une imprimante incapable de gérer le PDF en natif. Mais ce n'est pas là le seul usage de GhostScript, comme nous allons le voir maintenant.

Combiner plusieurs PDF

Ainsi, plus surprenant peut-être, GhostScript peut aussi convertir des PDF ... en PDF. Pourquoi cela? Tout d'abord, parce qu'il existe plusieurs versions du format PDF. Et il est parfois nécessaire par souci de portabilité de convertir un PDF d'une version récente à une version antérieure plus largement supportée. De plus, et c'est ce qui nous intéresse ici, c'est aussi l'occasion de convertir des PDF en un PDF. Autrement dit, de les concaténer.

Installation

Sous Debian vous aurez besoin du paquet ghostscript pour ce qui suit. Si ce logiciel n'est pas déjà sur votre machine utilisez le gestionnaire de paquets de votre distribution pour procéder à l'installation.

sh# apt-get install ghostscript

Sur un système sur lequel GhostScript est installé, la syntaxe de la commande pour cet usage sera la suivante:

sh$ gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite \
          -sOutputFile=destination.pdf \
          fichier1.pdf fichier2.pdf fichier3.pdf

La commande ci-dessus demande à GhostScript de produire un fichier destination.pdf combinant le contenu de fichier1.pdf, fichier2.pdf et fichier3.pdf.

Extraire des pages d'un PDF

Combiner plusieurs PDF en un est bien pratique. Mais parfois vous souhaitez exactement l'inverse: extraire quelques pages d'un gros document PDF. Ici encore GhostScript est la solution.

Considérant que je veux extraire les pages 5 à 10 du fichier huge.pdf pour les enregistrer dans part.pdf, j'utiliserai la commande suivante:

sh$ gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite \
          -dFirstPage=5 -dLastPage=10 \
          -sOutputFile=part.pdf \
          huge.pdf 

Comme on peut s'en douter, dans cette commande les options -dFirstPage et -dLastPage permettent de sélectionner l'intervalle des pages à extraire.

Remarque:

Actuellement, il n'est possible d'extraire qu'un intervalle de page (éventuellement réduit à 1 seule page).

Si vous avez des besoins plus complexes – comme extraire les pages 1 à 5 et 10 à 15, par exemple – vous devrez utiliser plusieurs fois cette technique pour extraire chacun des intervalles de pages contiguës, puis les réunir à l'aide de la technique présentée plus haut pour combiner plusieurs PDF.

Références