Publié le · 10 min de lecture
Comment compresser des PDF sans perdre en qualité
Un guide pratique et sans détour pour réduire la taille des fichiers PDF : ce qui occupe vraiment de l'espace, quels réglages de compression comptent, et comment garder un texte net et des signatures juridiquement valides.
Vous cliquez sur « Envoyer », l'e-mail rebondit, et la raison est toujours la même : le PDF est trop volumineux. La limite de pièce jointe est de 25 Mo, votre fichier en fait 38, et il vous reste dix minutes avant le début de la réunion. Cela vous parle ? Presque tous ceux qui travaillent avec des PDF ont vécu ce moment, et presque tous se précipitent sur le premier lien « compresser PDF en ligne » qu'ils trouvent, prient pour qu'il ne mutile rien d'important, et envoient.
Ce guide est la réponse plus longue. Il explique ce qui rend réellement un PDF volumineux, ce que les différents « niveaux de compression » que vous voyez dans les outils font vraiment sous le capot, et quand chacun est sûr à utiliser. À la fin, vous devriez pouvoir regarder un PDF, prédire approximativement de combien il peut rétrécir, et choisir la bonne approche sans jouer aux dés.
Pourquoi les PDF deviennent si volumineux dès le départ
Un PDF est essentiellement un conteneur. À l'intérieur, on peut trouver des flux de texte, des graphiques vectoriels, des polices intégrées, des images matricielles, des champs de formulaire, des annotations, du JavaScript, des fichiers joints et des métadonnées. Quand les gens se plaignent que leur PDF est énorme, le coupable n'est presque jamais le texte. Le texte brut est étonnamment léger : un roman entier s'encode en quelques centaines de kilooctets. La surcharge vient de trois endroits.
Premièrement, les images matricielles intégrées, en particulier les scans. Un seul scan couleur pleine page à 300 DPI fait environ 25 mégapixels. Stocké sans compression, cela représente environ 75 Mo ; même avec une compression JPEG raisonnable, cela peut encore faire 2 à 4 Mo par page. Multipliez par un document de 30 pages et vous obtenez un PDF de 100 Mo. Deuxièmement, les polices intégrées. Une police OpenType moderne avec couverture Unicode complète peut faire 1 à 3 Mo à elle seule ; un deck utilisant six familles de polices enfle rapidement. Troisièmement, les objets redondants ou jamais nettoyés : historique de révisions, images supprimées qui n'ont pas été réellement purgées, copies dupliquées du même logo sur chaque page.
Savoir laquelle de ces sources domine votre fichier est l'étape de diagnostic la plus utile. Un PDF saturé de scans et un PDF exporté depuis des slides ne sont pas le même problème et ne répondent pas au même remède.
Les quatre véritables techniques de compression
Quand un compresseur de PDF annonce une « compression intelligente » ou un « rétrécissement boosté à l'IA », il fait presque toujours une combinaison de quatre opérations bien connues. Les comprendre vous permet de prédire le résultat plutôt que de deviner.
- Sous-échantillonnage des images. Réduire les dimensions en pixels des images intégrées. Un scan à 300 DPI rééchantillonné à 150 DPI réduit le nombre de pixels d'un facteur 4, ce qui réduit généralement la taille de fichier d'un facteur proche de 4. Avec perte au sens strict (vous ne pouvez pas récupérer les pixels) mais souvent invisible à l'écran.
- Réencodage des images. Changer le codec ou le réglage de qualité : d'un bitmap non compressé vers JPEG, ou d'un JPEG qualité 95 vers JPEG qualité 75. Gros gains, avec une perte de qualité allant d'imperceptible à évidente selon l'agressivité.
- Sous-ensembles et déduplication des polices. Intégrer uniquement les glyphes que le document utilise réellement, et fusionner les copies de polices en double. Sans perte. Un document qui intègre trois polices complètes peut perdre plusieurs mégaoctets ici sans changer un seul pixel.
- Compression et nettoyage des flux d'objets. Suppression des objets orphelins, compression des flux internes avec Flate (zlib), fusion des ressources identiques. Totalement sans perte et presque sans risque.
Sans perte vs avec perte : choisir le bon outil pour le document
La compression est soit sans perte (chaque octet économisé est récupérable, la sortie visible est identique bit pour bit), soit avec perte (vous échangez un peu de fidélité contre de la taille). L'astuce consiste à faire correspondre la technique à la fonction du document.
Un contrat signé, un dépôt judiciaire, une archive PDF/A notariée, un article académique avec figures mathématiques : sans perte uniquement. Un scan de signature flouté ou une équation re-JPEGée peut changer le sens juridique ou scientifique d'un document. Une brochure marketing, un deck de slides pour une réunion interne, une collection de recettes : avec perte est très bien, souvent la seule façon d'atteindre un objectif de taille significatif.
Si vous ne pouvez pas facilement dire si un document est dans la catégorie « ne jamais toucher aux pixels », optez par défaut pour le sans perte. Les économies sont moindres, mais vous ne pouvez pas vous brûler.
À quoi ressemblent les chiffres dans la vraie vie
Voici un guide approximatif de ce à quoi s'attendre, tiré de documents de bureau typiques. Considérez-les comme un repère, pas comme des promesses.
Document type Original After lossless After moderate lossy
--------------------------------------------------------------------------
Text-only report 10 MB 8 MB 7 MB
Mixed text + 5 photos 18 MB 15 MB 4 MB
Slide deck (PNG-heavy) 40 MB 32 MB 6 MB
Scanned 30-page PDF 50 MB 48 MB 5 MB
Ebook with cover art 12 MB 10 MB 3 MBPourquoi les PDF uniquement textuels rétrécissent à peine
Si votre fichier est principalement du texte et que vous le compressez sans qu'il ne se passe presque rien, ce n'est pas que vous le faites mal. Le PDF compresse déjà ses flux de contenu avec Flate par défaut. Il n'y a pas beaucoup de marge à exploiter. Les seuls gains significatifs pour les documents uniquement textuels sont le sous-ensemble des polices, la suppression des métadonnées inutilisées et le nettoyage des fichiers intégrés oubliés. Attente réaliste : 15 à 25 % de réduction, point. Quiconque promet 90 % de compression sur un PDF purement textuel est soit en train de le ré-rastériser (transformant votre texte net en image floue), soit en train de mentir.
Cela compte parce que cela change votre réaction. Si un mémoire juridique de 10 Mo refuse de descendre sous 8 Mo, c'est le plancher. Le diviser en deux PDF est une solution plus honnête que de mutiler le texte pour atteindre un chiffre.
Pourquoi les PDF saturés de scans rétrécissent spectaculairement
Le revers : un document scanné de 50 Mo peut systématiquement tomber à 5 Mo sans perte de qualité visible pour la lecture à l'écran. Pourquoi ? Parce que la plupart des scanners scannent par défaut en couleur à 300 DPI, ce qui est excessif pour des documents que vous lirez sur un moniteur. 150 DPI est largement suffisant pour le corps de texte à l'écran, et une qualité JPEG modérée est invisible au zoom normal. Vous ne détruisez pas tant de l'information que vous ne supprimez de l'information que vos yeux n'utiliseront jamais.
Si le document est destiné à être imprimé, tenez la ligne à 200-300 DPI. S'il est destiné à être envoyé par e-mail et lu sur un ordinateur portable, 150 DPI en niveaux de gris est généralement le compromis idéal. S'il contient une écriture manuscrite minuscule ou un traçage technique fin, testez d'abord une page avant de vous engager sur tout le lot.
Ce qu'il NE faut PAS faire
- Ne compressez pas le même PDF deux fois avec des réglages avec perte. Chaque passage réencode les JPEG, et les artefacts s'empilent. Après trois cycles, votre scan a l'air d'avoir été faxé en 1994.
- N'exécutez pas de compression avec perte sur des documents juridiques signés, des contrats ou tout ce qui est destiné à un dépôt judiciaire. Même de subtils changements de pixels peuvent annuler la valeur probante du document, et une dégradation visible de la signature paraît suspecte.
- Ne faites pas l'OCR d'un scan, puis ne le compressez pas avec perte, puis ne refaites pas l'OCR. Le second passage OCR sur l'image dégradée produira un texte de moins bonne qualité et vous aurez perdu l'original.
- Ne téléversez pas de PDF sensibles (dossiers médicaux, NDA, déclarations fiscales) sur des compresseurs web aléatoires. Beaucoup conservent votre fichier sur leurs serveurs ; certains s'octroient explicitement des droits dessus. Lisez les conditions ou utilisez un outil qui s'exécute localement dans votre navigateur.
- Ne supposez pas que plus petit est toujours mieux. Un PDF de 200 Ko que personne ne peut lire parce que le texte OCR a été jeté est pire qu'un PDF de 5 Mo qui se cherche correctement.
Un arbre de décision simple
Quand vous avez un PDF à réduire, parcourez ces questions dans l'ordre. Quatre-vingt-dix pour cent du temps, la réponse tombe en trente secondes.
- Le document est-il juridiquement sensible (signé, notarié, dépôt officiel) ? Sans perte uniquement. Arrêtez-vous ici.
- Le fichier est-il majoritairement du texte sans grandes images ? Lancez un nettoyage sans perte ; attendez 15 à 25 % d'économies ; envisagez de le diviser s'il vous en faut plus.
- Le fichier est-il dominé par des scans ou des photos et destiné à la lecture à l'écran ? Sous-échantillonnez à 150 DPI et réencodez en qualité JPEG modérée. Attendez 60 à 90 % d'économies.
- Le fichier est-il un deck de slides ou un PDF marketing avec captures d'écran PNG ? Convertissez les PNG en JPEG là où le contenu est photographique ; gardez le PNG là où il y a du texte net ou des dessins au trait.
- Le fichier est-il destiné à l'impression ? Gardez les images à 200-300 DPI minimum. Nettoyage sans perte uniquement.
Comment se compare la compression dans le navigateur
La plupart des compresseurs PDF en ligne téléversent votre fichier, le traitent sur un serveur et renvoient une version plus petite. Cela fonctionne, mais cela a deux coûts : votre document quitte votre machine, et vous attendez un aller-retour à chaque modification. Les outils basés sur le navigateur (y compris /tools/pdf-compress de Multilities) font le travail localement à l'aide de WebAssembly. Rien n'est téléversé, la réponse est instantanée sur les petits fichiers, et vous pouvez compresser un dossier de reçus dans le train sans brûler vos données mobiles.
La compression dans le navigateur a aussi des compromis : les très gros PDF (quelques centaines de mégaoctets) peuvent solliciter la mémoire d'un téléphone, et les pipelines de réencodage les plus lourds tournent un poil plus lentement qu'un serveur costaud. Pour la fourchette quotidienne de 5 à 50 Mo qui couvre la plupart des documents du monde réel, l'approche locale est plus rapide de bout en bout une fois le temps de téléversement compté, et vos données ne quittent jamais l'appareil.
Tactiques spécifiques qui frappent au-dessus de leur poids
Si vous voulez quelques gains rapides qui fonctionnent sur presque tous les PDF, voici les ajustements à plus haute valeur ajoutée.
- Supprimez les vignettes intégrées. Certains générateurs de PDF intègrent une vignette de chaque page dans le fichier. Elles s'additionnent vite sur de longs documents et presque aucun lecteur moderne n'en a besoin.
- Supprimez les champs de formulaire et le JavaScript inutilisés. Les anciens modèles de formulaires portent souvent des scripts inertes et des définitions pour des champs que personne n'a remplis.
- Aplatissez les annotations et commentaires. Si vous n'avez pas besoin de continuer à les éditer, l'aplatissement les fond dans la page et permet au passage de nettoyage de retirer les objets sous-jacents.
- Convertissez les scans couleur en niveaux de gris quand la couleur n'est pas informative. Un scan en niveaux de gris au même DPI fait environ un tiers de la taille de la couleur.
- Réexportez depuis la source. Si le fichier original est un document Word ou un deck Keynote, exporter à neuf avec les réglages « Plus petite taille » ou « Qualité réduite » bat souvent tout ce que vous pouvez faire à un PDF déjà gonflé.
Ce que les réglages d'un bon compresseur signifient vraiment
La plupart des outils exposent trois ou quatre niveaux : Bas, Moyen, Élevé, Extrême, ou parfois des noms plus amicaux comme « Qualité impression », « Qualité écran », « Prêt pour e-mail ». Traduits dans les quatre techniques ci-dessus, ils correspondent généralement à ceci. « Bas » ou « Impression » ne fait que du nettoyage sans perte et préserve les images à 300 DPI. « Moyen » ou « Écran » sous-échantillonne à environ 150 DPI et réencode les JPEG à qualité 80. « Élevé » ou « E-mail » pousse à 96-120 DPI et qualité JPEG 60. « Extrême » peut tomber à 72 DPI et qualité 40, où le texte des scans commence à paraître pâteux.
Si les libellés vous embrouillent, lancez d'abord une page d'essai au réglage le plus élevé et regardez-la attentivement. Si l'essai a l'air correct, vous pouvez généralement faire confiance au même réglage pour le reste du document.
En résumé
Bien compresser un PDF, c'est surtout faire correspondre la technique au document. Un contrat signé reçoit un nettoyage sans perte. Un rapport scanné de 50 Mo reçoit un sous-échantillonnage agressif. Un article universitaire chargé de texte est accepté tel quel, parce qu'il n'y a plus rien à presser. Les outils qui marchent le mieux sont ceux qui vous laissent choisir un niveau et vous disent honnêtement ce qu'ils ont fait.
La prochaine fois que votre e-mail rebondit, prenez dix secondes pour vous demander quel type de PDF vous avez vraiment. Choisissez ensuite le bon réglage une fois, au lieu de le passer dans cinq compresseurs différents et de finir avec une version floue et tatouée d'un document qui était probablement très bien après un seul passage soigneux. Si vous voulez une option sans téléversement qui tourne dans le navigateur et vous montre la taille avant/après avant de vous engager, l'outil de compression PDF de Multilities est construit autour exactement de ce flux de travail. Dans tous les cas, les idées sont les mêmes : sachez ce qui rend votre fichier gros, choisissez l'outil le plus léger qui résout le problème, et arrêtez quand le travail est fait.