PDF GeniePDF Genie
compresshow-totips

Pourquoi Votre Fichier PDF Est Si Volumineux (Et Comment le Corriger en 60 Secondes)

La taille des fichiers PDF dépend des images, des polices et des objets intégrés — pas du nombre de pages. Diagnostiquez celui qui gonfle votre fichier et réduisez-le proprement.

P

Par PDF Genie Editorial Team

·8 min read·1,590 mots

Examiné par l'équipe éditoriale de PDF Genie. Consultez nos normes éditoriales.

Un PDF de 20 pages ne devrait pas faire 40 Mo. Un contrat numérisé de trois pages ne devrait pas peser 18 Mo. Un rapport uniquement textuel ne devrait pas refuser de s'attacher à un email. Pourtant nous voyons des fichiers comme ça tous les jours, et la raison est presque toujours la même : les gens supposent que la taille du PDF évolue avec le nombre de pages, alors qu'en réalité elle évolue avec ce qu'il y a dans chaque page.

Si vous comprenez quel composant de votre fichier est responsable du gonflement, vous pouvez souvent le réduire de 80 % ou plus sans rien changer visiblement. Cet article parcourt les quatre choses qui déterminent la taille d'un fichier PDF, comment diagnostiquer laquelle est votre problème, et le bon réglage de compression pour chaque cas.

Ce qui prend réellement de la place dans un PDF

Un PDF est un conteneur. Sa taille de fichier est la somme de ce qu'il y a dans le conteneur, plus un petit surcoût structurel. En pratique, quatre catégories représentent la quasi-totalité du poids :

1. Les images. De loin la cause la plus fréquente des PDF volumineux. Une seule photo non compressée de 4000 x 3000 fait environ 36 Mo avant tout encodage intelligent. Même un JPEG modérément compressé à cette résolution fait 3-5 Mo. Posez-en dix dans une annonce immobilière et votre PDF pèse 40 Mo avant que vous n'ayez écrit un mot.

2. Les polices intégrées. Les PDF intègrent les polices qu'ils utilisent pour que les documents s'affichent de manière identique sur des machines qui n'ont pas la police installée. Un seul fichier de police complète intégré pèse typiquement entre 200 Ko et 2 Mo. Un PDF qui utilise Arial, Arial Bold, Arial Italic, Times New Roman et Helvetica en cinq graisses peut facilement transporter 8-12 Mo de données de polices — pour un document texte dont vous auriez pu supposer qu'il était « juste du texte ».

3. Les couches d'images de documents numérisés. Un PDF numérisé est en fait une série d'images à la taille de la page emballées dans une structure PDF. À 300 DPI, une page format lettre pèse environ 2,5 Mo en JPEG haute qualité et 25 Mo en TIFF non compressé. C'est pour ça qu'un livre numérisé de 50 pages peut enfler jusqu'à 1,5 Go si quelqu'un l'a enregistré en qualité d'archivage.

4. Les objets intégrés et les métadonnées. Les PDF peuvent contenir des fichiers joints (une feuille de calcul, un autre PDF), des objets multimédias, des données de champs de formulaire, des vignettes, l'historique de versions du document et des métadonnées. Ils sont souvent invisibles à l'écran mais contribuent à la taille du fichier. Nous avons vu des PDF où 40 % du poids était constitué de données de vignettes inutilisées d'une version du fichier supprimée depuis longtemps.

Remarquez ce qui n'est pas sur cette liste : la quantité de texte. Le texte dans un PDF est stocké efficacement — un PDF de texte brut de 200 pages issu d'un convertisseur moderne pèse généralement moins de 1 Mo. Si votre PDF est volumineux et que vous le pensez comme un document texte, ce n'est pas le texte qui fait les dégâts.

Comment savoir ce qui rend votre PDF gros

Ouvrez le fichier et posez-vous trois questions :

Contient-il des photos, des diagrammes ou des pages numérisées ? Si oui, les images sont presque certainement le facteur dominant. Test : une seule page contient une photographie plein cadre — cette page à elle seule porte probablement 1-5 Mo.

Utilise-t-il beaucoup de polices ou de graisses différentes ? Plusieurs familles de polices intégrées s'empileront vite. Test : regardez le panneau Propriétés du document ou Polices dans n'importe quel lecteur PDF. Si vous voyez plus de quatre polices listées, l'intégration des polices contribue de façon notable.

Est-ce une numérisation ? Si les pages sont rendues comme des images plutôt que comme du texte sélectionnable, le document entier est essentiellement un fichier image. La taille du fichier sera typiquement proportionnelle à pages × DPI² × profondeur de couleur. Une numérisation qui double de 150 DPI à 300 DPI quadruple de taille.

Souvent la réponse est « un peu de tout » — un PDF d'affaires mixte avec des images, des sections numérisées et des polices intégrées. Pas grave. La stratégie de compression ci-dessous gère tout ça raisonnablement bien.

La correction en 60 secondes

Notre outil Compresser PDF fonctionne entièrement dans votre navigateur et gère les quatre sources de taille en un seul passage :

  • Ouvrez Compresser PDF sur PDF Genie.
  • Déposez votre fichier.
  • Choisissez un niveau de compression : Faible, Recommandé ou Extrême.
  • Téléchargez le résultat.
Rien n'est téléversé. Votre fichier est traité localement via le moteur PDF du navigateur. Dans notre benchmark de compression sur 200 PDF réels, la réduction médiane de taille était de 58 % en Recommandé et de 83 % en Extrême pour les fichiers riches en images. Les fichiers riches en texte se sont moins compressés (parce qu'il y avait moins de mou à récupérer) mais le sous-ensemblage de polices a encore retiré 20-35 %.

Choisissez le bon réglage pour votre type de contenu

Le bon niveau de compression dépend entièrement de ce qui rend votre fichier volumineux au départ. Un arbre de décision grossier :

Si votre fichier est surtout des images numérisées : Utilisez Extrême. Les documents numérisés sont presque toujours enregistrés à un DPI plus élevé que ce que votre destinataire visualisera réellement. Une compression Extrême d'une numérisation 300 DPI sort typiquement visuellement identique à l'écran tout en réduisant la taille du fichier de 80-90 %. Une archive de livre numérisé de plusieurs centaines de mégaoctets se compresse couramment à 10-15 % de sa taille d'origine en Extrême sans différence perceptible sur l'écran d'un portable.

Si votre fichier est riche en images mais non numérisé (photos, portfolios, annonces) : Utilisez Recommandé pour le partage et Faible pour tout ce que vous pourriez imprimer ou présenter à un client. Recommandé retire 50-70 % avec des artefacts visibles seulement à l'inspection rapprochée. Faible garde tout prêt pour l'impression avec une réduction de 20-40 %.

Si votre fichier est surtout du texte avec des polices intégrées : Utilisez Faible. Les plus grands gains ici viennent du sous-ensemblage de polices — le compresseur réécrit chaque police intégrée pour ne contenir que les caractères que votre document utilise réellement, ce qui réduit typiquement le poids des polices de 70-80 %. Le texte lui-même est déjà bien compressé ; vous avez rarement besoin des réglages plus durs.

Si votre fichier est constitué de formulaires (formulaires fiscaux, contrats à remplir) : Utilisez Faible uniquement. Recommandé et Extrême aplatiront souvent les champs à remplir en leur apparence rendue, ce qui rend le formulaire non éditable. Si c'est ce que vous voulez, utilisez explicitement notre outil Aplatir PDF.

Si votre fichier est mixte : Essayez Recommandé d'abord et redescendez sur Faible si vous voyez des problèmes de qualité.

Quelques choses qui n'aident pas

Trois mythes à dissiper :

« Compresser le PDF en ZIP le réduira. » Non. Les PDF sont déjà un format compressé. Envelopper un PDF dans un fichier ZIP économise typiquement 0-3 % de la taille d'origine. Les gros PDF ne répondent pas significativement à la compression généraliste.

« Supprimer les pages blanches réduira la taille du fichier. » Marginalement. Une page blanche fait quelques Ko. En supprimer trois d'un PDF de 50 Mo retire 0,03 % du poids. Utilisez notre outil Supprimer des pages pour nettoyer un document, mais n'attendez pas de gains de taille.

« Convertir en Word et revenir le réduira. » Parfois — mais ça cassera aussi votre mise en page, abandonnera les objets intégrés et détruira au passage le formatage précis qui vous a fait choisir le PDF au départ. Utilisez plutôt un compresseur dédié.

Ce que la compression fait vraiment sous le capot

Si vous voulez le tableau complet : notre compresseur fait trois choses en séquence.

  • Réencodage d'images. Chaque image intégrée est décodée, rééchantillonnée à un DPI cible adapté à la visualisation à l'écran, et réencodée en JPEG (ou JPEG2000 dans certains cas). En Recommandé cela signifie 150 DPI et qualité 70 ; en Extrême c'est 100 DPI et qualité 55.
  • Sous-ensemblage de polices. Chaque police intégrée est analysée par rapport aux caractères réellement utilisés dans le document, puis réécrite pour ne contenir que ces glyphes. Une intégration Arial de 600 Ko se réduit typiquement à 40-80 Ko.
  • Optimisation des flux et nettoyage des métadonnées. Les flux d'objets internes du PDF sont recompressés avec des réglages deflate modernes, les vignettes non utilisées et l'historique des révisions sont supprimés, et les tables de références croisées sont reconstruites de zéro. Cela représente à lui seul souvent 5-15 % des économies finales sur les vieux PDF.
Nous avons un article plus long sur les résultats catégorie par catégorie dans notre billet de benchmark si vous voulez les chiffres précis.

Mises en garde honnêtes

Nous avons mesuré ce qui précède sur notre propre outil avec un échantillon interne de 200 fichiers. Votre fichier peut être plus gros ou plus petit que notre médiane — les PDF réels varient énormément. D'autres compresseurs utilisent des défauts différents et produiront des résultats différents. Et le compromis qualité-taille dépend toujours du cas ; un chiffre sur une page est un piètre substitut au fait de regarder réellement la sortie.

Réduisez votre PDF maintenant

Compresser PDF — gratuit, tourne dans votre navigateur →

Partager cet article :𝕏 TwitterLinkedIn
PDF Genie

Essayez par vous-même — gratuitement

40+ outils PDF, sans inscription requise. Fonctionne directement dans votre navigateur.

Découvrir PDF Genie →