PDF.js
Le moteur de rendu PDF en JavaScript open source de Mozilla — le moteur derrière la visionneuse PDF intégrée de Firefox et la majorité des outils de prévisualisation PDF dans le navigateur.
PDF.js est une bibliothèque JavaScript créée chez Mozilla pour afficher des PDF directement dans un navigateur web sans plug-in externe. À l'origine développée parce que Mozilla voulait que Firefox affiche nativement les PDF (plutôt que de dépendre du plug-in d'Adobe), PDF.js est devenu le moteur de rendu PDF basé navigateur standard de l'industrie. Chrome, Edge et de nombreuses applications de lecture PDF l'utilisent en coulisse.
Ce que fait PDF.js
- Analyse la structure PDF — lit les flux de contenu, les polices, les images et les métadonnées
- Rend les pages sur un canvas — dessine la sortie visuelle au pixel près dans un élément canvas du navigateur
- Extrait le contenu texte — renvoie chaque exécution de texte avec ses coordonnées, sa police et sa taille
- Chargement incrémental — diffuse et rend les longs PDF progressivement pour que les premières pages apparaissent rapidement
PDF.js vs pdf-lib
Ces deux bibliothèques se complètent et PDF Genie utilise les deux :
- PDF.js lit et rend (côté entrée)
- pdf-lib crée et modifie (côté sortie)
Pour les outils qui doivent afficher une page PDF — aperçus, miniatures, PDF to JPG, OCR PDF — c'est PDF.js qui fait le rendu. Pour les outils qui doivent modifier un PDF — Merge, Split, Watermark — c'est pdf-lib qui gère l'écriture.
Licence
PDF.js est sous licence Apache 2.0, ce qui le rend viable pour des produits commerciaux. Mozilla le maintient publiquement sur GitHub et livre les mises à jour avec les versions de Firefox. Il est réellement éprouvé — des milliards de PDF ont été rendus avec lui au fil des ans.