PDF.js
Mozillas quelloffener JavaScript-PDF-Renderer – die Engine hinter dem integrierten PDF-Viewer von Firefox und den meisten browserbasierten PDF-Vorschau-Tools.
PDF.js ist eine von Mozilla entwickelte JavaScript-Bibliothek, mit der sich PDFs direkt im Webbrowser ohne externe Plugins darstellen lassen. Ursprünglich entstanden, weil Mozilla wollte, dass Firefox PDFs nativ anzeigt (anstatt sich auf Adobes Plugin zu verlassen), hat sich PDF.js zum Industriestandard für browserbasiertes PDF-Rendering entwickelt. Chrome, Edge und viele PDF-Viewer-Apps nutzen es unter der Haube.
Was PDF.js macht
- Parst die PDF-Struktur – liest Inhaltsströme, Schriftarten, Bilder und Metadaten
- Rendert Seiten auf Canvas – zeichnet die visuelle Ausgabe pixelgenau in ein Canvas-Element des Browsers
- Extrahiert Textinhalt – liefert jeden Textrun mit Koordinaten, Schriftart und Größe zurück
- Lädt inkrementell – streamt und rendert lange PDFs progressiv, damit Nutzer die ersten Seiten schnell sehen
PDF.js vs. pdf-lib
Die beiden Bibliotheken ergänzen einander, und PDF Genie nutzt beide:
- PDF.js liest und rendert (Eingabeseite)
- pdf-lib erzeugt und verändert (Ausgabeseite)
Für Tools, die eine PDF-Seite anzeigen müssen – Vorschauen, Miniaturbilder, PDF to JPG, OCR PDF – übernimmt PDF.js das Rendering. Für Tools, die eine PDF verändern müssen – Merge, Split, Watermark – übernimmt pdf-lib das Schreiben.
Lizenzierung
PDF.js steht unter Apache-2.0-Lizenz, was es für kommerzielle Produkte attraktiv macht. Mozilla pflegt es öffentlich auf GitHub und liefert Updates zusammen mit Firefox-Releases aus. Es ist wirklich praxiserprobt – über die Jahre wurden Milliarden von PDFs damit gerendert.