PDF GeniePDF Genie

Getaggte PDF

Eine PDF mit versteckten strukturellen Tags – Überschriften, Absätze, Listen, Tabellen – die die logische Hierarchie des Inhalts für Screenreader und Datenextraktion beschreiben.

Eine getaggte PDF enthält einen unsichtbaren Strukturbaum, der jedem Inhaltsstück seine semantische Rolle zuweist: Dieser Text ist eine Überschrift, dieser Block ein Absatz, diese Zellen bilden eine Tabelle, dieses Bild hat diesen Alt-Text. Screenreader nutzen den Tag-Baum, um das Dokument intelligent zu navigieren und für Nutzer mit Sehbehinderung zu lesen.

Was Tagging ermöglicht

  • Screenreader-Barrierefreiheit – JAWS, NVDA und VoiceOver können Überschriften ansagen, nach Kapitel navigieren und Tabellen zellenweise lesen, indem sie die Tag-Struktur nutzen
  • Rückfließbarer Inhalt – eine getaggte PDF lässt sich für kleine Bildschirme (Telefone, Tablets) rückfließen, weil der Reader weiß, welcher Text Fließtext ist und welcher dekorativ
  • Datenextraktion – Tools, die Tabellen aus PDFs extrahieren, haben es viel leichter, wenn die PDF mit korrekten ``-, ``- und `
    `-Strukturen getaggt ist
  • Barrierefreiheits-Compliance – WCAG, Section 508 (USA) und EN 301 549 (EU) verlangen alle getaggte Struktur für digitale Dokumente, die für die öffentliche Nutzung bestimmt sind
  • Nicht getaggte PDFs

    Die meisten PDFs, die per Druck-auf-PDF, generische PDF-Exporte oder ältere Word→PDF-Konvertierungen entstehen, sind nicht getaggt. Der visuelle Inhalt ist da, die semantische Struktur fehlt. Screenreader können sie dennoch lesen, tun das aber als rohen Textstrom, ohne Überschriften oder Tabellen zu verstehen – das ist schmerzhaft langsam und verlustbehaftet.

    Eine PDF zugänglich machen

    Eine nicht getaggte PDF in eine korrekt getaggte umzuwandeln, ist nicht trivial – es erfordert manuelles Hinzufügen der Struktur oder KI-Tools, die sie inferieren. Adobe Acrobat Pro hat eine automatische Tagging-Funktion; dedizierte Barrierefreiheits-Remediationswerkzeuge leisten sorgfältigere Arbeit. Eine vollständig getaggte, WCAG-konforme PDF ist eine erhebliche Investition.

    Verwandte Tools