Schwärzung
Das dauerhafte Entfernen sensibler Texte oder Bilder aus einer PDF, sodass sie durch Kopieren, Suchen oder Dateiinspektion nicht wiederhergestellt werden können.
Schwärzung ist der Prozess, vertrauliche Informationen aus einem Dokument dauerhaft zu entfernen – Personenkennungen, Geschäftsgeheimnisse, klassifizierte Details – bevor es mit Parteien geteilt wird, die sie nicht sehen sollen. Ein ordnungsgemäß geschwärztes Dokument hat den sensiblen Inhalt buchstäblich verloren, nicht lediglich hinter einem schwarzen Balken versteckt.
Der häufige Schwärzungsfehler
Ein Klassiker unter den Fehlschlägen: Jemand zieht schwarze Rechtecke über die Wörter, die er verbergen möchte, speichert die PDF und sendet sie ab. Sie *sieht* geschwärzt aus – aber der zugrunde liegende Text ist weiterhin in der Datei. Jeder, der den „geschwärzten" Bereich kopiert oder die Datei in einem Texteditor öffnet, kann ihn lesen.
Das hat in der Praxis zu echten Datenlecks geführt. Gerichtsdokumente, Geheimdienstvermerke und Unternehmensmeldungen haben allesamt geschwärzten Inhalt durchsickern lassen, weil die Schwärzung nur visuell war.
Wie man korrekt schwärzt
Echte Schwärzung muss den Inhalt entfernen, nicht überdecken. Es gibt zwei verlässliche Ansätze:
1. Die betroffenen Seiten rasterisieren. Die Seite in ein hochauflösendes Bild umwandeln, solide Farbe über die sensiblen Bereiche im Bild zeichnen und die Originalseite durch das Bild ersetzen. Der Text existiert nicht mehr in der Datei.
2. Inhaltsstrom bearbeiten. Den internen Inhaltsstrom der PDF so ändern, dass die Textläufe unter den Schwärzungsbereichen gelöscht werden. Aufwendiger zu implementieren; kann das Dokument beschädigen, wenn unachtsam ausgeführt.
Werkzeuge
- Redact PDF nutzt den Rasterisierungsansatz – jede Seite mit Schwärzungen wird in ein Bild umgewandelt, wobei die geschwärzten Zonen dauerhaft geschwärzt sind. Seiten ohne Schwärzungen bleiben text-durchsuchbar.