Her birkaç ayda bir birinden e-posta alıyoruz — paylaştığı bir PDF'teki "karartmaların" aslında karartma olmadığını zor yoldan yeni öğrenmiş birinden. Bir gazeteci belgeyi kopyala-yapıştır yapar ve siyah çubuklar vurgulanmış isimlere dönüşür. Bir avukat dosyalanmış bir özeti metin editöründe açar ve sözde karartılmış bölümler düz metin olarak görünür. Bir devlet dairesi bir kamu bilgi talebini yanıtlar ve Ctrl+A yapan bir stajyer her şeyi ortaya çıkarır.
Bu sürekli olur çünkü çoğu insan — hassas PDF'lerle her gün çalışan çoğu insan dahil — karartmayı yanlış yapar. Kullandıkları yöntem ekranda doğru görünür ve altında tamamen bozuktur. "Karartma" yaptığınızda bir PDF'in içinde gerçekte ne olduğunu, yaygın yaklaşımın verilerinizi neden açıkta bıraktığını ve bunun yerine ne yapılması gerektiğini açıklamak istiyoruz.
Yaygın hata: siyah kutu çizme
Varsayılan sezgi makul. Bir PDF'iniz var. Bir satırı gizlemek istiyorsunuz. Preview, Acrobat veya herhangi bir açıklama aracını açarsınız, metnin üzerine siyah bir dikdörtgen bırakırsınız, kaydedip gönderirsiniz. Görsel olarak, metin yok oldu.
Altında ise hiçbir şey değişmedi. Bir PDF yapılandırılmış bir belgedir — metin, görseller, yazı tipleri ve grafik nesneler dosyanın dahili nesne ağacında ayrı girişler olarak saklanır. Metnin üzerine bir dikdörtgen çizdiğinizde, mevcut metin katmanının üzerine yeni bir grafik nesne eklemişsinizdir. Altındaki metin hâlâ oradadır, tamamen sağlam, tamamen indekslenmiş.
Kendiniz deneyin: siyah kutuyla "karartma" yaptığınız bir PDF'i alın, herhangi bir görüntüleyicide açın ve sayfadaki her şeyi seçmek için Ctrl+A kullanın. Seçim vurguları her kutunun altında saklanan metni ortaya çıkaracaktır. Bir metin editörüne kopyalayıp yapıştırın ve sözde karartılmış içerik geri gelir. Daha iyisi, PDF'i bir metin görüntüleyicide açın (çoğu işletim sistemi bunu sağ tıklamayla yapar) ve dahili metin akışlarını doğrudan okuyabilirsiniz.
Bu teorik bir sorun değil. Geçtiğimiz on yılda birçok yüksek profilli sızıntının nedeni olmuştur — taraf isimlerinin kurtarılabildiği mahkeme dosyaları, aynı kopyala-yapıştır hilesiyle kaynak isimlerinin açığa çıktığı istihbarat belgeleri, finansal rakamların siyah çubuklarının altında kusursuz şekilde okunabilir durduğu kurumsal açıklamalar.
Örtüşmeli karartmanın yapısal olarak neden güvensiz olduğu
Bir PDF'in render boru hattı nesneleri bileştirmek üzere tasarlanmıştır — siyah dikdörtgeninizi ve altındaki metni aynı ekran konumunu paylaşan iki ayrı şey olarak ele alır. Bu bir hata değil. Modern belge formatlarının çalışma şeklidir, çünkü çoğu zaman katmanlı düzenlemenin geri alınabilir olmasını istersiniz. "Geri al" aksi halde imkânsız olurdu.
Sonuç olarak, PDF'in yapısını yalnızca render etmek yerine inceleyen herhangi bir araç her iki katmanı da görecektir:
- Kopyala-yapıştır metin akışından çeker, render edilmiş görüntüden değil.
- Arama metin akışını indeksler, görünür sayfayı değil.
- Ekran okuyucular metin akışını seslendirir, görme engelli olmayan kullanıcıların gördüğünü değil.
- PDF ayrıştırıcılar (Python'un pypdf'inden Acrobat Pro'nun kendi araçlarına) bir sayfadaki gizli olanlar dahil her nesneyi listeleyebilir.
Güvenli yaklaşım: rasterleştirme
Gerçek karartma altındaki veriyi yok eder. Bunu yapmanın en güvenilir yolu sayfayı rasterleştirmektir — siyah çubuklar çizildikten sonra yapılandırılmış bir PDF sayfasından düz bir görüntüye dönüştürmektir. Sayfa bir görüntü olduktan sonra, ayrı bir metin katmanı yoktur, gizli nesne ağacı yoktur, karartmanın "altını okumanın" yolu yoktur çünkü altında hiçbir şey yoktur. Karartma piksellere pişirilmiştir.
Daha cerrahi ikinci bir yaklaşım, altındaki metin nesnelerini doğrudan silmek ve sayfanın geri kalanını düzleştirmektir. Bu, karartılmamış kısımlarda metin seçimini korur ancak doğru yapılması çok daha zordur — karartma aracı bir nesneyi kaçırırsa (diyelim ki iki ayrı akışta saklanmış bir metin parçası), hassas verilerin bir kısmı boşluktan sızar. Rasterleştirmenin böyle bir hata modu yoktur.
Rasterleştirmenin dürüstçe belirtilmesi gereken bir olumsuz yönü vardır: karartılmış sayfa artık aranabilir değildir. Sayfanın karartılmamış kısımlarındaki metin de görüntüye dönüştürülür, bu yüzden o sayfada Ctrl+F çalışmayı durdurur. Çoğu karartma kullanım senaryosu için — filtrelenmiş bir belgeyi dışarıya vermek — bu sadece kabul edilebilir değil, arzu edilir. Yayınlanan dosyanın orijinaliyle aynı şekilde makine tarafından aranabilir olmasını istemezsiniz, çünkü bu kısmi çıkarma saldırılarını kolaylaştırır.
Bir dakikadan az sürede nasıl güvenli karartma yapılır?
Karartma PDF aracımız varsayılan olarak rasterleştirme yaklaşımını kullanır. İş akışı:
- PDF Genie'de PDF Karart sayfasını açın.
- Dosyanızı yükleme alanına bırakın. Tüm işlem tarayıcınızda çalışır — dosya cihazınızdan asla ayrılmaz.
- Gizlemek istediğiniz metin, isim veya bölgelere siyah dikdörtgenler çizin.
- "Karartmaları Uygula"ya tıklayın.
- Çıktıyı indirin.
Safça örtüşme yöntemiyle karartma yaptığınız herhangi bir belgede kendiniz deneyin: bir PDF görüntüleyicide açın, siyah kutunun olduğu bölgeyi seçin, kopyalayın ve düz metin editörüne yapıştırın. Metin geri gelirse, karartma sahte demektir. PDF Karartma aracımızla, aynı yapıştırma boş bir bölge üretir — çünkü rasterleştirilmiş sayfa artık tam anlamıyla orijinal metin akışını içermez. Belge aynı görünür. İç yapısı kökten farklıdır.
İnsanların unuttuğu iki karartma detayı
Doğru araçla bile, iki pratik hata kalan sızıntıların çoğunu oluşturur:
Metadata. PDF'ler gizli metadata içerir — yazar isimleri, düzenleme yazılımı, revizyon zaman damgaları, bazen yeniden adlandırılmış belge başlıkları. Gövdeyi karartıp metadata'yı bırakmak yaygın bir sızıntı vektörüdür. Hassas bir şey paylaşmadan önce Metadata Düzenle aracımızla bunları temizleyin.
Ekli dosyalar ve gömülü nesneler. Bir PDF, gömülü Excel sayfaları, yazar isimlerini sızdıran yazı tipleri veya ekli orijinal dosyalar içerebilir. Bunlar saf karartmadan tamamen sağ çıkar. Bunları temizlemek için belgeyi bizimki gibi bir boru hattından (karart → rasterleştir → yeniden dışa aktar) geçirerek düzleştirin.
Ne zaman iki kez kontrol edilmeli?
Karartmakta olduğunuz belge mahkemeye dosyalanacaksa, kamu kayıt talebi altında yayınlanacaksa veya aktif olarak inceleyecek rakiplere yayımlanacaksa, güvenli yaklaşımı bile gerekli-ama-yeterli-değil olarak ele alın. Çıktıyı kendiniz doğrulayın:
- Karartılmış dosyayı açın ve her sayfada Ctrl+A deneyin. Seçim karartılmış bölgelerde durmalıdır.
- Bir PDF denetleyicide açın (Acrobat Pro'nun Preflight paneli işini görür;
pdfinfovepdftotextgibi komut satırı araçları da öyle). Karartılmış metin, metin akışı dökümünde görünmemelidir. - Dosya metadata ve eklerini kontrol edin. Paylaşmayı amaçlamadığınız her ikisini de temizleyin.
PDF'inizi güvenle karartın
Kendiniz deneyin — ücretsiz
40+ PDF aracı, kayıt gerekmez. Doğrudan tarayıcınızda çalışır.
PDF Genie'yi keşfet →