PDF GeniePDF Genie
redactsecurityhow-to

Cómo Redactar un PDF Correctamente — Y Por Qué el Método Habitual Es Inseguro

Dibujar un recuadro negro sobre un PDF no oculta realmente el texto que hay debajo. Aquí está qué significa de verdad redactar y cómo hacerlo con seguridad en 60 segundos.

P

Por PDF Genie Editorial Team

·7 min read·1,366 palabras

Revisado por el equipo editorial de PDF Genie. Consulta nuestros estándares editoriales.

Cada pocos meses recibimos un email de alguien que acaba de aprender, por las malas, que las "redacciones" en un PDF que compartió en realidad no eran redacciones. Un periodista copia-pega un documento y las barras negras se convierten en nombres resaltados. Un abogado abre un escrito presentado en un editor de texto y los pasajes supuestamente tachados aparecen en texto plano. Una oficina gubernamental responde a una solicitud de acceso a registros públicos y un becario con Ctrl+A lo revela todo.

Sigue ocurriendo porque la mayoría de las personas — incluida la mayoría de las personas que trabajan con PDFs sensibles a diario — hace la redacción mal. El método que usan parece correcto en pantalla y está completamente roto por debajo. Queremos explicar qué ocurre realmente dentro de un PDF cuando "redactas" algo, por qué el enfoque común deja tus datos expuestos y qué hacer en su lugar.

El error común: dibujar un recuadro negro

La intuición por defecto es razonable. Tienes un PDF. Quieres ocultar una línea. Abres Preview, Acrobat o cualquier herramienta de anotación, colocas un rectángulo negro sobre el texto, guardas y envías. Visualmente, el texto ha desaparecido.

Por debajo, nada ha cambiado. Un PDF es un documento estructurado — texto, imágenes, fuentes y objetos gráficos se almacenan como entradas separadas en el árbol interno de objetos del archivo. Cuando dibujas un rectángulo sobre el texto, has añadido un nuevo objeto gráfico encima de la capa de texto existente. El texto que hay debajo sigue ahí, completamente intacto, completamente indexado.

Pruébalo tú mismo: toma un PDF que hayas "redactado" con un recuadro negro, ábrelo en cualquier visor y usa Ctrl+A para seleccionar todo en la página. Los resaltados de selección revelarán el texto oculto bajo cada recuadro. Cópialo y pégalo en un editor de texto y el contenido supuestamente redactado vuelve a aparecer. Mejor aún, abre el PDF en un visor de texto (la mayoría de los sistemas operativos lo hacen con clic derecho) y a menudo podrás leer los flujos de texto internos directamente.

Este no es un problema teórico. Ha sido la causa de varias filtraciones destacadas durante la última década — presentaciones judiciales donde se pudieron recuperar los nombres de las partes, documentos de inteligencia donde los nombres de fuentes quedaron expuestos mediante el mismo truco de copiar-pegar, divulgaciones corporativas donde cifras financieras quedaban perfectamente legibles bajo sus barras negras.

Por qué la redacción por superposición es estructuralmente insegura

La canalización de renderizado de un PDF está diseñada para componer objetos — trata tu rectángulo negro y el texto debajo como dos cosas separadas que coinciden en la misma posición de pantalla. Eso no es un error. Es cómo funciona todo formato moderno de documento, porque la mayor parte del tiempo quieres que la edición por capas sea reversible. "Deshacer" sería imposible de otra manera.

La consecuencia es que cualquier herramienta que inspeccione la estructura del PDF, en lugar de limitarse a renderizarlo, verá ambas capas:

  • Copiar-pegar extrae del flujo de texto, no de la imagen renderizada.
  • Búsqueda indexa el flujo de texto, no la página visible.
  • Lectores de pantalla anuncian el flujo de texto, no lo que ven los usuarios videntes.
  • Analizadores de PDF (desde pypdf de Python hasta las propias herramientas de Acrobat Pro) pueden enumerar todos los objetos de una página, incluido el oculto.
Si un documento contiene solo texto con el que te sientes cómodo que sea visible, este modelo por capas es una característica. En el momento en que lo usas para "redactar" datos sensibles, se convierte en una filtración esperando a ocurrir.

El enfoque seguro: rasterización

La verdadera redacción destruye los datos subyacentes. La forma más fiable de hacerlo es rasterizar la página — convertirla de una página PDF estructurada a una imagen plana — después de que se hayan dibujado las barras negras. Una vez que la página es una imagen, no hay capa de texto separada, no hay árbol de objetos oculto, no hay forma de "leer debajo" de la redacción porque no hay nada debajo. La redacción está horneada en píxeles.

Un segundo enfoque, más quirúrgico, consiste en eliminar los objetos de texto subyacentes directamente y luego aplanar el resto de la página. Esto preserva la selección de texto en las partes no redactadas, pero es considerablemente más difícil de hacer bien — si la herramienta de redacción pasa por alto un objeto (digamos, un fragmento de texto que estaba almacenado en dos ejecuciones separadas), parte de los datos sensibles se filtran por el hueco. La rasterización no tiene ese modo de fallo.

La rasterización tiene una desventaja que vale la pena señalar con honestidad: la página redactada ya no es buscable. El texto de las partes no redactadas de la página también se convierte en imagen, por lo que Ctrl+F dejará de funcionar en esa página. Para la mayoría de los casos de uso de redacción — publicar un documento filtrado externamente — esto no es solo aceptable, es deseable. No quieres que el archivo publicado sea buscable por máquina de la misma forma que el original, porque eso facilita los ataques de extracción parcial.

Cómo redactar con seguridad en menos de un minuto

Nuestra herramienta Redactar PDF usa por defecto el enfoque de rasterización. El flujo de trabajo:

  • Abre Redactar PDF en PDF Genie.
  • Suelta tu archivo en el área de carga. Toda la operación se ejecuta en tu navegador — el archivo nunca sale de tu dispositivo.
  • Dibuja rectángulos negros sobre el texto, nombres o regiones que quieras ocultar.
  • Haz clic en "Aplicar Redacciones."
  • Descarga la salida.
Entre bastidores, cada página redactada se rasteriza a resolución de calidad de impresión, los objetos de texto originales se eliminan y el resultado se reempaqueta como un PDF plano. La salida se ve idéntica a una redacción cuidadosa con recuadro negro — pero Ctrl+A, copiar-pegar y cualquier analizador estructural no devuelven nada bajo las barras, porque no hay nada que devolver.

Pruébalo tú mismo en cualquier documento que hayas redactado con el método de superposición ingenuo: ábrelo en un visor de PDF, selecciona la región con el recuadro negro, copia y pega en un editor de texto plano. Si el texto vuelve, la redacción es falsa. Con nuestra herramienta Redactar PDF, ese mismo pegado produce una región vacía — porque la página rasterizada literalmente ya no contiene el flujo de texto original. El documento se ve igual. Sus entrañas son fundamentalmente diferentes.

Dos detalles de redacción que la gente olvida

Incluso con la herramienta correcta, dos errores prácticos explican la mayoría de las filtraciones restantes:

Metadatos. Los PDFs contienen metadatos ocultos — nombres de autor, software de edición, marcas de tiempo de revisión, a veces incluso títulos de documentos que fueron renombrados. Redactar el cuerpo y dejar los metadatos es un vector de filtración común. Elimínalos con nuestra herramienta Editar Metadatos antes de compartir algo sensible.

Archivos adjuntos y objetos incrustados. Un PDF puede contener hojas de Excel incrustadas, fuentes que filtran nombres de autor o adjuntos originales. Sobreviven a la redacción ingenua por completo. Aplana el documento mediante una tubería como la nuestra (redactar → rasterizar → volver a exportar) para eliminarlos.

Cuándo verificar dos veces

Si el documento que estás redactando se va a presentar en un tribunal, se va a publicar bajo una solicitud de registros públicos o se va a difundir a adversarios que lo analizarán activamente, trata incluso el enfoque seguro como necesario pero no suficiente. Verifica tú mismo la salida:

  • Abre el archivo redactado y prueba Ctrl+A en cada página. La selección debería detenerse en las regiones redactadas.
  • Ábrelo en un inspector de PDF (el panel Preflight de Acrobat Pro funciona; también herramientas de línea de comandos como pdfinfo y pdftotext). El texto redactado no debería aparecer en el volcado del flujo de texto.
  • Comprueba los metadatos del archivo y los adjuntos. Elimina ambos si no tenías intención de compartirlos.
Son cinco minutos de verificación por cada documento que envíes. Es un seguro barato contra una filtración que podría tardar años en olvidarse.

Redacta tu PDF con seguridad

Prueba Redactar PDF — gratis →

Comparte este artículo:𝕏 TwitterLinkedIn
PDF Genie

Pruébalo tú mismo — gratis

40+ herramientas PDF, sin necesidad de registro. Funciona directamente en tu navegador.

Explorar PDF Genie →