- Guía para modificar el contenido de texto de un PDF: sin herramientas comerciales como Adobe Acrobat
- Guía principal para usuarios de Mac: se mencionan herramientas que también pueden usarse en la mayoría de las distribuciones de Linux
- Almacenamiento comprimido de datos de texto en PDF: descompresión con la herramienta de línea de comandos
qpdf
- Verificación de los datos de texto tras descomprimir: revisar en un editor de texto, junto con la codificación y su asociación con ciertas fuentes
- La complejidad de la codificación de texto dentro de un PDF: varias codificaciones posibles, incluidas codificaciones personalizadas integradas en el propio archivo
- Extracción de información de codificación: uso de la herramienta de línea de comandos
pdffonts
- Se ofrece un ejemplo de cómo identificar la fuente relacionada con una codificación embebida y encontrar la tabla de codificación embebida de esa fuente
- Tabla de codificación: mapea puntos de codificación personalizados a puntos Unicode
- Conversión de la tabla con Python: convertir la tabla en un diccionario y escribir funciones de codificación y decodificación
- Reemplazo del texto original mediante estas funciones: permite sustituir el texto original por texto de reemplazo con codificación personalizada
1 comentarios
Opiniones de Hacker News
mutoolpueden usarse para convertir un PDF a una versión sin datos comprimidos, lo que facilita entenderlo y modificarlo.qpdfy RUPS pueden usarse para comprender y modificar la estructura de un PDF.