pdfsandwich - Herramienta para crear archivos PDF con imagen y OCR en formato sándwich
(tobias-elze.de)<p>- PDF “sándwich”: archivo PDF que contiene solo imágenes y al que se le aplica OCR para insertar texto de forma invisible detrás de la imagen de cada página<br />
→ permite buscar texto y seleccionarlo para copiarlo<br />
- Herramienta de línea de comandos usada para aplicar OCR a libros o revistas escaneados<br />
→ también soporta texto en múltiples columnas <br />
- tesseract + unpaper + convert + ghostscript <br />
→ soporta todos los idiomas compatibles con tesseract (incluido coreano)<br />
- Linux/Mac. Soporta procesamiento en paralelo en sistemas multiprocesador </p>
Aún no hay comentarios.