14 puntos por xguru 2021-11-07 | Aún no hay comentarios. | Compartir por WhatsApp
<p>- PDF “sándwich”: archivo PDF que contiene solo imágenes y al que se le aplica OCR para insertar texto de forma invisible detrás de la imagen de cada página<br /> → permite buscar texto y seleccionarlo para copiarlo<br /> - Herramienta de línea de comandos usada para aplicar OCR a libros o revistas escaneados<br /> → también soporta texto en múltiples columnas <br /> - tesseract + unpaper + convert + ghostscript <br /> → soporta todos los idiomas compatibles con tesseract (incluido coreano)<br /> - Linux/Mac. Soporta procesamiento en paralelo en sistemas multiprocesador </p>

Aún no hay comentarios.

Aún no hay comentarios.