5 puntos por GN⁺ 2024-10-22 | 1 comentarios | Compartir por WhatsApp
  • Herramienta para convertir sitios web en ePub
  • Puede extraer una lista de páginas HTML de un sitio web y compilarlas como un libro ePub para importarlo en el eReader que prefieras
  • Los usuarios avanzados que puedan escribir JavaScript pueden agregar definiciones de analizadores adicionales para personalizar el parseo del sitio

Sitios compatibles

  • Novel Update
  • Wuxia World
  • La mayoría de los sitios de awesome-read-the-docs
  • Sitios personalizados que usan elementos UL/OL como tabla de contenido, o expresiones regulares en el texto de los enlaces, o selectores de consulta
  • Aplicaciones web personalizadas que usan elementos de título (encabezado) predefinidos y un botón de siguiente (clicable)

Resumen de GN⁺

  • Epublifier es una herramienta que ayuda a convertir el contenido de sitios web al formato ePub para que se pueda leer fácilmente en un eReader
  • Esta herramienta es especialmente compatible con sitios como Novel Update y Wuxia World, y los usuarios avanzados pueden personalizar el parseo mediante JavaScript
  • Esta herramienta es útil para quienes quieren leer contenido web sin conexión, y una herramienta con funciones similares es Calibre

1 comentarios

 
GN⁺ 2024-10-22
Opiniones de Hacker News
  • Calibre es compatible con muchos sitios
  • Esta extensión busca explicar en qué se diferencia de otros scrapers
    • Está hecha para generar ePub en sitios web donde los scrapers tradicionales no funcionan bien
    • Los scrapers típicos de línea de comandos y otras extensiones solo funcionan en sitios predefinidos
    • Puede requerir configuraciones complejas o código
    • Algunos sitios usan JavaScript para generar o traer texto de forma dinámica
    • Como se ejecuta en el navegador, es menos probable que sea detectada y bloqueada
    • No está pensada para uso repetitivo ni para tareas en segundo plano
    • Ofrece una UI para facilitar el scraping sin necesidad de configuración para cada sitio
    • No se puede esperar un mejor rendimiento en sitios que otros programas/extensiones ya manejan
    • Fue hecha porque no está atada a un sitio específico
  • Lo interesante de este programa es la UI para extraer contenido de sitios arbitrarios
  • Sería genial si pudiera manejar sitios donde todas las secciones están ocultas detrás de acordeones
  • Estoy haciendo algo parecido
    • Estoy desarrollando un scraper web y un parser de ePub para blogs, novelas web y más
    • También estoy desarrollando una app complementaria PWA para lectura offline
  • A veces quiero tener los ensayos de Paul Graham en ePub
  • Una vez hice una versión simple que guardaba archivos ePub en el sistema de archivos del servidor
    • Usaba Postlight Parser para ofrecer una vista simplificada del documento del sitio web
  • Esta herramienta es increíble
    • Ya quedaron atrás los días de guardar en caché muchas páginas web para viajar sin conexión
  • Me pregunto si es compatible con fanfiction.net
  • Me encantaría verlo funcionando en sitios con mucha documentación como AWS, VueJS, MDN, w3schools, realpython y betterstack