9 puntos por xguru 2021-07-13 | 4 comentarios | Compartir por WhatsApp
  • Open source que descarga todo o parte de un sitio web desde los archivos archivados por Internet Archive Wayback Machine

  • Descarga los archivos más recientes del sitio / todos los archivos por fecha / archivos de un rango de fechas específico (from ~ to) con estructura de directorios

  • Genera automáticamente una página index.html utilizable en Apache/Nginx

  • Descarga la versión original, no la versión modificada por Wayback Machine

  • Con la opción --list se pueden guardar solo las URL en JSON sin descargar

  • Open source en Ruby

4 comentarios

 
ffdd270 2021-07-13

Quisiera crear un servicio local de Wayback Machine... pero tengo que ordenar y cerrar el proyecto en el que estoy trabajando ahora =m=... qué pena.

Wayback Machine rompe las imágenes / la UI es mala(... ) / y Pocket tampoco guarda la página como tal sino el original, así que hay sitios donde eso ni siquiera se puede guardar. Me gustaría hacer un proyecto open source que recorte la página y luego la guarde en la máquina local del usuario o en un servidor remoto, que además liste de forma bonita las páginas guardadas hasta ahora como hace Pocket. Y que, al hacer clic, te lleve a la página archivada.

 
lineaa 2021-07-14

Parece que en algunos casos las imágenes también funcionan correctamente solo si marcas la opción Save outlinks al guardar.

Esperaré a ver... jaja

 
xguru 2021-07-14

Yo también esperaré.

Además... si también pudieran guardar bien los sitios hechos con React... jo jo jo

 
galadbran 2021-07-13

Estaré esperando jejeje