- Archivador de aplicaciones web multipágina que rastrea un sitio en un archivo Zip y puede servirlo directamente como una Multi-Page Application (MPA)
- Al ejecutar
mpa http://example.net, rastrea recursivamente usando Puppeteer sin interfaz gráfica (usa cantidad de CPU / 2 hilos)
- Obtiene el sitemap y lo usa como punto semilla
- Solo rastrea las URL del sitio, pero también hace
fetch de recursos externos
- Guarda por separado los recursos del sitio
- Genera
mpa/sitemap.txt y mpa/sitemap.xml
- Si se interrumpe, puede reiniciarse. Guarda un checkpoint cada 250 URL
- En el caso de una SPA, puede guardar el HTML original con la opción
--spa
Aún no hay comentarios.