14 puntos por xguru 2022-06-22 | Aún no hay comentarios. | Compartir por WhatsApp
  • Un formato de archivo basado en SQLite que facilita consultar con SQL los datos rastreados de la web
  • Permite importar archivos estándar Web ARChive (.warc), usados por wget y WebRecorder, a .warcdb
  • Usa el comando sqlite-utils tal cual
wget --warc-file tselai "https://tselai.com";  
warcdb import archive.warcdb tselai.warc.gz  
  
// Obtener todos los headers de respuesta   
sqlite3 archive.warcdb <<SQL  
select  json_extract(h.value, '$.header') as header,   
        json_extract(h.value, '$.value') as value  
from response,  
     json_each(http_headers) h  
SQL  

Aún no hay comentarios.

Aún no hay comentarios.