- Un formato de archivo basado en SQLite que facilita consultar con SQL los datos rastreados de la web
- Permite importar archivos estándar Web ARChive (.warc), usados por
wget y WebRecorder, a .warcdb
- Usa el comando
sqlite-utils tal cual
wget --warc-file tselai "https://tselai.com"
warcdb import archive.warcdb tselai.warc.gz
// Obtener todos los headers de respuesta
sqlite3 archive.warcdb <<SQL
select json_extract(h.value, '$.header') as header,
json_extract(h.value, '$.value') as value
from response,
json_each(http_headers) h
SQL
Aún no hay comentarios.