Obscura - navegador headless de código abierto
(github.com/h4ckf0r0day)- Motor de navegador headless especializado en web scraping y automatización de agentes de IA
- Integra el motor V8 para ejecutar JavaScript real y, gracias a la implementación de Chrome DevTools Protocol (CDP), permite reutilizar tal cual código de Puppeteer y Playwright
- Mucho más liviano que Chrome headless: memoria de 30 MB (vs 200 MB+), binario de 70 MB (vs 300 MB+) y carga de página de 85 ms (vs ~500 ms)
- Con una carga de página de alrededor de 85 ms, en crawling masivo reduce el tiempo de espera entre 5 y 10 veces frente a Chrome
- Distribución en binario único, con cero dependencias externas como Chrome o Node.js
- Modo sigiloso
--stealthintegrado:- Aplica automáticamente configuraciones para evadir antibots, como ocultar
navigator.webdrivery camuflar funciones nativas - Aleatorización de huella digital por sesión (GPU, canvas, audio, etc.)
- Aplica automáticamente configuraciones para evadir antibots, como ocultar
- Bloqueo automático de trackers de anuncios, analítica y telemetría en 3,520 dominios, lo que también mejora la velocidad de renderizado de la página
- Desde la CLI,
obscura fetchpermite renderizar una sola página yobscura serveiniciar un servidor WebSocket de CDP obscura scrape url1 url2 ... --concurrency 25permite hacer scraping en paralelo fácilmente- Con
--eval "document.title", se pueden ejecutar expresiones de JS directamente desde la CLI y extraer solo el resultado, útil para extracción simple de datos - Mediante la API de CDP soporta dominios principales como Target, Page, Runtime, DOM, Network, Fetch e Input, e incluye también conversión de DOM a Markdown (
LP.getMarkdown) - Al enviar formularios o iniciar sesión, maneja automáticamente POST, redirecciones 302 y mantenimiento de cookies, por lo que no hace falta implementar manualmente el flujo de autenticación
- Licencia Apache 2.0
5 comentarios
Es un navegador headless que últimamente está ganando mucha popularidad.
Además de ser liviano, parece que se ha vuelto popular porque su modo sigiloso funciona muy bien.
Se unió a GitHub hace un mes
Por ahora, cuando solo lo busqué de forma simple en Google, no hay mucha reacción ni reseñas.
Tampoco encuentro mucho al revisar Hacker News, Reddit, etc.
No sé si soy yo el que no lo está encontrando...
Pero tiene más de 6 mil estrellas.
¿Dónde se puede verificar qué es lo que realmente se está volviendo popular?
Parece un software bastante riesgoso...
Yo lo vi mucho más que nada en Twitter. Dicen que es cómodo para automatizar.
La verdad, no he podido probar el modo sigiloso, así que no puedo evaluarlo muy bien.
No parece algo común. (Aunque últimamente hay muchos proyectos así, así que quizá habría que considerarlo algo común...)
Es un programa en el que es muy probable que se use introduciendo información sensible,
así que parece que sería mejor usarlo después de darle algo de tiempo.
Parece ser una herramienta creada por u/Total_Nectarine_3623.
https://www.reddit.com/r/ClaudeAI/s/9VO1vzO2zp
Viendo otras publicaciones, parece que le interesan ONIST y los CTF, así que da la impresión de que tiene interés en la seguridad de la información, y lanzó la primera versión con un solo commit enorme. Al ver eso, también da la impresión de que hizo muchísimo "vibe coding" en el repositorio original y luego lo dividió en muchísimos commits, así que como no quedaba muy bien publicarlo tal cual, quizá lo juntó todo en uno. Además, viendo que su handle de GitHub también es h4ckf0r0day, para herramientas de este tipo —que normalmente no se abordan por vías del todo convencionales, como ONIST o similares— existe como una especie de tradición de subirlas desde cuentas desechables.
La confianza en un proyecto open source tendrá que ganarse con el tiempo, pero no parece haber ninguna intención particularmente rara.