Nxtscape - navegador agente de código abierto

(github.com/nxtscape)

6 puntos por GN⁺ 2025-06-21 | 1 comentarios | Compartir por WhatsApp

Navegador de código abierto con funciones de agente basadas en IA
Prioriza la privacidad del usuario y ofrece una ventaja en protección de datos al ejecutar los modelos de IA de forma local
Destaca como ventajas principales la compatibilidad con extensiones de Chrome y una política transparente de código abierto
Frente a alternativas de navegador existentes como Arc, Dia, Perplexity Comet, se diferencia por el procesamiento local y el control de los datos por parte del usuario
Apunta a la expansión continua de funciones y al desarrollo impulsado por la comunidad, con soporte para diversas formas de contribución

Qué es Nxtscape

Nxtscape es un navegador agente de código abierto que ejecuta funciones de IA en un entorno local
Es una alternativa a navegadores como Arc, Dia, Perplexity Comet, adecuada para quienes buscan privacidad y control de sus datos
Los usuarios pueden usar su propia API key o integrar modelos locales como Ollama, de modo que información como el historial de navegación no se filtre al exterior

Características principales

Compatibilidad total con extensiones de Chrome, lo que permite mantener el entorno habitual
El agente de IA funciona directamente dentro del navegador sin pasar por la nube
El usuario puede ingresar directamente su API key o elegir la integración con un modelo local, lo que garantiza una alta protección de datos
Su desarrollo es de código abierto y guiado por la comunidad, lo que asegura transparencia en el código
En el futuro planea añadir varias funciones, como una MCP Store y bloqueo de anuncios con IA

Demo y ejemplos de uso

Ofrece escenarios de automatización usando un agente de IA
Integra una función de chat local con IA para ofrecer ayuda conversacional
Demuestra diversas posibilidades de automatización de tareas al integrarse con herramientas de productividad

Contexto de desarrollo

Parte de la percepción de que la tecnología de los navegadores ha estado estancada durante mucho tiempo
El objetivo es construir un entorno basado en agentes de IA que eleve de forma drástica la productividad de los desarrolladores
Al automatizar tareas repetitivas simples, por ejemplo, solicitudes como "pedir Tide Pods desde el historial de pedidos de Amazon", se busca que el usuario reciba ayuda del navegador en lugar de tener que 'competir' con él
Presenta como principio firme que los agentes de IA deben operar de forma segura en un entorno local

Comparación con navegadores principales

Chrome: aunque se basa en Chromium de código abierto, en los últimos 10 años ha habido poca incorporación de funciones innovadoras como IA, automatización o MCP (Multi Capability Plug-in)
Brave: ha ampliado su rumbo con criptomonedas, búsqueda, VPN y más, mientras que Nxtscape se enfoca en lo centrado en IA
Arc/Dia: fueron populares, pero son de código cerrado y no ofrecen alternativa si el servicio se interrumpe. Nxtscape es completamente de código abierto
Perplexity Comet: al ser una empresa de búsqueda/publicidad, existe el problema de que datos como el historial del navegador pasan a pertenecer a la empresa. Nxtscape mantiene todo el historial del usuario limitado al entorno local

Participación y contribuciones de la comunidad

Se puede contribuir de varias formas, como reportar bugs, proponer funciones, participar en Discord o seguir el proyecto en Twitter

Licencia y referencias técnicas

El código fuente se publica bajo la licencia AGPL-3.0
Fue creado con inspiración de proyectos de código abierto como Chromium, browser-use, Stagehand y Nanobrowser

1 comentarios

GN⁺ 2025-06-21

Opiniones en Hacker News

Siento que en los comentarios hasta ahora se están enfocando más en detalles que en la visión general. Personalmente, imagino que habría muchísimo valor en un navegador que se conecte con un LLM local, guarde todo lo que ve el navegador en una BD local con marcas de tiempo, analice y resuma automáticamente con qué interactúo, permita scripting al estilo Puppeteer y soporte automatización basada en prompts de código. Como asistente digital personal, podría ayudarme a encontrar fácilmente información olvidada o cosas que necesito, filtrar activamente búsquedas, anuncios, spam e información no deseada, e incluso encargarse automáticamente de tareas que quiero hacer en internet. Después de 25 años acumulando marcadores, los marcadores por sí solos ya no bastan. Cuando uno termina perdido tratando de encontrar un solo dato en sitios web llenos de basura, un bot guardaespaldas que filtre el ruido y lo inútil podría mejorar mucho la situación. Si esto de verdad funciona bien, podría asumir a la vez varios roles en el espacio digital: asistente personal, tour manager, portero, ama de llaves, mecánico, etc. Y en 2025, cuando el navegador se volvió el portal principal hacia un internet caótico, no me parece una mala dirección. Al final todo depende de la ejecución, pero de verdad me da mucha curiosidad ver cómo evoluciona un proyecto así
- Muchas gracias por la retroalimentación tan sincera. Esa es exactamente la visión que teníamos. Aunque pasamos más del 90% del día en el navegador, sigue siendo solo una “ventana tonta”. Si pudiera recordar el historial, recortar artículos importantes y guardar resaltados como Evernote Web Clipper, y además permitir búsquedas semánticas sobre todo el contenido, te cambiaría la vida. Todos los datos se guardan en un PostgresDB local, y preguntas como "¿cuál era la comparación de precios del mes pasado?" o "encuéntrame los highlights de automatización del navegador" podrían resolverse al instante. También incluye funciones para bloquear sitios que distraen cuando necesitas concentrarte. Más allá de buscar y recordar, estamos entrando a una era en la que el navegador realmente ayuda con el trabajo. Por ejemplo, agrupar pestañas automáticamente por tema, comparar precios de discos duros por sitio, resumir publicaciones nuevas en un servidor de Discord, todo procesado localmente. El navegador debería ayudarnos en medio del caos de internet, no volverlo todavía más complicado. Sobre todo, nos encantaría escuchar qué flujos de trabajo te resultan más incómodos en el día a día y qué casos de uso tienes
- En realidad, esto es casi exactamente lo que Microsoft quería hacer con Recall. Recall era la única función de toda la fiebre de IA que me hacía pensar que de verdad podría mejorar mi vida, pero si lo pienso bien, lo que realmente quiero no es IA, sino que mi computadora tenga un registro detallado local y me dé búsquedas avanzadas. Quiero que recuerde absolutamente todo lo que hice en la computadora. Los sitios que visité, cuánto scroll hice en cada página, incluso pensamientos que escribí y luego borré: quiero una función de ‘total recall’ que lo guarde todo. La razón es que mi cerebro siempre recuerda las cosas con errores, así que espero una memoria más perfecta de la computadora. Y quiero que la búsqueda funcione siempre de manera consistente y determinística. Necesito timestamps exactos y operadores booleanos; para NLP, Lucene ya resolvía muy bien eso hace 20 años. No necesito resúmenes autogenerados a partir de corpus externos; lo que quiero es que mi computadora recuerde correctamente lo que yo hice en ella. No creo que los LLM aporten mucho valor a la búsqueda personal. Por la naturaleza de los LLM, es difícil que te devuelvan con precisión los datos reales, y al final hay que indexar de forma tradicional para que la búsqueda sea exacta. Creo que hoy los LLM son tendencia porque todavía faltan buenos métodos para indexar “todo” eficientemente, pero en búsqueda personalizada en realidad no hace falta “todo”: basta con el texto que apareció en mi pantalla y metadatos como hora, posición del cursor, portapapeles, URL, etc. Solo necesitarías indexación con LLM cuando guardar snapshots de texto reales en un índice tradicional sea demasiado pesado en tamaño; fuera de eso, una búsqueda conversacional ambigua no es mi objetivo. El verdadero objetivo es total recall
- Es una visión realmente genial. Me gustaría que el navegador me lo recordara cuando pierdo el enfoque y que analizara por sí mismo qué estaba haciendo. La autoobservación aquí se vuelve una herramienta muy poderosa
- Durante mucho tiempo quise hacer una extensión de navegador que guardara e indexara automáticamente el texto completo de las páginas donde paso más de 30 segundos, para luego poder buscarlo. Este proyecto va mucho más allá de eso
- Desde mi punto de vista, esto es un “bloqueador nativo de anuncios basado en LLM”… el bosque es tan grande que solo pensarlo ya me da dolor de cabeza (es broma)
Me pregunto si, en vez de crear un navegador nuevo desde cero como nanobrowser, no bastaría con una extensión robusta. nanobrowser está muy bien hecho, no expone webdriver, y no le falta nada en ejecución de JS ni integración con LLM. Incluso ofrece capacidades agentic completas, así que me da curiosidad por qué sería necesario un navegador nuevo sí o sí
Tal vez sea una pregunta tonta, pero me gustaría que alguien explicara exactamente qué es un ‘agentic browser’. Se siente como si todos ya lo supieran. No me queda claro si es un término común o simplemente significa “navegador web con funciones de IA”
- Gracias por preguntar. No es una pregunta tonta para nada. Un ‘agentic browser’ es un navegador donde un agente de IA navega por la web por ti. Es un navegador en el que el agente puede hacer directamente cosas como reordenar un pedido en Amazon o llenar formularios en tu nombre
- Un agente es una estructura donde un LLM opera junto con herramientas, por ejemplo calculate(expression). Cuando necesita hacer ciertas acciones para obtener el resultado deseado, ejecuta automáticamente esas herramientas. En flujos de trabajo complejos, la entrada que recibe el LLM puede traducirse en una combinación de varias herramientas, como fijar el user agent del usuario a cierto string. Por ejemplo, ejecutar un comando como set_user_agent(...), hacer clics en la página o inyectar JS personalizado cuando se abre una página
- Escuché el término ‘agentic’ por primera vez hace un mes. Después de eso lo oí repetirse varias veces, incluso en un town hall interno durante 2 o 3 días. El resumen esencial es que es una IA que toma decisiones por sí misma y actúa sola
La idea de un agentic browser suena muy buena. Poder automatizar cosas con un agente del lado del cliente es realmente potente. Pero al mismo tiempo, desde el punto de vista de seguridad, “podría no ser seguro jamás”. El navegador tiene iniciada sesión en casi todas las cuentas sensibles y, por naturaleza, está expuesto a entradas no confiables de internet. Una sola inyección de prompt podría arruinarte la vida en segundos. La idea me encanta, pero a menos que toda la cadena de suministro tenga certificaciones como PCI/SOC2/ISO 27001 y hasta garantías firmadas con sangre por analistas de seguridad externos, yo no lo tocaría
- Muchas gracias por sacar ese punto. Es una preocupación totalmente válida. Por eso insistimos en un enfoque local-first y open source. Con agentes en la nube, como Manus.im, tienes que entregar tus credenciales a una caja negra que no puedes auditar; con un agente local, el usuario mantiene el control. El agente solo funciona cuando tú activas explícitamente la ejecución, puedes ver el progreso en tiempo real y detenerlo cuando quieras, puede correr aislado en un perfil de usuario de Chrome aparte, y lo más importante: como es open source, puedes inspeccionar y verificar tú mismo el código
Mi caso de uso es extraer archivos CSV o datos de sitios web relacionados con agua. Por ejemplo, extraer los datos del nivel de embalses de South Australia fue realmente complicado, sobre todo sin mucha experiencia en frontend. Si pudiera automatizar tareas así con un agente, lo probaría sin pensarlo
¡Me parece un proyecto muy bueno! Y también es impresionante que lo hayan lanzado en HN. Una opinión sincera de mi experiencia inicial: ejecuté el prompt del navegador para “agrupar todas las pestañas por tema” y funcionó realmente bien. Después le pedí que quitara todos los grupos de pestañas y reiniciara todo, y me respondió: "esto es una tarea de automatización del navegador, ejecútala en ‘Agent Mode’". Entonces lo pedí en Agent Mode, y me devolvió: "esto es una tarea de productividad, ejecútala en Chat Mode". Al final estuve yendo y viniendo entre ambos, y aunque sí logró juntar todas las pestañas en un solo grupo nuevo, no pudo eliminar los grupos por completo. Supongo que esa API simplemente no existe. En general, me gustaría que cada acción a nivel navegador tuviera un botón de ‘undo’. Y si eso es difícil, al menos que pudiera deshacer por sí mismo un grupo de pestañas que creó hace unos segundos. Planeo seguir usándolo. edit1: usando la interfaz de chat en páginas internas de Chrome como chrome://extensions, a veces salta a google.com. edit2: confirmé que el modo de productividad no tiene herramienta para desagrupar, solo para crear grupos
- ¡Muchas gracias por la retroalimentación! Perdón por la molestia. Todavía estamos en beta temprana. Agent mode y chat mode fueron diseñados como herramientas separadas. Vemos que los prompts todavía se quedan cortos y necesitamos mejorarlos. Sobre desagrupar, parece que la API de Chrome aún no lo permite, así que probablemente tendríamos que implementarlo nosotros mismos. Varias personas ya pidieron una función de ‘undo’, así que estamos considerando algo estilo ‘restore checkpoint’ de Cursor. También nos encantaría escuchar ejemplos concretos de qué tan importante te parece esta clase de funciones de productividad en la vida diaria :)
El nombre ‘nxtscape’ me da nostalgia del viejo SCSI. Les recomendaría un nombre más simple, que se pueda decir de una sola vez, como ‘GPT’. El producto está muy bueno
- Viendo la retroalimentación de hoy, siento que deberíamos dedicar más tiempo al nombre y al branding. Lo vamos a pensar :)
Este mercado es totalmente winner-take-all. De verdad es admirable que lo intenten, pero crear un navegador con un equipo de dos o tres personas es una tarea demasiado grande. Además, Google ya dejó entrever en I/O hacia dónde va el futuro, y en un área así Google puede implementarlo pronto en Chrome y capturar suficiente cuota de mercado muy rápido. Fundadores deep tech han intentado conquistar Chrome durante años y ni una sola vez lo han logrado. Realistamente, creo que deberían empezar por una necesidad pequeña con un ICP muy claro. Sería una lástima desperdiciar tanta pasión y energía
- Gracias por la franqueza. Es cierto que la competencia es feroz. Pero creemos que sí hay un vacío claro para un navegador de IA open source, impulsado por comunidad y privacy-first, al estilo de Brave
Creo que sí hay mucho valor en un navegador que haga cosas por el usuario, especialmente si procesa y transforma automáticamente contenido web hostil al usuario. Casos concretos: 1) al comprar un sofá, filtrar solo las condiciones específicas en vez de dejarse llevar por exageraciones de marketing; 2) recibir notificaciones solo cuando mis amigos publiquen en Facebook y filtrar todo lo demás; 3) si la comunidad del barrio funciona en Facebook o Nextdoor, ocultar automáticamente publicaciones repetitivas de la misma persona; 4) si una página de audiencia pública del gobierno está inflada innecesariamente a 700 páginas, resumirla automáticamente y quedarse solo con lo realmente importante. Se puede aplicar a muchísimos dominios
- Igual que al comprar un sofá, la función de filtrar elementos según ciertas condiciones sigue faltando incluso en sitios grandes, incluido Amazon. Antes combinaba scraping y ciencia de datos para crear sitios como diskprices.com, y si los LLM de verdad resultan útiles para esto, imagino que en lugar de escribir prompts directamente en el navegador veremos más sitios especializados en funciones concretas como esa. Sobre bloquear publicaciones repetitivas, Nextdoor sí tiene función para bloquear usuarios, por si sirve de referencia (guía para bloquear en Nextdoor)
- ¡Es un ejemplo buenísimo!
¿Respeta robots.txt?
- Todavía no. Pero en realidad, si el agente se usa solo para fines de un “humano”, no estoy seguro de qué tan importante sea, ya que no sería scraping como tal
- Este definitivamente es un agente para usuarios. Si además tuviera que respetar robots.txt, sinceramente sería demasiado frustrante. robots.txt fue diseñado originalmente como una cortesía para crawlers web, no para impedir herramientas que actúan en nombre de un usuario individual. Que los operadores de sitios limiten las herramientas con las que puedo acceder a mi propio sitio —ya sea terminal, navegador normal o navegador con IA— debilita una de las fortalezas de la web. Sacrificar la diversidad de la web por rechazo a las herramientas de IA también es peligroso pensando en el futuro. Referencia: robots.txt FAQ

Nxtscape - navegador agente de código abierto

Qué es Nxtscape

Características principales

Demo y ejemplos de uso

Contexto de desarrollo

Comparación con navegadores principales

Participación y contribuciones de la comunidad

Licencia y referencias técnicas

Lecturas relacionadas

1 comentarios

Opiniones en Hacker News