BrowserOS – la alternativa de código abierto a Perplexity Comet

(browseros.com)

9 puntos por GN⁺ 2025-07-14 | 2 comentarios | Compartir por WhatsApp

BrowserOS es una alternativa de código abierto y centrada en la privacidad a Perplexity Comet, un navegador agéntico que ejecuta agentes de IA localmente
Está basado en un fork de Chromium, por lo que soporta todas las extensiones existentes de Chrome, y se caracteriza por guardar los datos del usuario solo de forma local
Puede integrarse con varios proveedores de IA como OpenAI, Anthropic y Ollama, y permite usar claves API personales o modelos locales
Incorpora herramientas modernas de productividad como resaltador nativo, marcadores basados en ChatGPT y búsqueda semántica, y pronto también ofrecerá bloqueo de anuncios con IA
A diferencia de los navegadores tradicionales, los datos no se envían a empresas de búsqueda o publicidad, y la IA ejecuta flujos de trabajo automatizados localmente

Resumen de BrowserOS

BrowserOS es un navegador de agentes de código abierto que ofrece un entorno donde los agentes de IA funcionan directamente en la computadora del usuario
Basado en una filosofía de privacidad primero, evita que los datos salgan al exterior usando claves API o modelos locales como Ollama
Al estar basado en un fork de Chromium, mantiene la misma interfaz de usuario de Chrome y todas las extensiones de Chrome funcionan

Funciones principales

Agentes de IA y ejecución local
- Los agentes de IA se ejecutan directamente de forma local dentro del navegador, gestionando tareas repetitivas y flujos de trabajo automatizados
- Con la integración de Ollama, es posible ejecutar modelos de lenguaje de gran tamaño en tu propia computadora en vez de la nube, con privacidad de datos garantizada
Herramientas de productividad
- Soporta herramientas de productividad integradas en el navegador como resaltador y marcadores de ChatGPT
- La búsqueda semántica permite encontrar rápidamente datos del navegador como historial y marcadores
Bloqueo de anuncios y tienda MCP (próximamente)
- El bloqueo de anuncios con IA (próximamente) se perfila como una alternativa tras el bloqueo de uBlock Origin en Chrome
- En la tienda MCP (Multi Command Package) (próximamente), se podrán instalar MCP populares con un clic y usarlos de inmediato desde la barra del navegador
Código abierto y enfoque comunitario
- Con licencia AGPL-3.0, es 100% de código abierto y garantiza transparencia en el código y su funcionamiento
- Se fomenta activamente la participación y las contribuciones de la comunidad

Casos de uso representativos

Automatización de tareas repetitivas y tediosas: la IA gestiona automáticamente reservas de reuniones, llenado de formularios y trabajos repetitivos
Investigación profunda: navega la web para generar reportes resumidos y recopilar información de forma eficiente sin gestionar pestañas manualmente
Escaneo de contenido en redes sociales: selecciona y organiza automáticamente publicaciones relevantes en LinkedIn, Twitter y otras plataformas

Comparación con otros navegadores

Chrome: sin grandes cambios en 10 años y sin funciones de IA, automatización ni MCP
Brave: sigue una estrategia dispersa entre criptomonedas, búsqueda y VPN, sin enfocarse en un navegador de IA
Arc/Dia: son cerrados, no son de código abierto y no ofrecen alternativa si dejas de usarlos
Perplexity Comet: está centrado en empresas de búsqueda/publicidad y envía los datos del usuario al servidor, mientras que BrowserOS guarda todos los datos solo de forma local

Instalación e inicio

Descarga disponible para macOS y Windows
Importación de datos de Chrome (opcional)
Conexión con proveedores de IA (OpenAI, Anthropic, Ollama, etc.)
Es posible comenzar de inmediato con la automatización por agentes

Licencia

Aplicación de la licencia de código abierto AGPL-3.0

2 comentarios

luiseok 2025-07-14

https://es.news.hada.io/topic?id=21581
Se me hacía conocido y, al revisarlo, resultó que era Nxtscape con solo un cambio de nombre.

GN⁺ 2025-07-14

Comentarios de Hacker News

El ejemplo de comprar pasta dental que mostraron en el demo deja ver lo difícil que es este tipo de tareas; “pasta dental” está especificado de forma demasiado ambigua, así que al final termina escogiendo algo casi al azar de una lista enorme. En algunas tareas, las acciones previas pueden servir de guía, pero en otras no; por ejemplo, si la pasta dental que compraste antes está agotada, no queda claro qué debería hacer. Al final, me pregunto si este tipo de ejemplo realmente ahorra tiempo, porque de todos modos tienes que revisar el resultado, así que terminas haciendo doble trabajo. Creo que por eso sistemas como Alexa no lograron ofrecer la experiencia de compra que Amazon esperaba al inicio. Preferiría que mostraran un ejemplo más complejo, donde el ahorro de tiempo sea evidente y los casos de falla sean mínimos, o incluso que se enfocaran en cómo recuperarse de esos casos de falla. ¿Ofrecen una UI específica para problemas concretos, o lo resuelven con chat? Siento que todo este mundo no es nada fácil. Suerte a todos.
- Es cierto; todo el campo de los agentic browsers sigue en una etapa muy temprana. Nosotros también apenas estamos empezando y buscando un nicho de use-case que realmente valga la pena. Hay tareas repetitivas y aburridas donde el ahorro de tiempo sí es clarísimo; por ejemplo, vendedores terceros de Walmart que revisan varias veces al día los precios de la competencia para ajustar el precio de sus productos. Eso se puede automatizar fácilmente con un agentic browser.
- Creo que también debería poder realizar tareas según el gusto estético de cada usuario, aunque eso podría convertirse en una pesadilla de seguridad.
Ya tenía instalado Nxtscape, pero no sabía que habían cambiado el nombre del producto; ejecuté BrowserOS y me saqué de onda al ver exactamente la misma UI y hasta el mismo emoji de zorro en la ventana de chat. La verdad, el nombre anterior me gustaba más. Supongo que lo cambiaron por razones legales. Le pedí que resumiera los comentarios de un artículo de Arstechnica y al principio solo respondió que “no se podía resumir porque los comentarios no estaban incluidos”. Solo después de indicarle explícitamente que hiciera clic en el enlace de "comments" empezó a leerlos bien. Y por cierto, la página de comentarios tenía 3 páginas en total, pero después de más de 20 minutos y como 100 acciones —incluyendo muchos desplazamientos muy específicos de 1074 píxeles— sigue en estado de "Validating task completion..." y yo todavía esperando el resumen. Funcionalmente se ve potente, pero requiere demasiada intervención y es demasiado lento como para usarlo de verdad. Por cierto, también tengo instalado Nxtscape e hice el mismo experimento; terminó la tarea más rápido y con menos acciones. No sé si fue casualidad o si internamente usa otra lógica. Y hay una extensión de Chrome que permite usar las contraseñas de iCloud en Chrome, pero no funciona en Nxtscape ni en BrowserOS. Si tengo que seguir abriendo manualmente el gestor de contraseñas, no pienso usar un navegador así. Y tampoco planeo cambiar de gestor de contraseñas.
- Cambiamos el nombre para evitar problemas, y además el nombre anterior era difícil de pronunciar. Gracias por el feedback; estaría bueno seguir platicando en Discord (https://discord.gg/YKwjt5vuKr). Nuestro equipo despliega todos los días y estamos mejorando a una velocidad brutal; el agente también debería mejorar mucho en los próximos días. También vamos a revisar el tema de la extensión de contraseñas de iCloud; la meta es hacer que el onboarding y la gestión de contraseñas sean mucho más fáciles.
Si esto es un privacy first browser, me pregunto por qué no usaron Firefox. Firefox encaja mucho mejor con ese objetivo y además es una opción mejor desde el inicio. Tor Browser, Mullvad Browser, LibreWolf y otros navegadores enfocados en seguridad/privacidad están todos basados en el motor de Firefox. Y creo que sí necesitamos varios "motores de navegador web"; si al final solo usamos motores de las big tech, eso perjudica muchísimo a los consumidores y frena la innovación. Deberíamos apoyar más navegadores independientes como Firefox.
- Fue una decisión realmente difícil. Hablamos con personas que construyeron navegadores sobre webkit, y nos dijeron que solo corregir bugs aleatorios y problemas de compatibilidad con sitios les tomó casi 2 años. El motor firefox/gecko podría ser mejor que webkit, pero la conclusión es que si usas algo que no sea chromium, necesitas muchísimo trabajo adicional tanto por compatibilidad web como por soporte de extensiones. Además, somos apenas una startup de 2 personas, y la codebase de chromium fue un punto de partida mucho más fácil de compilar. Y también está el hecho de que, como Brave, se puede hacer un navegador muy enfocado en privacidad incluso sobre chromium. Sobre todo en la era de los agentic browsers, hay demasiadas cosas por mejorar en privacidad de inmediato: por ejemplo, mandar datos sensibles a algo como Perplexity Comet para monetizarlos con anuncios sí está muy mal; es mucho más importante tener soporte para LLM locales o permitir que el usuario use su propia API key.
- Me hice exactamente la misma pregunta. Si dicen que está orientado a la privacidad, me intriga por qué usan chromium.
Leí que “parchean directamente el código fuente en C++ de Chrome para obtener la misma seguridad que Google Chrome”. Si es así, me pregunto si recompilan por su cuenta cada vez que Chromium se actualiza, porque a veces hay parches con mensajes de commit que parecen inocentes, pero en realidad corrigen vulnerabilidades graves que recién se revelan como CVE 90 días después.
- Buena pregunta. Hasta ahora hemos seguido construyendo sobre las versiones de lanzamiento de Chromium en las que se basa Google Chrome.
Yo preferiría que esto se ofreciera no como navegador independiente, sino como extensión de navegador.
- Nosotros también queríamos hacerlo originalmente como extensión de navegador. Pero creemos que para construir un buen agent copilot son indispensables varios cambios a nivel de Chromium C++; por ejemplo, Chromium tiene el árbol de accesibilidad de todos los sitios web, pero no puedes obtenerlo desde la API de extensiones de Chrome. Tener acceso directo a ese árbol mejora muchísimo el rendimiento del agente. Además, estamos agregando a nivel C++ varias capacidades para que el agente interactúe con los sitios web, como acciones de clic e índices de elementos. Hacer eso en JS sería entre 20 y 40 veces más lento.
- Nosotros pensamos exactamente lo mismo: no creemos que para implementar funciones agentic sea necesario un navegador completo; dentro de permisos limitados, una extensión de navegador basta perfectamente. Google publica muchos parches zero day directamente, y claramente también hay funciones que Google no incorpora a Chromium. Por eso no confiaría en un fork open source aleatorio como mi navegador principal. Como extensión de navegador para AI Web Agent recomiendo rtrvr.ai (https://rtrvr.ai), que ya está implementada para adaptarse al flujo de trabajo del usuario.
- Cuando vi que mencionaban nanobrowser aquí, pensé exactamente lo mismo.
- Vale la pena probar https://github.com/nanobrowser/nanobrowser
Este es un proyecto parecido a nanobrowser, que es una chrome extension: https://github.com/nanobrowser/nanobrowser
- Le di una revisada rápida a la página del proyecto y parece que usa una API key externa de LLM; este proyecto presentado en el post original da la impresión de usar transformer.js para que el LLM corra localmente.
- Si esta función ya puede implementarse como extensión, me pregunto por qué haría falta crear un fork del software existente. Quisiera saber si hay alguna función que claramente solo exista en browserOS y no en nanobrowser; me interesa cuál es la diferencia clave que realmente habría que señalar.
- Gracias por mencionarlo.
Dicen que “también estamos construyendo un bloqueador de anuncios con LLM después de que Chrome bloqueó uBlock Origin”, pero si al final es un fork de Chromium, ¿no bastaría con reutilizar uBlock Origin?
- Chromium planea eliminar la API de Manifest V2, y ningún fork parece querer seguir manteniéndola; incluso Brave creó su propio bloqueador de anuncios integrado. La verdadera pregunta es: ¿por qué no hacer un fork de Firefox y elegir Chromium aunque Firefox ya resuelve todo eso?
Tengo curiosidad por el roadmap para Linux; no tengo Mac ni Windows.
- Lo tenemos presente; deberíamos poder dar soporte a inicios de la próxima semana. Seguimos siendo un equipo de solo 2 personas, así que de verdad hay muchísimo por hacer.
Me gustaría ver a la IA moviendo directamente el cursor del mouse, haciendo clic y mostrando en pantalla la escritura en tiempo real, como en un tutorial de software, con una interacción que se sienta como la de una persona real. Ahora, cuando la IA cambia de página y la UI se mueve tan abruptamente, se siente entrecortado y cuesta seguir el flujo. Faltan pistas sobre en qué debería fijarme, así que se siente como ver una grabación de pantalla sin guía. Aun así, creo que puede haber casos de uso valiosos en áreas como mcp/browser automation, así que tengo interés en ver cómo evoluciona.
- Es un feedback súper útil, ¡gracias! Vamos a revisar si también podemos agregar movimiento del cursor; la escritura ya se muestra como si la hiciera una persona real, pero creo que podríamos hacer que se vea un poco más lenta.
- Creo que lo que de verdad quiero es caretaker ai.
¡Felicidades! Me da curiosidad cómo planean hacer sostenible este proyecto en términos financieros, de desarrollo y de mantenimiento.
- ¡Gracias! Básicamente iremos por el mismo camino que otros proyectos open source, vendiendo licencias de una versión Enterprise del navegador.
- Mi apuesta es que en realidad es solo una app de electron o un wrapper de chromium con un wrapper de ollama encima (además hay muchísimas librerías open source gratis para controlar el navegador).

BrowserOS – la alternativa de código abierto a Perplexity Comet

Resumen de BrowserOS

Funciones principales

Agentes de IA y ejecución local

Herramientas de productividad

Bloqueo de anuncios y tienda MCP (próximamente)

Código abierto y enfoque comunitario