- Anthropic presentó la versión web de Claude Code, permitiendo a los desarrolladores delegar tareas de código directamente desde el navegador
- Tras conectar un repositorio de GitHub y describir la tarea, Claude la implementa automáticamente en un entorno en la nube y admite múltiples tareas en paralelo (parallel tasks)
- Cada sesión se ejecuta en un entorno sandbox aislado para mantener la seguridad, y ofrece creación automática de PR y resumen de cambios
- Esta versión beta también puede usarse en la app de iOS, lo que permite modificar y revisar código incluso en movimiento
- Aplica un modelo de ejecución en la nube centrado en la seguridad, reforzando al mismo tiempo la eficiencia de desarrollo y la seguridad
Ejecución de código basada en navegador
- Anthropic lanzó la función Claude Code on the web
- Es una función que permite delegar y ejecutar tareas de programación directamente con Claude desde el navegador, sin terminal
- Si conectas un repositorio de GitHub y describes la tarea, Claude escribe y modifica el código automáticamente
- Cada tarea se ejecuta de forma independiente en un entorno aislado en la nube y es posible seguir el progreso en tiempo real
- El usuario también puede dirigir manualmente (steer) el rumbo del trabajo de Claude mientras se está ejecutando
Soporte para trabajo en paralelo
- Claude Code puede realizar tareas simultáneamente en varios repositorios (parallel execution)
- Esto permite llevar en paralelo corrección de bugs, mejoras rutinarias y desarrollo simultáneo
- Al terminar, crea automáticamente un Pull Request (PR) y ofrece un resumen de cambios, acelerando el desarrollo
- Gracias al procesamiento paralelo basado en la nube, es posible avanzar en varios proyectos al mismo tiempo sin las limitaciones de recursos del entorno local
Adecuado para distintos flujos de trabajo
- La versión web complementa el flujo de trabajo existente de Claude Code, y es especialmente adecuada para tareas como las siguientes
- Preguntas y respuestas sobre la estructura del proyecto o el mapeo del código, y exploración del código
- Corrección de bugs o resolución de tareas repetitivas y claramente definidas
- Cambios de backend y aplicación de desarrollo guiado por pruebas (TDD)
- También está disponible en la beta de la app de iOS, por lo que se pueden hacer experimentos de programación en la nube con Claude incluso estando en movimiento
Ejecución en sandbox centrada en la seguridad
- Todas las tareas se ejecutan en un entorno sandbox con restricciones de red y sistema de archivos
- Mediante control de acceso a Git a través de un proxy de seguridad, solo se permite acceder a los repositorios autorizados
- Con una configuración de red personalizada, se pueden añadir de forma selectiva dominios permitidos (por ejemplo, para descargar paquetes de npm)
- La arquitectura detallada se presenta en el blog oficial de ingeniería y en la documentación
Cómo empezar
- Claude Code on the web está disponible actualmente como research preview para usuarios Pro y Max
- En claude.com/code puedes conectar tu primer repositorio y empezar a trabajar
- Las sesiones en la nube comparten el mismo límite de solicitudes (rate limit) que Claude Code existente
- Puedes consultar más detalles en la documentación oficial
Implicaciones
- La versión web de Claude Code acelera la transición a la nube de la “programación tipo agente de IA” y
plantea un nuevo paradigma de entorno de desarrollo que fortalece a la vez la velocidad de desarrollo, la seguridad y la movilidad
2 comentarios
Lo probé y, como era de esperarse, está mejor de lo que pensaba.
Opiniones de Hacker News
Me gustaría escuchar experiencias sobre en qué se diferencian Codex / Claude Code de trabajar con chat o agents en Cursor, y cuál es mejor; lo pregunto porque quiero ser un ingeniero más eficiente en la empresa.
Nuestro equipo usó Claude Code muchísimo hasta el año pasado, al punto de gastar más de $70K al año, pero casi cambiamos por completo a Codex CLI. Gracias a Codex CLI pudimos sacar adelante trabajos de software a gran escala que antes eran imposibles tanto para mí como para cualquiera de mi equipo. Ahora solo consultamos CC más o menos una vez cada dos semanas para revisión de código y documentación de bugs, y su tasa de éxito es regular. Cuando apareció Claude Code por primera vez fue realmente sorprendente y valía la pena suscribirse de inmediato. Pero Codex alcanzó a CC y es mucho mejor en tareas largas y problemas difíciles. Claude Code a veces simplemente se rendía ante problemas complicados y llegaba a decir que mejor compráramos una solución ya hecha. Con Codex, la capacidad de la organización de software en sí mejoró muchísimo, y eso apenas se está empezando a conocer. No tengo relación con ninguna empresa de IA; personalmente quería apoyar a Anthropic, pero Codex CLI es abrumadoramente mejor y además más barato. Creo que Anthropic necesita algo realmente innovador para volver a alcanzar a OpenAI; por ahora Codex va claramente adelante.
Yo también he usado Codex CLI y de verdad es excelente. Pero todavía no puedo cambiarme por completo porque le faltan funciones importantes que uso todos los días en Claude Code. Por ejemplo: el sistema de permisos para comandos Bash, rollback tanto en la conversación como en el código, cambio fácil del modo de aprobación (keybind), enviar mensajes durante una tarea (Codex los deja en cola hasta que termina; Claude permite inyección en tiempo real), lo molesto de tener que aceptar repetidamente los mismos comandos en Codex (Claude permite fijar aprobaciones por sesión), manejo de contexto con Agents, un verdadero modo de planificación, la función de Skills con carga diferida. El sandbox de Codex es confuso de usar, y como por defecto bloquea directorios del sistema o el acceso a internet, los comandos fallan seguido. Además, Codex maneja comandos con Python en vez de Bash, lo que hace más difícil supervisarlo. Si Codex alcanza esas funciones, consideraría seriamente cambiarme; hasta entonces, es más bien un gran modelo con una carcasa regular.
Mi opinión no pretende ser publicidad, pero como internet hoy está lleno de anuncios, de repente me dio curiosidad cuánto pagaría OpenAI para poner en HN un comentario tan elogioso como este en la parte superior.
También estoy totalmente de acuerdo. Todavía recuerdo ese cambio casi mágico alrededor de junio. De un momento a otro empecé a pasar noches enteras experimentando cosas que técnicamente no sabía hacer, solo porque en concepto parecían posibles. Pensé que iba a reemplazar Claude Code con Codex CLI (GPT-5), pero ahora siento que GPT-5 Codex es mucho mejor para mi trabajo (aunque mi industria es de nicho, así que Codex es más débil en varios conocimientos clave del dominio). Claude Sonnet 4.5 sigue siendo mejor para trabajo de scaffold, pero para implementar funciones reales Codex produce código más sólido y limpio. Por fin se siente real eso del marketing de “como un ingeniero senior”. Además, Codex cuesta entre 40 y 50% menos. Para superarlo ahora sí haría falta una evolución realmente innovadora. De aquí en adelante, el mayor reto para los agentes será la velocidad. Si CC fuera dos o tres veces más rápido, lo seguiría usando aunque la calidad fuera igual; si no, Codex es mi herramienta principal.
De hecho, si pones a Codex CLI (
gpt-5-codex high) y Claude Code 4.5 sonnet (a veces opus 4.1) a hacer la misma tarea larga unas diez veces, y luego les pides a ambos modelos que evalúen el trabajo del otro, en el 100% de los casos ambos concluyen que Codex es mejor. Claude omite requisitos, se vuelve descuidado y se dispersa constantemente, mientras que Codex cumple todos los requisitos. Codex es más lento, sí, pero me entrega resultados que no necesito estar corrigiendo una y otra vez, así que me deja mucho más satisfecho.En Codex casi no tengo nada que hacer, y Claude Code es rápido y entiende bien el “contexto”. Claude también prueba mejor su propio código. Esperaba que los dos modelos fueran parecidos, así que el resultado me sorprendió.
El fin de semana pasado probé anticipadamente Claude Code y compartí unas notas en mi blog. Es un producto realmente sólido, y la idea es montar una UI web/móvil encima de Claude Code CLI (usando
claude --dangerously-skip-permissions). Anthropic reconoce que un “Claude Code sin necesidad de aprobar cada paso” mejora mucho la productividad, así que está invirtiendo en sandboxing.Lo interesante es que, en mi caso, obtuve mejores resultados justo desactivando “allow edits” en CC, porque así puedo editar directamente en línea y revisar el código al mismo tiempo. En cambio, Codex me sirve mejor para crear features rápido “como yesca” y luego olvidarme de ellas. Pero Claude tiene ventaja para entender la intención del problema, y su velocidad y ciclo de iteración son más rápidos.
Me pregunto si tienen una idea clara de qué tan graves pueden ser los problemas dentro de un entorno sandbox. Cosas como listas de archivos o dominios permitidos básicamente parecen condenadas a convertirse en vulnerabilidades que se repetirán durante décadas. Me preocupa que la seguridad sea del nivel de meter input al shell con backslashes.
Las tres cosas que me parecieron interesantes esta vez fueron: la llegada de Claude Code a iOS, la transición natural de la web al CLI, y que hayan abierto como código abierto un sandbox nativo del sistema operativo para restringir
fsy red sin contenedores. Eso sí, aunque resaltan la restricción de red saliente, me parece un poco flojo que la allowlist incluya dominios fáciles de usar para exfiltración comogist.github.com.El enlace de GitHub al sandbox nativo está aquí.
Me alegra que lo hayan añadido directo a la app; al probarlo, sí me parece que ahora mismo tiene varios bugs.
La filtración de información siempre puede ocurrir. La cuestión es si para un atacante es lo suficientemente difícil atravesar mis defensas. Pero también da cosa publicar este tipo de cosas bien organizadas si luego terminan volviendo como datos de entrenamiento.
Creo que este tipo de agentes en segundo plano todavía no me da la experiencia de desarrollo que espero. Tener que hacer push de una rama solo por PR desde un entorno al que no tengo acceso, y luego volver a hacer checkout localmente, es incómodo. La codificación con IA necesita estar acoplada de forma estrecha al loop de desarrollo, y el PR debería ser la etapa final de revisión, no el flujo principal donde se desarrolla el código. Lo normal debería ser un entorno aislado conectado con un clic vía Cursor/VSCode Remote SSH. La verdad es que ninguna herramienta de IA, incluida Claude, ha acertado de lleno en el primer intento; siempre hace falta retocar manualmente. Revisar y pulir directamente en el IDE es lo de todos los días.
A mí me parece mucho más simple ejecutar el agent directamente en un servidor remoto de pruebas/desarrollo por SSH y luego hacer una sanity check con VS Code. Eso es mucho más práctico que desarrollo local o configuraciones complejas.
Esta presentación me decepcionó un poco, porque lo que de verdad quiero es una app compañera (móvil/web) conectada al entorno CLI. Debería soportar SSH a una VM de servidor de desarrollo ya existente, VSCode Remote y Web (TTY en navegador o tunnel de
vscode.dev). Estaría buenísimo poder ir caminando, revisar si Claude sigue trabajando bien, y dejarle comentarios tipo “LGTM” para que sigaPLAN.md. Hacer SSH desde la pantalla táctil del teléfono es incómodo, así que con una simple UI de chat bastaría. He visto cosas parecidas de vez en cuando en proyectos del lado de GitHub o en Show HN como “Happy Coder”, pero nunca las he usado en serio, así que lo ideal sería una integración de primera mano.Creo que este fenómeno apunta a un problema más fundamental: la mayoría de las pruebas y depuración de código son casi imposibles de hacer en remoto. El entorno de trabajo es un contenedor efímero, así que no tiene ninguno de mis datos, solo el repositorio. Por ejemplo, el modelo no puede hacer
npm run dev, abrir una página web, hacer clics, verificar comportamiento, ejecutar builds pesados, ni conservar sesiones o datos diarios. El concepto de un agent ejecutándose en la nube está bien, pero necesita un entorno mucho más persistente, y desde la propia UI debería poder desarrollar web apps, programas con GUI, ejecutarlos e interactuar con ellos; solo así sería usar una computadora de verdad. Con los modelos actuales, esto probablemente sigue siendo demasiado caro como para ofrecerlo al público masivo.Coincido en que iterar y revisar código mediante PR no encaja. Los desarrolladores humanos hemos trabajado así hasta ahora, pero no le va bien ni al código generado por IA ni a los agentes de coding. En vez de forzarlos a entrar en ese molde, hace falta algo como un git nativo para IA.
Pero los managers reaccionan mucho mejor a argumentos de venta tipo “metes una story y te llega un PR, listo”.
El video demo de YouTube da bastante risa. Aquí está el demo. El desarrollador mete un prompt y simplemente recibe comentarios sobre un PR generado; ni siquiera mira directamente el resultado que produjo. El mercado objetivo queda clarísimo.
¿Esto sería como Jules / Codex / Copilot agent? O sea, ¿un sistema donde mandas una solicitud en la nube y al rato te devuelve el resultado en un PR? Me da curiosidad, porque lo curioso es que todos parecen converger hacia un conjunto de funciones muy parecido, y al final la elección parece depender del gusto personal. Ahora mismo, gracias a Copilot + Codex, siento que tengo a 4 ingenieros autónomos trabajando para mí, y puedo repartirles tareas según dificultad y velocidad, así que mi productividad subió muchísimo. Y creo que los startups que gritaban “Claude in the cloud” la van a tener difícil de aquí en adelante.
Últimamente veo por todos lados comentarios de “me cambié de Claude Code con uso de $70K+ a codex CLI”. Yo también me pasé de Cursor a CC en junio-julio, y unos 8 meses antes había hecho lo mismo desde VSCode + Copilot por la misma razón. Al principio pensé que todos esos comentarios eran puro guerrilla marketing, pero CC sí era claramente mejor que Cursor. Ahora también me dan ganas de probar Codex, y me parece positivo que tantos competidores estén empujando avances tan rápidos. Cuesta creer que en solo unos meses ya cambié tres veces de IDE y de workflow, y la verdad eso también cansa bastante.
OpenAI limita cuánto “puede pensar profundamente”
gpt-5-codexsegún el plan de suscripción, mientras que Anthropic/Claude parece limitar solo por uso. Yo también pruebo Codex cada mes, pero muchas veces lo que termina mergeándose mejor es lo que hizo Charlie ($500/mes) o Claude. Puede variar mucho según la tarea.Hoy en día la parte del IDE ya está bastante separada, así que cansa menos. Parece difícil que Cursor pueda competir si solo vende tokens y va erosionando el contexto. Voy alternando entre CC y Codex, pero en general Codex está en otra liga. Por ahora se siente como si no tuviera reemplazo.
Hay algo que me gustaría ver en las interfaces web de IA: que tanto
claude.aicomochatgpt.compermitan login estándar con usuario/contraseña sin 2FA, como cualquier otro SaaS, para que quienes usan navegadores centrados en la privacidad puedan entrar rápido y sin fricción. Preferiría evitar autenticaciones externas poco confiables como SSO; el login por correo de Anthropic o el MFA de OpenAI cortan por completo el flujo y resultan incómodos. También es molesto tener que combinar un cliente de escritorio separado y poco confiable con una sandbox en máquina virtual. Con poder usarlo directo desde el navegador web sería suficiente.Últimamente hay muchos ataques de credential stuffing por reutilización de contraseñas, así que MFA es una de las medidas de seguridad más efectivas. Si las empresas no la implementan, pueden terminar comiéndose un aluvión de chargebacks de tarjeta de crédito. Ojalá se vuelva estándar contrastar las nuevas contraseñas contra bases de datos filtradas (como haveibeenpwned). Yo uso un workflow parecido, y recomiendo los sitios con login por passkey porque te dejan entrar sin tiempo de espera.
¿Qué tal si soportaran algo como WebAuthn? El sistema actual de login de
claud.aies bastante incómodo.Hace poco hice algo parecido para OpenCode y dejo también el enlace open source por si a alguien le sirve. Puede ejecutarse también en modo frontend (pronto habrá una versión hospedada), y además puedes conectarlo apuntando a tu propio servidor API de OpenCode. O también puedes levantar el servidor API y exponerlo con un proxy para acceder de forma segura desde la web. La UI es responsive, y lo clave es que permite lanzar solicitudes a la IA desde el teléfono mientras estás fuera (“haz X”) y procesarlas al instante. No levanta un entorno sandbox por sí mismo, pero el usuario puede combinarlo libremente con cualquier sandbox que quiera. A diferencia de Claude Code, también te deja usar el modelo que prefieras.