- Cursor anunció que realizó un experimento en el que un ‘agente de programación autónomo’ funcionó durante semanas, explorando si podía automatizar proyectos que a un equipo humano le llevarían meses
- Para validar este sistema, fijó como objetivo ‘crear un navegador web desde cero’, y afirmó que los agentes escribieron más de 1 millón de líneas de código durante aproximadamente una semana
- Sin embargo, el repositorio público de GitHub (
fastrender) muestra numerosos errores de compilación y fallas de CI, lo que confirma que no es un navegador funcional
- Cursor no presentó evidencia de que funcione, ni un demo reproducible, ni un commit que compile, y tampoco hay base concreta del supuesto éxito del experimento
- Aun así, Cursor lo describió diciendo que «los agentes lograron avances significativos en un proyecto grande», dejando una impresión de éxito sin una verificación real del rendimiento
Resumen del experimento en el blog de Cursor
- El 14 de enero de 2026, Cursor publicó una entrada de blog titulada «Scaling long-running autonomous coding»
- El objetivo era explorar «hasta dónde se puede escalar un proyecto que a un equipo humano le tomaría meses usando agentes de programación autónomos»
- Explicó que, tras probar varios enfoques, llegó a un sistema «capaz de resolver problemas de coordinación y escalar a proyectos grandes sin un agente único»
- Para validarlo, realizó un experimento de ‘crear un navegador web desde cero’, y señaló que los agentes escribieron más de 1 millón de líneas de código en 1,000 archivos durante cerca de una semana
Falta de claridad en los resultados del experimento
- Cursor afirmó que «el nuevo agente entendió la base de código y logró avances significativos» y que «cientos de workers hicieron push simultáneamente a la misma rama»
- Sin embargo, no especificó si el navegador realmente funciona
- La publicación incluye un video con capturas de pantalla, pero no hay un demo ejecutable ni una explicación concreta de los resultados
- Más allá de la frase «crear un navegador desde cero es extremadamente difícil», no se presentó ninguna prueba de funcionamiento
Resultado de la verificación de la base de código
- Al compilar directamente el repositorio, ocurre un fallo de compilación de la librería
fastrender (34 errores, 94 advertencias)
- En los resultados recientes de GitHub Actions también se observaron errores de workflow y múltiples fallas de compilación
- Entre los 100 commits más recientes, no hay ni uno solo que haya compilado correctamente
- Se evalúa que el interior del código es un resultado de nivel «AI slop» sin intención ni estructura
- Parece que ni siquiera se ejecutaron los comandos
cargo build o cargo check
- El issue relacionado #98 sigue abierto actualmente
Problemas de reproducibilidad y confiabilidad
- El blog de Cursor no ofrece ninguna explicación sobre cómo ejecutarlo, qué resultados esperar o cómo funciona
- No se proporcionó un demo reproducible, instrucciones de compilación ni un commit validado (tag/release/commit)
- Aun así, la estructura y la redacción del texto hacen que parezca un «prototipo funcional»
- Cursor no afirmó explícitamente que «funciona», por lo que no sería una declaración falsa, pero sí deja una impresión que sugiere éxito
Conclusión y evaluación
- Cursor no afirmó que fuera un «navegador de nivel producción», pero con expresiones como «avances significativos» y «construcción de un navegador» hace que parezca un experimento exitoso
- Sin embargo, no hay ninguna evidencia de funcionamiento, código compilable ni resultados reproducibles
- La afirmación de que «cientos de agentes colaboraron y lograron avances en un proyecto grande» es una aseveración sin ningún tipo de evidencia
- Ni siquiera cumple con el criterio mínimo de «poder compilar y renderizar un archivo HTML simple»
- En consecuencia, el experimento de Cursor termina mostrando más las limitaciones de la generación de código a gran escala que la posibilidad de escalar la programación autónoma
5 comentarios
jajaja
Artículo relacionado - 장시간 실행되는 자율 코딩의 확장
En realidad, lo que demostró con éxito es que todavía no pueden reemplazar a los desarrolladores~
Resultado exitoso = todavía no pueden despedirnos, malditos ejecutivos
Comentarios en Hacker News
Debería quedar arriba del todo la observación de que el experimento de esta semana terminó siendo, en esencia, un wrapper no funcional de Servo (navegador basado en Rust)
El comentario relacionado está aquí
Con los LLM más recientes, parece que también podría servir bastante bien para lavar licencias o plagiar dependencias. Sería un benchmark interesante
Salud por Cursor por darnos el entretenimiento de hoy
Pero luego resulta que no tiene motor y está completamente roto; Cursor da realmente vergüenza ajena
La entrada oficial del blog de Cursor estaba escrita en un tono bastante conservador, pero
en Twitter dio la impresión exagerada de que “hicieron un navegador con GPT-5.2”
En realidad separaron miles de agentes para que acumularan commits durante varias semanas, pero el resultado todavía no funciona
oursotheirssiempre se pueden resolverYo mismo quise comprobarlo y corrí
cargo checksobre los últimos 100 commitsTodos fallaron. Ver registro de resultados
Esta clase de promoción al final parece ser parte de una estrategia de fundraising
Antes también publicaron varias veces posts ambiguos sobre cuánto código habían escrito sus modelos internos
No significa que no haya contenido real, pero decepciona que no compartan públicamente los resultados
Cursor alguna vez estuvo muy de moda, pero ahora los agentes basados en terminal son la tendencia
En nuestra empresa también estamos por cancelar el contrato de Cursor y cambiarnos a Claude Code
Probablemente este proyecto del navegador sea un intento de volver a llamar la atención
Con el anuncio de GPT-5 pasó algo parecido. El avance real se está desacelerando
Al final, la respuesta no es la confianza, sino la verificación
Cursor también está haciendo un clon de Excel con un experimento parecido
Según el repositorio de GitHub,
de 160 mil ejecuciones de workflow solo 247 tuvieron éxito, y la mayoría falló por exceder el presupuesto
A los agentes no les importan en absoluto esas limitaciones
El commit más reciente ya se puede compilar y ejecutar (al menos en Mac)
Pero sigue siendo un desastre de 3 millones de líneas de código
La página que aparece en el video promocional de Cursor no renderiza. Probablemente usaron otro build
cargo checkpasa, pero si uno miragit log, hay algo sospechosoSe ven rastros de que no fueron agentes sino una persona corrigiéndolo directamente
Ver análisis del registro de commits
Creo que el post original era simplemente un titular para generar clics
La frase “miles de agentes de IA hicieron un navegador” es demasiado sensacionalista
Es una lástima que la expresión “fake news” se haya contaminado políticamente. En este campo le queda perfecta
El CEO de Cursor afirmó que “hicieron desde cero en Rust un motor de renderizado y una VM de JS”, pero
si uno revisa la lista de dependencias,
usaron tal cual librerías basadas en Servo como html5ever, cssparser y rquickjs
Al final no pasa de ser algo que envuelve a Servo, y ni siquiera compila
La mayoría de la gente se daría cuenta enseguida con solo ver el código; quizás pensaron que el público no iba a revisar
Así es como se propagan percepciones equivocadas, y después, aunque se corrijan, a nadie le importa
Da risa que eso termine siendo 3M de líneas
Más detalles aquí
Esa es la parte más difícil de un navegador
Creo que este enfoque de marketing más bien les sale por la culata
El diseño y la UX de Cursor son excelentes, pero en trabajos profundos tiene demasiados bugs
Mejoró un poco al agregar modelos de Claude, pero sigue estando por debajo de Antigravity
Además, el límite de la suscripción de $20 se agota rapidísimo. Es poco probable que los modelos se vuelvan 10 veces mejores y 10 veces más baratos
Viendo cómo el modelo de negocio de OpenAI se está volviendo cada vez más dependiente de la publicidad,
me da la impresión de que Google entendía esta tecnología de una forma más realista
Al final, estas historias son sobre todo para los que venden picos y palas
Algún CEO que no entiende mucho podría dejarse engañar por este tipo de noticias y despedir a personal real