Inhalando el AGI con Claude Code

(kadekillary.work)

3 puntos por GN⁺ 2025-06-17 | 1 comentarios | Compartir por WhatsApp

Presenta una opinión sobre la posibilidad de acercarse a la inteligencia artificial general (AGI) mediante Claude Code
Comparte la impresión del autor tras una sesión real de código con Claude
Destaca el nivel que ha alcanzado Claude en capacidad de programación, conocimiento amplio y creatividad
Menciona que la comprensión de contexto e interpretación de código de Claude lo diferencia de las herramientas actuales
Proyecta el impacto técnico sobre cómo cambiarán el desarrollo y el uso de la inteligencia artificial

Introducción

Este texto recoge las ideas del autor sobre el acercamiento a una inteligencia artificial general a nivel humano (AGI) tras experimentar programación con Claude Code
El autor sintió un fuerte impacto y entusiasmo por los resultados que Claude mostró recientemente entre las herramientas de inteligencia artificial conversacional

Experiencia de una sesión de programación con Claude

Claude puede resolver solicitudes de programación complejas de forma rápida y creativa
No solo puede hacer cálculos simples o tareas repetitivas, sino también entender la esencia del problema y proponer enfoques nuevos
El autor le pidió a Claude tareas avanzadas como optimización, mejoras de estructura y refactorización de código, y quedó profundamente impresionado por la calidad de esos trabajos
Claude mostró una comprensión de contexto superior a la de los LLM existentes, llegando incluso a captar la intención del código

Qué diferencia a Claude Code

A diferencia de las inteligencias artificiales conversacionales generales, Claude puede ir más allá de escribir código y asumir el rol de un desarrollador humano en aspectos como la estructura completa del proyecto, revisión de código y explicación de intenciones de largo plazo
Puede dar explicaciones detalladas, escribir código de pruebas y adaptarse a diversos lenguajes y paradigmas de programación
Demuestra capacidad proactiva al detectar errores lógicos en el código o sugerir direcciones de mejora

Percepción del umbral hacia el AGI

Tras la experiencia con Claude Code, el autor sintió una nueva convicción sobre la posibilidad de alcanzar un AGI más cercano a la realidad
Prevê que pronto se hará real un cambio desde la forma en que los humanos crean software directamente hacia un entorno de desarrollo impulsado por IA

Conclusión y perspectivas

Claude Code no es solo una herramienta de inteligencia artificial más, sino que muestra el potencial de transformar el propio paradigma de uso de la IA
En el futuro, se espera que humanos e IA diseñen e implementen programas juntos, formando una cultura de desarrollo de software aún más innovadora

1 comentarios

GN⁺ 2025-06-17

Opiniones en Hacker News

Aunque tengo un sesgo [0], creo que deberíamos hacer scripting en torno a agentes open source que no dependan de un LLM
Esta tecnología está cambiando los cimientos del desarrollo de software, así que deberíamos asegurarnos de poder seguir controlando nuestra forma de trabajar

[0] https://github.com/all-hands-ai/openhands
- Parece un buen recurso. Hay modelos bastante potentes que se pueden correr en una Nvidia 4090 24GB, y también están Devstral y Qwen 3
  Con Ollama puedes ejecutarlos fácilmente en tu propio hardware, pero el costo de la GPU es una inversión grande. Aun así, si estás pagando 250 dólares al mes por herramientas propietarias, podrías recuperar la inversión bastante rápido
- ¿Qué hacemos si los modelos cerrados simplemente son mejores?
Este artículo está algo disperso. Para empezar, un slide deck no es muy útil para explicar una base de código
Hay una razón por la que la gente casi no usa slide decks salvo como apoyo para presentaciones orales. La mayor parte de lo que aparece en el artículo no son capacidades nuevas, y automatizar workflows claramente es valioso y genial, pero no veo qué tiene que ver AGI con esto
- Además, no me inspira confianza. Creo que el artículo también menciona un poco eso; lo leí por encima
  No deberías necesitar un LLM para entender una base de código. Simplemente hazla más fácil de entender. Claro, al capital le encantan los atajos y los hacks para sacar la siguiente función en el Q3
- Lo más útil que me ha resultado un LLM ha sido crear diagramas mermaidjs del código
  Sé que no siempre son perfectos, pero muchas veces han sido “lo suficientemente buenos”, y en este caso no he visto alucinaciones, solo omisiones. Si ves que falta algo, también es muy fácil pedirle que lo corrija
- Por el tono del artículo, parece que usa AGI medio en broma y que no se toma demasiado en serio a sí mismo, lo cual se siente refrescante
  Claro que no sería refrescante si el artículo no tuviera información útil, pero de hecho creo que un slide deck podría servir para entender una base de código. Es algo “lindo de tener” en lo que no querrías que un junior gastara tiempo, pero si cuesta unos 5 dólares y produce un resultado algo útil, está bastante bien
  Parte del cambio de mentalidad que amplía el uso de LLMs consiste en volver a mirar cosas que antes nos desagradaban porque el esfuerzo era demasiado alto para el valor obtenido. Si no tengo que hacerlo yo ni quemar el tiempo y la salud mental de alguien del equipo, termino diciendo: “Sí, revisa la base de código y escribe todas las funciones y requisitos en un documento Markdown en formato de tabla. Quizá salga mejor de lo esperado; si no, hacemos otra cosa”
Buen artículo. Uso observaciones y técnicas parecidas, y Claude Code es excepcionalmente bueno
Últimamente, gracias a git worktree, la mayoría de los días avanzo varias cosas al mismo tiempo, y cada una va mucho más rápido que antes, al punto de que se siente realmente extraño
En la parte de “subagentes”, tengo que admitir que una configuración en la que Claude Code llama a o3 mediante sigoden/aichat me ha salvado innumerables veces
Hay problemas en los que o3 es especialmente bueno: condiciones de carrera, búsqueda de bugs, cosas que requieren mucho contexto y una capacidad de razonamiento muy alta
Dicho eso, desde que salió Opus 4 lo uso menos y, por supuesto, esto no es en absoluto algo como un subagente
Uso este prompt con @include en mi CLAUDE.md principal: https://github.com/pgflow-dev/pgflow/blob/main/.claude/advan...

sigoden/aichat: https://github.com/sigoden/aichat
- Espera, ¿qué? ¿Cómo haces varias cosas al mismo tiempo con git worktree?
La terminal parece una interfaz casi perfecta para los LLM. Me pregunto si este enfoque terminará siendo preferido frente a las integraciones personalizadas con IDEs
- Sí. Tiene acceso literalmente a todo, incluidos servidores MCP. Me encanta que Claude Code pueda revisar una base de datos con un usuario de solo lectura o abrir un navegador con Puppeteer para comprobar si un cambio de CSS se ve raro
  Es una interfaz perfecta, y Anthropic la hizo bien
  También puede depurar mi clúster de k8s con comandos kubectl y revisar Prometheus vía API; ¿qué tan genial es eso?
- Hasta cierto punto sí, pero creo que el futuro de los LLM irá hacia correr 5 intentos separados en paralelo para generar una corrección, porque el tiempo de LLM es barato frente al tiempo humano
  Cuando ese elemento entre al workflow, vas a querer levantar varios contenedores, y entonces las ventajas de la terminal se debilitan
- A medida que los modelos mejoren, el IDE se verá como una herramienta de bajo nivel
- ¿Qué? La terminal es literalmente la peor interfaz
  ¿No quieres editar directamente el código después de que se genera?
Pedirle que explique el borrow checker de Rust es uno de los peores ejemplos posibles para demostrar capacidad de lectura de código. Hay montones de eso en los datos de entrenamiento
- De acuerdo. Si le pides que explique cómo se manejan las excepciones en tareas de Python asyncio, incluso dándole todo el código, va y viene como el peor pasante del mundo
  Además, no hay forma de “enseñarle”, y aunque la hubiera, no persiste más allá del contexto actual
  Para tareas importantes pero relativamente simples, es una pérdida total de tiempo
- La queja de que “hay montones de eso en los datos de entrenamiento” es extraña
  Si alguien me explica el borrow checker de Rust, ¿debería rechazarlo porque esa persona seguramente ya leyó explicaciones del borrow checker y quejarme de que “estaba en sus datos de entrenamiento”? ¿Crees que alguien entiende el borrow checker sin haberlo aprendido de alguna forma?
  Entiendo en parte lo que quieres decir: no hay mucha evidencia de que estas herramientas puedan generar ideas nuevas, y como tienen tanto conocimiento, es difícil detectar ese fenómeno. Pero en la práctica son útiles y ayudan incluso dentro del marco de las alucinaciones, así que no me preocupa mucho
Si la atención al detalle es una de las mejores señales de que a alguien le importa la artesanía, ¿no es una mala señal, para confiar en Anthropic como administrador prudente de una ASI, que sus términos legales sean lógicamente imposibles de cumplir?
Si no puedes usarlo para trabajar sin violar la prohibición de uso competitivo, difícilmente diría que es “seguro al nivel de las tres leyes de la robótica”
- No sé sobre el departamento legal, pero el producto, Claude Code, muestra señales de una atención al detalle sin escatimar
  Incluso llega al punto de correr Haiku en el contexto para crear verbos lindos y apropiados para el indicador de “working…”
claude --dangerously-skip-permissions # science mode

Me reí al ver esto
De acuerdo. Claude Code se siente más potente que Cursor, y una de las razones parece ser su posibilidad de scripting
Al final, Cursor es un editor, y Claude Code es una navaja suiza con esteroides
Uso mucho Claude Code incluso fuera de codebases tradicionales. Lo corro para todo tipo de cosas en mi bóveda de Obsidian; le pido que me haga scripts para atajos de teclado locales personalizados que suben capturas a mi CDN y devuelven un enlace en Markdown, o que cree programas que se comunican con Ollama para resumir los comandos de terminal del último día
Antes tenía que pensar si valía la pena hacer un script para cambiar formatos de archivo o si lo haría a mano; ahora simplemente ejecuto Claude en ese directorio y dejo que se encargue. Es realmente útil para muchas cosas
- El problema es que Claude Code solo funciona si tienes un plan
  No se puede usar vía API, así que me pregunto si de verdad alcanzan los 100 dólares al mes. Ahora lo uso todo el día, todos los días, y siento que debo estar consumiendo mucho más de los 100 dólares que pago
- Me da mucha curiosidad para qué lo usas en tu bóveda de Obsidian
- ¿Cómo haces scripting con Claude Code? Lo he usado desde la CLI, pero nunca se me había ocurrido invocar Claude Code desde un script; suena bastante interesante
- Hace unos días hice que un LLM organizara una enorme cantidad de mis notas en carpetas por categoría. Dios, fue de gran ayuda
Como comentario al margen, aquí es realmente difícil leer por el contraste entre el fondo y el texto
- En mi caso es por el cursor parpadeante de la parte superior. Me cuesta concentrarme en el texto
- Tampoco te pierdes mucho si simplemente lo saltas
Ni aquí ni allá se ha mencionado todavía Opus
Después de probar de todo, terminé quedándome con el plan “Max” de Anthropic de 100 dólares al mes para usar Claude Code. Luego descubrí que Claude Opus 4 es el mejor modelo para mi situación actual, es decir, código matemático e investigación, pero también el más caro
Me topé con el límite de sesiones de 5 horas y cambié a la API, donde quemé 20 dólares en una hora. Así que subí al plan “Max” de 200 dólares al mes y todavía no he llegado al límite
El modelo importa. Todas estas historias son básicamente como decir “me encontré con alguien no muy inteligente”. Pues claro
- Todo esto lo hice con Opus

Inhalando el AGI con Claude Code

Introducción

Experiencia de una sesión de programación con Claude

Qué diferencia a Claude Code

Percepción del umbral hacia el AGI

Conclusión y perspectivas

Lecturas relacionadas

1 comentarios

Opiniones en Hacker News