3 puntos por GN⁺ 2025-06-17 | 1 comentarios | Compartir por WhatsApp
  • Presenta una opinión sobre la posibilidad de acercarse a la inteligencia artificial general (AGI) mediante Claude Code
  • Comparte la impresión del autor tras una sesión real de código con Claude
  • Destaca el nivel que ha alcanzado Claude en capacidad de programación, conocimiento amplio y creatividad
  • Menciona que la comprensión de contexto e interpretación de código de Claude lo diferencia de las herramientas actuales
  • Proyecta el impacto técnico sobre cómo cambiarán el desarrollo y el uso de la inteligencia artificial

Introducción

  • Este texto recoge las ideas del autor sobre el acercamiento a una inteligencia artificial general a nivel humano (AGI) tras experimentar programación con Claude Code
  • El autor sintió un fuerte impacto y entusiasmo por los resultados que Claude mostró recientemente entre las herramientas de inteligencia artificial conversacional

Experiencia de una sesión de programación con Claude

  • Claude puede resolver solicitudes de programación complejas de forma rápida y creativa
  • No solo puede hacer cálculos simples o tareas repetitivas, sino también entender la esencia del problema y proponer enfoques nuevos
  • El autor le pidió a Claude tareas avanzadas como optimización, mejoras de estructura y refactorización de código, y quedó profundamente impresionado por la calidad de esos trabajos
  • Claude mostró una comprensión de contexto superior a la de los LLM existentes, llegando incluso a captar la intención del código

Qué diferencia a Claude Code

  • A diferencia de las inteligencias artificiales conversacionales generales, Claude puede ir más allá de escribir código y asumir el rol de un desarrollador humano en aspectos como la estructura completa del proyecto, revisión de código y explicación de intenciones de largo plazo
  • Puede dar explicaciones detalladas, escribir código de pruebas y adaptarse a diversos lenguajes y paradigmas de programación
  • Demuestra capacidad proactiva al detectar errores lógicos en el código o sugerir direcciones de mejora

Percepción del umbral hacia el AGI

  • Tras la experiencia con Claude Code, el autor sintió una nueva convicción sobre la posibilidad de alcanzar un AGI más cercano a la realidad
  • Prevê que pronto se hará real un cambio desde la forma en que los humanos crean software directamente hacia un entorno de desarrollo impulsado por IA

Conclusión y perspectivas

  • Claude Code no es solo una herramienta de inteligencia artificial más, sino que muestra el potencial de transformar el propio paradigma de uso de la IA
  • En el futuro, se espera que humanos e IA diseñen e implementen programas juntos, formando una cultura de desarrollo de software aún más innovadora

1 comentarios

 
GN⁺ 2025-06-17
Opiniones en Hacker News
  • Comenta que le pareció un artículo realmente genial y que también ha estado compartiendo experiencias y técnicas similares; menciona que, gracias al gran rendimiento de Claude Code, ha sentido en la práctica la eficiencia de procesar varias tareas al mismo tiempo y con rapidez. Sobre la parte de los "sub agents", cuenta que Claude Code le permitió invocar o3 mediante sigoden/aichat, y que así resolvió muchísimos problemas; destaca en especial que o3 es excelente para cuestiones que requieren contexto y alta capacidad de razonamiento, como condiciones de carrera y caza de bugs. Sin embargo, también comenta que desde el lanzamiento de Opus 4 lo usa relativamente menos. Comparte el prompt que usa y un enlace de referencia: advanced_ai.md, y también adjunta el enlace a sigoden/aichat
  • Dice que, siendo sincero, last_week.md le resultó demasiado difícil de leer; cuestiona la confiabilidad del estilo de escritura de los resúmenes hechos por IA porque el texto es excesivamente verboso y parece un documento de PR. Concluye que más bien es mejor revisar directamente el log de commits; sostiene que muchos textos resumidos por IA suelen tener mal estilo y que la fiabilidad de la información sigue sin dejarlo satisfecho. Al final, concluye que en muchos casos leer la fuente original directamente es más rápido y eficiente
    • Dice que con el onboarding sintió la misma confusión y decepción. Comparte una visión escéptica sobre un futuro en el que, en lugar de sentarse con un colega para aprender el codebase de la manera tradicional, uno solo lea diapositivas generadas por IA. Añade que no le entusiasma ese futuro
    • Comparte el system prompt que usa con frecuencia: guía para ser conciso, permitir terminología técnica y evitar marketing plano o expresiones vagas; enfatiza asumir que el usuario tiene experiencia técnica. Dice que no evita por completo las alucinaciones, pero sí ayuda a que las respuestas de IA sobre programación o preguntas técnicas sean más fáciles de leer
    • Menciona que se puede especificar el estilo deseado en el prompt, y da una retroalimentación medio en broma diciendo que el autor del artículo parece preferir un estilo largo y verboso como de PR
    • Comparte una decepción breve: perdió las ganas de seguir leyendo desde "What happened here was more than just code..."
    • Recuerda que, como en el viejo bug de Sycophant, hacer que el usuario “se sienta bien” es un factor que hace que la IA parezca inteligente o que la experiencia se sienta buena. Cuestiona si el objetivo del reinforcement learning de la IA es la precisión, maximizar la interacción, o si ambas cosas entran en conflicto
  • Opina que el ejemplo para explicar el borrow checker de Rust es de lo peor como demostración de capacidad para leer código, y señala que ese contenido ya está incluido en una enorme cantidad de datos de entrenamiento
    • Está de acuerdo y dice que, si le pides a la IA que explique cómo se manejan las excepciones en tareas de asyncio de Python, responde de forma inconsistente y vacilante, casi como el peor pasante posible. Lo compara con una estructura que ni siquiera puede seguir aprendiendo y la considera un desperdicio. Concluye que, si incluso tareas importantes pero relativamente simples salen así, entonces solo se pierde tiempo
  • Deja clara su postura a favor de automatizar scripting con un agente open source agnóstico al LLM; sostiene que esta tecnología está cambiando los cimientos del desarrollo de software, así que debemos seguir controlando cómo trabajamos openhands
    • Dice que parece un buen recurso y menciona modelos potentes que pueden correr en una Nvidia 4090 (24GB RAM), como Devstral y Queen 3. Señala que gracias a Ollama ahora es más fácil ejecutarlos en hardware propio, aunque el costo de la GPU es alto. Pero calcula que, si ya estás pagando $250 al mes por un servicio de pago, montar algo propio puede amortizarse rápido
    • Plantea la pregunta fundamental de qué hacer si los modelos cerrados resultan claramente superiores en calidad
    • Expresa un acuerdo total, “10000%”
  • Señala que no se menciona para nada a Opus. Explica que, tras probar varios modelos, usaba Claude Code con el plan Anthropic "Max" de $100/mes, pero luego descubrió que Opus 4 es el mejor modelo premium para matemáticas, código e investigación. Comparte que, después de chocar con el límite de sesión de 5 horas, se pasó al API y gastó $20 en solo una hora. Al final subió al plan "Max" inferior de $200/mes y ahora dice que lo usa sin problemas y sin topes. Concluye que la elección del modelo realmente importa y que incluso pequeñas diferencias, como encontrarte con “una persona no muy inteligente”, tienen un gran impacto
  • Comparte la idea de que la terminal parece una interfaz realmente perfecta para un LLM, y se pregunta si en el futuro este enfoque podría volverse más dominante que las integraciones personalizadas en IDE
    • Resalta que en la interfaz de terminal se puede acceder a todo el sistema: da como ejemplos revisar una DB con una cuenta de solo lectura usando claude code, abrir un navegador con puppeteer para verificar cambios de CSS, depurar un clúster de k8s y consultar el API de prometheus; dice estar muy satisfecho con eso
    • Imagina un futuro en el que se le pide al LLM que pruebe 5 propuestas de corrección en paralelo para ahorrar tiempo humano. Argumenta que, si esta forma de trabajo se expande, terminaremos ejecutando varios contenedores en paralelo y la ventaja de la interfaz de terminal podría debilitarse relativamente
    • En cambio, otra postura dice que la terminal es la peor interfaz posible, porque no se puede editar directamente el código generado
    • Predice que, cuando los modelos mejoren más, el IDE podría verse como una herramienta de bajo nivel
  • Dice que un equipo con gran atención al detalle es una señal importante de artesanía, pero si los términos de uso de Anthropic son tan contradictorios que resultan impracticables, eso le hace dudar de si es un socio confiable. Señala que la cláusula de prohibición de uso competitivo impide usarlo para trabajo y que eso está muy lejos de ser “three laws safe”
    • Dice que no puede opinar sobre el equipo legal, pero enfatiza que Claude Code, como producto, cuida muy bien los detalles. Menciona incluso la fineza de aplicar haiku en cada contexto para mostrar verbos lindos y apropiados en el indicador de “working…”
  • Da la retroalimentación de que el contraste entre el fondo y el texto de la página es bajo y que eso dificulta la lectura
    • Comparte que a él le cuesta concentrarse por el cursor parpadeante de la parte superior
    • Da un consejo práctico: simplemente saltarse el contenido no produce ninguna pérdida real
  • Coincide con la pregunta de si Claude Code se siente más poderoso que Cursor, y opina que Claude Code es mucho más que solo un editor de código. Cuenta que también lo usa de muchas formas dentro de su Obsidian vault: key bindings personalizados, subida automática de capturas, generación de enlaces para CDN, creación de un programa para resumir comandos de terminal, entre otros casos de uso amplios. Dice que antes dudaba mucho sobre dónde estaba la frontera entre scripts de automatización y trabajo manual, pero ahora está satisfecho porque procesa todo de forma unificada con Claude
    • Señala la limitación de que Claude Code solo puede usarse con suscripción al plan, que no está disponible vía API, y se pregunta si realmente $100/mes alcanza. Aun así, siente que es una herramienta con valor suficiente como para usarla todo el día
    • Expresa interés en escuchar más casos concretos de uso dentro de un Obsidian Vault
    • Comparte que poner al LLM a clasificar una gran cantidad de notas en carpetas por categoría le funcionó muy bien
  • Ante el comentario de que openai codex pronto será reescrito en Rust, responde medio en broma que, si la IA es tan buena, entonces no tendría por qué hacer falta que la IA misma se encargue del redactor