20 puntos por GN⁺ 2025-10-02 | 1 comentarios | Compartir por WhatsApp
  • Claude Code ha evolucionado más allá de una simple herramienta de programación para convertirse en un sistema operativo para agentes, un sistema innovador que admite diversos flujos de trabajo mediante acceso al sistema de archivos e integración con comandos de Unix
  • En particular, su integración con el sistema de notas de Obsidian automatiza la toma de notas, la investigación y la organización del pensamiento, e implementa un sistema operativo completo de notas accesible incluso desde el móvil mediante conexión SSH
  • La función de acceso al sistema de archivos es el factor diferencial clave, ya que permite mantener memoria y estado entre conversaciones, resolviendo así las limitaciones fatales de ChatGPT o Claude en el navegador: las restricciones de la ventana de contexto y los límites de memoria
  • La filosofía Unix (simplicidad, componibilidad y procesamiento de flujos de texto) coincide perfectamente con la forma en que los LLM usan herramientas, redescubriendo principios de diseño de hace 50 años como la arquitectura óptima para los sistemas modernos de IA
  • A través de casos prácticos de uso como la automatización del correo electrónico (Inbox Magic) y herramientas de código abierto (Claudesidian), se enfatiza que los sistemas de agentes basados en sistema de archivos son la base para construir aplicaciones de IA más confiables y depurables que las complejas estructuras multiagente

Qué hace especial a Claude Code

  • Últimamente, en mis conversaciones sobre IA siempre he hablado con entusiasmo de las sorprendentes capacidades de Claude Code, explicando que esta herramienta ha pasado de ser un simple asistente de programación a un sistema operativo completo para agentes
  • En especial, la integración con la app de notas Obsidian es clave; a diferencia de Notion o Evernote, Obsidian guarda todos los archivos en el disco local como archivos Markdown comunes
    • Gracias a esta característica, se convirtió en el objetivo ideal para una herramienta de programación con IA; al principio empecé con Cursor, pero pronto me pasé a Claude Code
    • Llegué a depender tanto de este sistema que terminé montando un servidor en casa y accediendo por SSH desde el smartphone para poder escribir notas, leerlas y organizar ideas incluso mientras me desplazo
  • Hace unas semanas participé en el podcast AI & I de Dan Shipper, donde expliqué este sistema en profundidad, y en este texto comparto ideas adicionales que descubrí después

La superioridad de Claude Code frente a Cursor

  • Aunque era difícil responder a la pregunta "¿qué hace especial a Claude Code?", llegué a la conclusión de que no es que sea mejor que Cursor en todo, sino que la combinación de ciertos elementos funciona de forma excepcional
  • Últimamente lo uso más para construir cosas completamente nuevas sobre las capacidades de Claude Code que para trabajar sobre bases de código ya existentes
  • Armonía perfecta con la filosofía Unix

    • El secreto de Claude Code está en su enfoque de herramientas: como aplicación basada en terminal, renuncia a cierta accesibilidad, pero a cambio ofrece una poderosa integración nativa con comandos de Unix
    • La filosofía Unix fue documentada por Doug McIlroy en 1978 en Bell System Technical Journal, donde presentó cuatro principios clave:
      • 1. Hacer que cada programa haga bien una sola cosa. Para una tarea nueva, construir algo nuevo en lugar de añadir funciones al programa existente
      • 2. Esperar que la salida de todo programa pueda convertirse en la entrada de otro programa aún no conocido
      • 3. Diseñar y construir software para poder probarlo pronto, idealmente en cuestión de semanas
      • 4. Usar herramientas para aligerar el trabajo de programación en lugar de depender de mano de obra no calificada
    • Peter H. Salus lo resumió en 1994 en "A Quarter-Century of Unix":
      • Escribir programas que hagan bien una sola cosa
      • Escribir programas que trabajen juntos
      • Escribir programas que procesen flujos de texto (porque es una interfaz universal)
  • Compatibilidad perfecta entre los LLM y los comandos de Unix

    • Estos principios de hace 50 años coinciden exactamente con la forma en que los LLM utilizan herramientas
    • Los modelos están constantemente "canalizando" salidas hacia entradas (con su propia lógica difusa en el medio), conectando la salida de un comando con la entrada de otro, como el comando | de Unix
    • Cuando un modelo no logra combinar herramientas de forma efectiva, casi siempre se debe a que la herramienta es excesivamente compleja
    • La primera razón por la que Claude Code es tan sorprendente: los comandos que impulsan Unix son perfectamente adecuados para el uso por parte de LLM
      • No solo son simples, sino que además están muy bien documentados, por lo que había abundante material para que el modelo aprendiera
  • La revolución del acceso al sistema de archivos

    • El otro elemento es la capacidad de Claude Code para escribir código y, más recientemente, prosa
    • Encontré la respuesta al leer el análisis profundo de Pragmatic Engineer sobre cómo se construyó Claude Code: acceso al sistema de archivos
    • El sistema de archivos lo cambia todo
      • Dos fallas fatales de ChatGPT y Claude en el navegador: no tienen memoria entre conversaciones y su ventana de contexto es estrecha
      • El sistema de archivos resuelve ambos problemas: Claude Code puede escribirse notas a sí mismo, acumular conocimiento y mantener agregados en ejecución
      • Tiene estado y memoria, y puede pensar más allá de una sola conversación

Overhang de IA (AI Overhang)

  • Cuando usé por primera vez la API de GPT-3 en 2022, predije que aunque el modelo no mejorara más allá de ese momento, harían falta 10 años para descubrir sus casos de uso
  • Los modelos sí mejoraron (los modelos de razonamiento hicieron confiable el uso de llamadas a herramientas), y el descubrimiento del sistema de archivos demuestra ese argumento
  • En la entrevista de Pragmatic Engineer, Boris Cherney, quien construyó las primeras versiones de Claude Code, lo explica con el concepto de "product overhang":
    • El product overhang se refiere a una situación en la que el modelo puede realizar cierta tarea, pero el producto donde se ejecuta la IA no está construido para capturar esa capacidad
    • El modelo ya podía explorar el sistema de archivos, pero no existía un producto construido alrededor de esa función
  • El autor sostiene que se trata de la combinación de sistema de archivos + comandos Unix, pero el punto central es que la capacidad del modelo ya existía y solo estaba esperando despertar
  • Claude Code funciona como un plano para construir sistemas de agentes confiables porque captura las capacidades del modelo en lugar de limitarlas mediante interfaces sobre diseñadas

Más allá del código

Proyecto de código abierto Claudesidian

  • He hablado de mi configuración de Claude Code + Obsidian y, de hecho, fui un paso más allá al liberar como código abierto "Claudesidian"
    • Incluye muchas de las herramientas y comandos que uso en mi configuración de Claude Code + Obsidian
    • Lo utilicé como campo de experimentación y, en particular, construí una herramienta inicial de actualización
    • Cuando hay cambios en el repositorio central, puedo traerlos a mi Claudesidian, y la IA revisa si hubo cambios en los archivos actualizados; si los hay, intenta fusionarlos inteligentemente con la nueva actualización
  • Ambos proyectos siguen los mismos principios de la filosofía Unix: herramientas simples, componibles, que hacen bien una sola cosa y trabajan juntas

Inbox Magic - sistema de automatización de correo electrónico

  • Aún no está listo para lanzarse, pero estoy trabajando en un proyecto llamado "Inbox Magic" (pienso ponerle un nombre mejor) que planeo mostrar pronto
  • Es un repositorio de Claude Code con acceso a un conjunto de herramientas de Gmail y, mediante muchos prompts y comandos, funciona como un asistente de correo electrónico
  • Por ahora sus funciones son bastante simples:
    • Puede ejecutar búsquedas o enviar correos en tu lugar
    • Puede realizar un entrenamiento completo para clasificar correos y aprender el estilo de redacción de emails
    • Tanto Claude Code como ChatGPT pueden acceder a los correos, pero por lo general solo recuperan uno o dos a la vez
    • Este sistema puede escribir en archivos y usar varias técnicas, por lo que puede hacer tareas como "encontrar todos los correos relacionados con viajes en la bandeja de entrada, construir un perfil de hábitos de viaje y usarlo como prompt para que ChatGPT/Claude investigue viajes de acuerdo con tus preferencias reales"
  • Si quieres probarlo, envíame tu nombre de usuario de GitHub y te lo compartiré en cuanto esté listo para pruebas

Lecciones clave

  • Normalmente evito las conclusiones, pero aquí hay algunas lecciones que vale la pena recalcar:
  • 1. El sistema de archivos es una gran herramienta para resolver la falta de memoria y estado de los LLM y debería usarse más a menudo
  • 2. Para que el uso de herramientas funcione, hay que centrarse en seguir la filosofía Unix
  • 3. Claude Code representa el plano de los futuros sistemas de agentes
    • Sistema de archivos + filosofía Unix debería ser la plantilla para construir agentes de IA confiables y depurables en lugar de los complejos sistemas multiagente que circulan hoy
    • En lo táctico, al construir uso de herramientas para tus propios proyectos, la clave es mantenerlo simple y dejar que el hilo principal del modelo las "canalice"
    • Un gran problema que todos los agentes/chatbots deben resolver: la capacidad de canalizar sin pasar por la ventana de contexto
  • 4. Quien no encuentra casos de uso para los LLM es porque no se está esforzando lo suficiente

1 comentarios

 
GN⁺ 2025-10-02
Opiniones de Hacker News
  • Me encanta que Claude Code funcione al estilo Unix: puedes crear fácilmente otras herramientas con estilo Unix y Claude las usa de inmediato sin trabajo extra de integración; basta con darle el man de la herramienta y la usa con soltura, sin necesidad de MCP ni definiciones complejas de herramientas; incluso funciona sin problema con una herramienta de acceso al navegador que hice yo mismo

    • Hace poco actualicé Mansnip, una herramienta que mejora la búsqueda en manpages para esta era de los LLM; creo que también sería buena idea envolverla como un STDIO MCP, y quizá valdría la pena ponerle una API a este código y publicar también el servidor en pip; no parece tan difícil

    • Me da curiosidad cómo Claude Code usa el navegador desde mis scripts o herramientas; yo quiero manipular directamente ventanas de sesiones existentes de Safari, pero casi todo está pensado solo para Chrome o para instancias nuevas separadas

    • Hubo un momento en que me di cuenta de que, en vez de pedirle a Claude que encontrara problemas por sí solo, era mucho más eficiente enseñarle a usar un linter; ni siquiera tuve que indicarle cuál usar, solo le di una lista y lo instalé, y enseguida empezó a aprovecharlo; cuando intenté programar con ChatGPT no esperaba mucho porque requería demasiado esfuerzo para obtener resultados útiles, pero con Claude Code ha sido una experiencia realmente sorprendente

  • Todas las apps GUI son distintas entre sí y existen como castillos con sus propias murallas, casi como feudos aislados dentro del OS; en cambio, la CLI es una plaza común donde todos se reúnen, un mercado de información donde circulan datos y señales; ni siquiera necesitas sentir que perteneces a algo para entrar a esa plaza; lo más parecido del lado GUI sería Smalltalk, pero incluso ahí tienes que jurar lealtad antes de poder entrar

    • En realidad, también han existido sistemas GUI con bastante interoperabilidad y composabilidad, como NextSTEP o dbus; si uno quisiera, también se puede construir una GUI basada en APIs abiertas con gráficos encima; no es común, pero técnicamente es posible

    • Aunque parezcan fortalezas encerradas dentro del OS, desde el punto de vista del usuario común las apps GUI se prefieren muchísimo más que las apps CLI; si solo hubiera existido la CLI, la adopción masiva de las computadoras habría sido mucho más lenta

  • Que una herramienta emergente se ejecute en la terminal no significa automáticamente que sea una “implementación real de la filosofía UNIX”; esa comparación en sí no tiene sentido; yo también terminé cayendo en este tipo de bait al estilo Hacker News

    • La filosofía UNIX aquí no se refiere simplemente a apps de terminal, sino a que los LLM modernos puedan ejecutar comandos de shell directamente; eso hace posible que un LLM realice casi cualquier actividad que un humano puede hacer desde el shell

    • Si ves el núcleo de la filosofía UNIX: 1) programas pequeños que hacen una sola cosa, 2) que pueden combinarse para realizar tareas más complejas, 3) uso de flujos de texto como interfaz universal, todo eso encaja increíblemente bien con los LLM; gracias a una interfaz textual única como exec(), todas las herramientas operan sobre archivos y pueden recibir y producir texto, así que un LLM puede utilizarlas de inmediato; esta arquitectura de software no era inevitable, pero tal como se construyó resulta ideal para los LLM

    • Los tres comentarios principales también se sienten como si los hubiera escrito un LLM al que le pidieron hacerse autopromoción

  • Hubo un tiempo en que se hablaba mucho de la desaparición de la CLI, pero últimamente con herramientas como claude code más bien se ha convertido en una interfaz superior; no quiero plantearlo como una rivalidad con nadie, pero este cambio de panorama me parece interesante

    • En realidad, para desarrolladores y usuarios avanzados nunca existió eso de “CLI is dead”; para usuarios comunes puede parecer que desapareció cuando llegó la GUI, pero en la práctica la CLI siempre ha estado ahí en segundo plano; OS X trajo un shell Unix de verdad, Windows tiene PowerShell y Linux directamente domina el mercado de servidores

    • Yo también estoy construyendo interfaces GUI personalizadas; estoy creando prácticamente un entorno de escritorio completo ajustado a mi manera de usar la computadora; antes usaba mucho la terminal porque las herramientas GUI convencionales me resultaban incómodas, pero últimamente mi entorno de UI ha ido mejorando bastante

  • La combinación de Claude y Obsidian crea un flujo de trabajo muy bueno; le delego a la IA todas las tareas repetitivas de gestión de notas; yo voy acumulando notas diarias en formato stream of consciousness, y de ahí extraigo ideas nuevas, proyectos y materiales; Gemini también funciona bastante bien

  • En la integración entre LLM y Obsidian hay que mencionar sí o sí los plugins; los plugins de Obsidian se pueden personalizar fácilmente, y es posible ejecutar scripts de JavaScript desde carpetas locales; Claude Code es excelente para escribir y modificar este tipo de plugins; por ejemplo, hice un programa personalizado que sincroniza automáticamente archivos de Obsidian a un repo de Github según una marca de publicación, y gracias a eso, cuando actualizo notas mi sitio web se actualiza enseguida en Netlify

  • Puede que al autor le convenga más un servicio como omnara.com, al que se puede entrar directamente desde el teléfono sin SSH; yo uso un entorno parecido con Obsidian y Claude Code ejecutándose de forma headless todo el tiempo, y acceso directo desde una app en el celular

  • Quiero usar Claude Code, pero como no tengo claro exactamente cuántos datos locales y archivos se envían por la red, en algunas situaciones es difícil adoptarlo

  • Yo mismo implementé con MCP una función como esta
    { "name": "unshare_exec", "description": "ejecutar un binario en un namespace de Linux con unshare", "inputSchema": { "type": "object", "properties": { "binary": {"type": "string"}, "args": {"type": "array", "items": {"type": "string"}} }, "required": ["binary"], "additionalProperties": false } }
    Al principio solo usaba unshare, y hubo algo de yak shaving en el camino, pero al final logré correr gemma3 localmente y ejecutar libremente utilidades basadas en Debian, con resultados sorprendentes

    • ¿Podrías compartir aunque sea parte de todo ese yak hair, es decir, del trabajo previo que preparaste? Las experiencias que yo probé con LLM locales no me dejaron muy satisfecho
  • Quiero un entorno completamente local con Obsidian, un LLM local y todo open source; eso es el futuro que espero

    • Gracias a los LLM, la utilidad y el valor del software open source están creciendo todavía más; antes, aunque un programa fuera open source, era difícil modificarlo por cuenta propia porque costaba entender la estructura del código, pero ahora con LLM tareas como hacer pequeños parches o agregar funciones nuevas se han vuelto mucho más fáciles; es decir, el programa tiene que ser open source para que yo pueda adaptarlo a mi gusto, y eso importa hoy más que nunca

    • Open-weights por sí solo no basta; para que tenga sentido de verdad también hay que poder manejar directamente el dataset y el pipeline de entrenamiento; claro, la mayoría de la gente no tendrá la infraestructura para ejecutar por sí misma ese pipeline, pero hace falta transparencia sobre cómo se usan los datos y cómo se entrena el modelo para poder hablar realmente de propiedad y evaluación de sesgos

    • Un entorno con Org mode local, LLM local, todo orquestado en Emacs y funcionando completamente con software libre sería increíble; si me jubilo y tengo mucho tiempo, es un sueño que sí me gustaría intentar

    • Si te interesa, recomiendo este texto: https://laurentcazanove.com/blog/obsidian-rag-api

    • Me pregunto si en la práctica no será imposible correr localmente modelos de un tamaño realmente útil, sobre todo en una máquina de desarrollo con 64GB de RAM y una sola GPU