DeepSeek Reasonix - agente de codificación nativo para DeepSeek con alto caché y bajo costo

(esengine.github.io)

3 puntos por GN⁺ 2026-05-25 | 2 comentarios | Compartir por WhatsApp

Agente de codificación de terminal de código abierto diseñado exclusivamente para la API de DeepSeek, que se comunica directamente con api.deepseek.com
El bucle append-only está optimizado para el byte-stable prefix cache de DeepSeek, manteniendo más de 90% de tasa de aciertos de caché en sesiones largas y reduciendo el costo de tokens de entrada a cerca de 1/5 (aproximadamente 1/3 del costo frente a herramientas similares)
Se ejecuta con una sola línea, npx reasonix code, sin necesidad de instalación global (Node ≥ 22, compatible con macOS/Linux/Windows)
3 diseños clave
- Cache-First Loop: estructura append-only, sin dependencia de marcadores y con orden determinista de llamadas para mantener el prefix cache
- R1 Thought Harvest: recopila la cadena de razonamiento de llamadas a herramientas que se salieron
- Tool-Call Repair: recuperación con enfoque self-heal consciente del schema
Principio terminal-first, sin soporte para plugins de IDE, aprovechando directamente herramientas de terminal como git diff y ls
- Basado en TypeScript + Ink TUI, con cliente de escritorio Tauri disponible por separado (incluye runtime de Node)
Operación de modelo V4 en dos niveles: V4-Flash por defecto para iteraciones de bajo costo, promoción a V4-Pro por un solo turno con /pro, y ejecución Pro para toda la sesión con /preset max
Soporte de primera clase para MCP (Model Context Protocol): conexión a servidores externos en una sola línea con --mcp "name=cmd args", compatible con transportes stdio, SSE y Streamable HTTP
Sandbox + compuerta /plan: todas las herramientas integradas están aisladas en sandbox dentro del directorio de ejecución, y el modo /plan funciona como compuerta de auditoría de solo lectura para bloquear escrituras antes de la aprobación
- Las ediciones SEARCH/REPLACE quedan en una cola pendiente y no se reflejan en disco hasta /apply
Composable Skills: coloca archivos Markdown en .reasonix/skills/<name>.md, con frontmatter runAs: subagent y allowed-tools para ejecución aislada
Replay & Events: todos los eventos se registran en disco, lo que permite reproducir sesiones pasadas, obtener estadísticas y auditar con los comandos reasonix replay / events / stats
Extensibilidad basada en texto plano: toda la configuración se administra como texto plano rastreable con git mediante los directorios /mcp, /skills, /memory, /config y /slash
Soporte para endpoints de DeepSeek self-hosted: desde la versión 0.30 se permiten prefijos de clave no estándar; basta con apuntar baseUrl a una dirección interna para que el bucle, el caché y el protocolo de herramientas funcionen igual
Precios de la API de DeepSeek: V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
Licencia MIT

2 comentarios

myoun 2026-05-25

Pensándolo bien, ahora que DeepSeek hizo permanente el descuento de precio de V4 Pro, no se ve nada mal usar DeepSeek como agente de programación.

GN⁺ 2026-05-25

Comentarios de Hacker News

No estoy seguro de que realmente se necesite un agente de código dedicado para DeepSeek para aprovechar el caché de DeepSeek.
Ayer, como el problema de cuota de Codex seguía sin resolverse, hice un puente muy pequeño para usar DeepSeek V4 Pro en Codex, y parecía que casi todo lo que hice quedó cacheado: https://i.imgur.com/7eKn6wN.png
Al 2026-05-23 tenía 39,123,200 tokens de aciertos de caché de entrada y 1,692,286 tokens sin caché, y el puente no hace nada especial; solo adapta el formato de la API de DeepSeek al formato que espera Codex, así que no hay ningún manejo especial relacionado con el caché.
Fuera de que el caché mejore, no me queda claro qué ventaja tiene frente a ejecutar OpenCode directamente con la API de DeepSeek. Eso también seguramente se cachea de forma parecida, se comunica directamente con api.deepseek.com si eso importa, y además te da un entorno de ejecución mucho más maduro.
- Parece mejor enlazar esta página: https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...
  Explica por qué lo consideran una mejor solución y por qué tienen una filosofía de diseño tan fuerte.
  “El almacenamiento automático en caché por prefijo solo se activa cuando coincide el prefijo exacto en bytes de una solicitud anterior. La mayoría de los bucles de agentes reordenan, reescriben o inyectan nuevas marcas de tiempo en cada turno — la tasa real de aciertos de caché es menor al 20%”.
  Así que la idea es optimizar esa parte y otras técnicas para aumentar la tasa de aciertos de caché y bajar costos.
- OpenCode tiene problemas bastante serios de estabilidad del caché, y por ahora no parece haber mucha intención de arreglarlos.
- Pensé exactamente lo mismo, y al revisar el código del proveedor de DeepSeek del agente de código que uso, casi todo lo que escribió el autor ya estaba implementado.
  Para quien tenga curiosidad: http://github.com/tontinton/maki
- Si “hiciste un pequeño puente para usar DeepSeek V4 Pro en Codex”, me da curiosidad si podrías compartir ese puente.
  DeepSeek v4 es excelente si lo usas con claude-code u opencode. En mi caso, claude code me costó menos que opencode, probablemente por un entorno de ejecución mejor diseñado.
- Esto parece conectarse de forma nativa a la terminal. O sea, no parece haber una app aparte que ejecute o envuelva al agente dentro de una TUI.
  Al final, supongo que la idea es ingresar frases normales en inglés en lugar de comandos.
Este sitio web parece hecho por Codex. Le pedí a Codex que generara un HTML con resumen de funciones para el equipo, y salió un monstruo sobredecorado, con cajas enormes de estadísticas casi sin información útil, y hasta la misma tipografía, colores, diseño y sección hero.
También era terrible en móvil, igual que este sitio. Al final le pedí a Claude que hiciera un archivo HTML de una sola página y, explicándole claramente la intención, aproximadamente un 95% quedó utilizable de inmediato con solo unos pocos ajustes.
- Últimamente mucho diseño basado en LLM se ve así. No entiendo por qué a la gente no le parecen feas esas combinaciones de tipografías serif extremadamente inclinadas.
  En móvil, los ejemplos de código siguen empujando el contenido y hacen difícil leer la mayor parte de la página. Claro, quizá sea una crítica muy dura y la intención era buena, pero un sitio más simple habría sido suficiente.
- Decir solo que “Claude hizo un archivo HTML de una sola página y el 95% ya servía” no dice mucho sobre ningún modelo.
  Después de todo, como sabe cualquier ingeniero de software, si quitas funciones, cualquier proyecto se vuelve muchísimo más simple.
Lo que me gustaría que entendiera el autor es que hay gente que quiere un binario único, autocontenido, que no se coma la mitad de la memoria de la computadora, y por eso quiere que esté hecho en Rust o Go.
- Da mucho gusto ver tanto software nuevo hecho en Rust, Go y Zig.
  El valor y la comodidad de desarrollo que ofrecían los lenguajes interpretados lentos se están desvaneciendo cada vez más. Los lenguajes nuevos ya traen de base las cosas buenas o, dicho con más precisión, quizá las alertas de guardia a la 1 de la mañana ya empezaron a hartarnos.
- Más allá de que use AI y de todas las afirmaciones que se hagan, me gustaría que alguien explicara por qué no se podría hacer, por ejemplo, un agente de código en Go puro.
  Go ya tiene muchas buenas librerías de terminal.
- Si quieres probar un binario único y autocontenido que sí se come más de la mitad de la memoria de tu computadora, también está ds4-agent.
- Sobre todo en la era de los agentes de código, si de verdad quieres algo así, ¿por qué no hacerlo tú mismo?
- Ahorrarse programar mientras se construye un bot de programación dice algo.
No me gusta esa página. Por la animación de tipeo, el tamaño del área de ejemplo cambia todo el tiempo y el contenido de abajo se mueve hacia arriba y hacia abajo.
Es una experiencia de usuario realmente mala.
- Haya agente o no, la gente todavía tiene que probar los sitios web en distintas resoluciones o al menos en varios anchos de ventana.
  Pero parece que eso se está volviendo un arte perdido.
- Parece basura de AI de diseño hecha por Claude.
Desde la perspectiva de alguien que lleva un año construyendo entornos de ejecución, la gente de opencode no rompe el caché por prefijo por tonta.
Normalmente lo hacen a propósito porque al probarlo el resultado global sale mejor.
Si crees que dsv4 se comporta lo bastante distinto al promedio de otros modelos, entonces manda un PR al entorno de ejecución que quieras con un parche de manejo especial para esa excepción, respaldado por evidencia. Asumir a ciegas que “por el caché siempre hay que ir con append-only” solo hace perder el tiempo a todos.
Como no es un agente hecho por DeepSeek, el título es engañoso.
La marca DeepSeek ya es lo bastante fuerte como para que la gente quiera subirse a ese reconocimiento de marca.
Bastante interesante. Yo soy suscriptor de Claude de 200 dólares al mes, y hasta ahora casi no había necesitado usar otra cosa.
Pero mientras más limita Claude mi flujo de trabajo, especialmente después de los cambios recientes en IDE/-p, más ganas me dan de irme a otra parte.
Me preocupa porque sí quiero razonamiento de primer nivel, pero DeepSeek me sigue llamando la atención.
- Si quieres razonamiento de primer nivel, vale la pena probar también otros modelos y ver por ti mismo cuánto se diferencian del modelo tope de gama.
  Yo hice eso y me di cuenta de que solo con Qwen-2.5-Max me basta. Para las tareas de juguete que hago, incluso Claude Sonnet 3.5 probablemente sería suficiente. No estoy buscando una medalla Fields en matemáticas.
- Hoy le di una tarea de ingeniería inversa bastante compleja a DS-4 xhigh y a GPT-5.5 xhigh.
  Unas 6 horas después, los dos fallaron en completar la ingeniería inversa, pero la diferencia fue grande.
  DS se detenía cada 30 minutos diciendo que ya había terminado la ingeniería inversa completa y que ahora todo debería funcionar, pero en realidad no había completado ni el 1%. Aunque le indiqué con mucha firmeza que no tomara ciertos atajos, seguía buscándolos; fue un fracaso total.
  En cambio, GPT-5.5 fue realmente impresionante. Hizo correctamente lo que tenía que hacer y no pasó al siguiente paso hasta estar seguro de que había completado las capas iniciales y entendido totalmente lo necesario. Durante 6 horas, yo solo metí prompts cuando vi que iba en la dirección correcta y quise guiarlo ligeramente hacia una forma un poco mejor. No sentí que estuviera peleando con él.
  Claro, después de la compresión a veces salía con cosas tipo “no puedo ayudar con ingeniería inversa”, pero en una sesión nueva eso se resolvía sin problema.
  Cancelé mi suscripción a Claude hace un mes, así que no puedo compararlo, pero DeepSeek me recordó mucho a cómo se sentía trabajar con Opus 4.6/4.7. Para algunos eso puede ser una señal positiva, pero después de ver GPT-5.5 queda claro que la forma de trabajar estilo Claude/DS es demasiado fastidiosa.
- Mejor conserva el plan de 200 dólares al mes y no pruebes un plan de programación de 10 dólares con modelos de pesos abiertos y límites más altos.
  Anthropic necesita tu dinero para sobrevivir, y así podrás dormir mejor pensando que usas lo más avanzado.
- En vez de abandonar por completo los modelos de Anthropic, también puedes usarlos para ciertas tareas, como planificación, y dejar la implementación a algo como DeepSeek.
  Incluso con herramientas distintas, un plan en Markdown funciona bastante bien. Si termino bajando de la suscripción 5x Max a Pro, pienso hacer eso.
  También estoy haciendo un launcher que facilita usar proveedores de terceros desde Claude Code: https://ccode.kronis.dev
  El proxy local ya funciona, y por ahora solo falta el cambio dinámico de modelo. No parece difícil de agregar y, dependiendo del calendario, debería entrar en 1 o 2 semanas.
  No creo que sea inteligente irse del todo de Anthropic. El modelo es excelente y, si te suscribes, también obtienes funciones como Remote Control que me gustan mucho. Pero sí parece posible cambiar de nivel y ahorrar algo de dinero. Aun así, necesitas una línea base de calidad. Cuando antes usé GLM 4.6 en Cerebras, sí me encontré con bastantes resultados flojos.
- Si quieres razonamiento de primer nivel, tienes que usar GPT 5.5 Pro.
Me gusta que esté enfocado en la eficiencia de aciertos de caché. Aplausos al equipo de DeepSeek por crear un gran producto que maximiza la eficiencia de costos para el usuario.
- Lo usé un tiempo y estoy totalmente de acuerdo. Diría que es tan bueno como Codex o Claude, que son los que uso junto con él.
  En los tramos sensibles al costo, gana; y si alguna startup lo empaqueta bien pensando en retención de datos, podría convertirse en un gran producto vendible para empresas. Porque en asistentes de programación el tema clave es la retención de datos y la privacidad.
- Por si acaso, este proyecto es el side project de alguien.
  “Proyecto independiente de código abierto · No afiliado a DeepSeek”.
- Sumado al costo ya barato de la API, probablemente incluso podrías dejar corriendo la misma tarea durante días.
- No entiendo cómo sería posible esa eficiencia de aciertos de caché. ¿No es básicamente cuestión de no cambiar el contexto previo?
  No me queda claro cuáles son las palancas que se pueden ajustar aquí.
Lo probé y el área de entrada de texto tenía fondo negro con una fuente oscura.
Revisé la documentación y le pedí ayuda con la tipografía/estilo a DeepSeek v4, Claude y Gemini, pero nada funcionó salvo ejecutarlo en una terminal con tema oscuro. Es una locura. ¿Ninguno de los desarrolladores de este proyecto usa tema claro?
- Estoy de acuerdo en que es un problema, pero probablemente de verdad no lo usan.
  El tema claro se usa muy rara vez.

DeepSeek Reasonix - agente de codificación nativo para DeepSeek con alto caché y bajo costo

Lecturas relacionadas

2 comentarios

Comentarios de Hacker News