DeepSeek Reasonix - agente de codificación nativo para DeepSeek con alto caché y bajo costo
(esengine.github.io)- Agente de codificación de terminal de código abierto diseñado exclusivamente para la API de DeepSeek, que se comunica directamente con
api.deepseek.com - El bucle append-only está optimizado para el byte-stable prefix cache de DeepSeek, manteniendo más de 90% de tasa de aciertos de caché en sesiones largas y reduciendo el costo de tokens de entrada a cerca de 1/5 (aproximadamente 1/3 del costo frente a herramientas similares)
- Se ejecuta con una sola línea,
npx reasonix code, sin necesidad de instalación global (Node ≥ 22, compatible con macOS/Linux/Windows) - 3 diseños clave
- Cache-First Loop: estructura append-only, sin dependencia de marcadores y con orden determinista de llamadas para mantener el prefix cache
- R1 Thought Harvest: recopila la cadena de razonamiento de llamadas a herramientas que se salieron
- Tool-Call Repair: recuperación con enfoque self-heal consciente del schema
- Principio terminal-first, sin soporte para plugins de IDE, aprovechando directamente herramientas de terminal como
git diffyls- Basado en TypeScript + Ink TUI, con cliente de escritorio Tauri disponible por separado (incluye runtime de Node)
- Operación de modelo V4 en dos niveles: V4-Flash por defecto para iteraciones de bajo costo, promoción a V4-Pro por un solo turno con
/pro, y ejecución Pro para toda la sesión con/preset max - Soporte de primera clase para MCP (Model Context Protocol): conexión a servidores externos en una sola línea con
--mcp "name=cmd args", compatible con transportes stdio, SSE y Streamable HTTP - Sandbox + compuerta
/plan: todas las herramientas integradas están aisladas en sandbox dentro del directorio de ejecución, y el modo/planfunciona como compuerta de auditoría de solo lectura para bloquear escrituras antes de la aprobación- Las ediciones SEARCH/REPLACE quedan en una cola pendiente y no se reflejan en disco hasta
/apply
- Las ediciones SEARCH/REPLACE quedan en una cola pendiente y no se reflejan en disco hasta
- Composable Skills: coloca archivos Markdown en
.reasonix/skills/<name>.md, con frontmatterrunAs: subagentyallowed-toolspara ejecución aislada - Replay & Events: todos los eventos se registran en disco, lo que permite reproducir sesiones pasadas, obtener estadísticas y auditar con los comandos
reasonix replay / events / stats - Extensibilidad basada en texto plano: toda la configuración se administra como texto plano rastreable con git mediante los directorios
/mcp,/skills,/memory,/configy/slash - Soporte para endpoints de DeepSeek self-hosted: desde la versión 0.30 se permiten prefijos de clave no estándar; basta con apuntar
baseUrla una dirección interna para que el bucle, el caché y el protocolo de herramientas funcionen igual - Precios de la API de DeepSeek: V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
- Licencia MIT
1 comentarios
Comentarios de Hacker News
No estoy seguro de que realmente se necesite un agente de código dedicado para DeepSeek para aprovechar el caché de DeepSeek.
Ayer, como el problema de cuota de Codex seguía sin resolverse, hice un puente muy pequeño para usar DeepSeek V4 Pro en Codex, y parecía que casi todo lo que hice quedó cacheado: https://i.imgur.com/7eKn6wN.png
Al 2026-05-23 tenía 39,123,200 tokens de aciertos de caché de entrada y 1,692,286 tokens sin caché, y el puente no hace nada especial; solo adapta el formato de la API de DeepSeek al formato que espera Codex, así que no hay ningún manejo especial relacionado con el caché.
Fuera de que el caché mejore, no me queda claro qué ventaja tiene frente a ejecutar OpenCode directamente con la API de DeepSeek. Eso también seguramente se cachea de forma parecida, se comunica directamente con api.deepseek.com si eso importa, y además te da un entorno de ejecución mucho más maduro.
Explica por qué lo consideran una mejor solución y por qué tienen una filosofía de diseño tan fuerte.
“El almacenamiento automático en caché por prefijo solo se activa cuando coincide el prefijo exacto en bytes de una solicitud anterior. La mayoría de los bucles de agentes reordenan, reescriben o inyectan nuevas marcas de tiempo en cada turno — la tasa real de aciertos de caché es menor al 20%”.
Así que la idea es optimizar esa parte y otras técnicas para aumentar la tasa de aciertos de caché y bajar costos.
Para quien tenga curiosidad: http://github.com/tontinton/maki
DeepSeek v4 es excelente si lo usas con claude-code u opencode. En mi caso, claude code me costó menos que opencode, probablemente por un entorno de ejecución mejor diseñado.
Al final, supongo que la idea es ingresar frases normales en inglés en lugar de comandos.
Este sitio web parece hecho por Codex. Le pedí a Codex que generara un HTML con resumen de funciones para el equipo, y salió un monstruo sobredecorado, con cajas enormes de estadísticas casi sin información útil, y hasta la misma tipografía, colores, diseño y sección hero.
También era terrible en móvil, igual que este sitio. Al final le pedí a Claude que hiciera un archivo HTML de una sola página y, explicándole claramente la intención, aproximadamente un 95% quedó utilizable de inmediato con solo unos pocos ajustes.
En móvil, los ejemplos de código siguen empujando el contenido y hacen difícil leer la mayor parte de la página. Claro, quizá sea una crítica muy dura y la intención era buena, pero un sitio más simple habría sido suficiente.
Después de todo, como sabe cualquier ingeniero de software, si quitas funciones, cualquier proyecto se vuelve muchísimo más simple.
Lo que me gustaría que entendiera el autor es que hay gente que quiere un binario único, autocontenido, que no se coma la mitad de la memoria de la computadora, y por eso quiere que esté hecho en Rust o Go.
El valor y la comodidad de desarrollo que ofrecían los lenguajes interpretados lentos se están desvaneciendo cada vez más. Los lenguajes nuevos ya traen de base las cosas buenas o, dicho con más precisión, quizá las alertas de guardia a la 1 de la mañana ya empezaron a hartarnos.
Go ya tiene muchas buenas librerías de terminal.
No me gusta esa página. Por la animación de tipeo, el tamaño del área de ejemplo cambia todo el tiempo y el contenido de abajo se mueve hacia arriba y hacia abajo.
Es una experiencia de usuario realmente mala.
Pero parece que eso se está volviendo un arte perdido.
Desde la perspectiva de alguien que lleva un año construyendo entornos de ejecución, la gente de opencode no rompe el caché por prefijo por tonta.
Normalmente lo hacen a propósito porque al probarlo el resultado global sale mejor.
Si crees que dsv4 se comporta lo bastante distinto al promedio de otros modelos, entonces manda un PR al entorno de ejecución que quieras con un parche de manejo especial para esa excepción, respaldado por evidencia. Asumir a ciegas que “por el caché siempre hay que ir con append-only” solo hace perder el tiempo a todos.
Como no es un agente hecho por DeepSeek, el título es engañoso.
La marca DeepSeek ya es lo bastante fuerte como para que la gente quiera subirse a ese reconocimiento de marca.
Bastante interesante. Yo soy suscriptor de Claude de 200 dólares al mes, y hasta ahora casi no había necesitado usar otra cosa.
Pero mientras más limita Claude mi flujo de trabajo, especialmente después de los cambios recientes en IDE/-p, más ganas me dan de irme a otra parte.
Me preocupa porque sí quiero razonamiento de primer nivel, pero DeepSeek me sigue llamando la atención.
Yo hice eso y me di cuenta de que solo con Qwen-2.5-Max me basta. Para las tareas de juguete que hago, incluso Claude Sonnet 3.5 probablemente sería suficiente. No estoy buscando una medalla Fields en matemáticas.
Unas 6 horas después, los dos fallaron en completar la ingeniería inversa, pero la diferencia fue grande.
DS se detenía cada 30 minutos diciendo que ya había terminado la ingeniería inversa completa y que ahora todo debería funcionar, pero en realidad no había completado ni el 1%. Aunque le indiqué con mucha firmeza que no tomara ciertos atajos, seguía buscándolos; fue un fracaso total.
En cambio, GPT-5.5 fue realmente impresionante. Hizo correctamente lo que tenía que hacer y no pasó al siguiente paso hasta estar seguro de que había completado las capas iniciales y entendido totalmente lo necesario. Durante 6 horas, yo solo metí prompts cuando vi que iba en la dirección correcta y quise guiarlo ligeramente hacia una forma un poco mejor. No sentí que estuviera peleando con él.
Claro, después de la compresión a veces salía con cosas tipo “no puedo ayudar con ingeniería inversa”, pero en una sesión nueva eso se resolvía sin problema.
Cancelé mi suscripción a Claude hace un mes, así que no puedo compararlo, pero DeepSeek me recordó mucho a cómo se sentía trabajar con Opus 4.6/4.7. Para algunos eso puede ser una señal positiva, pero después de ver GPT-5.5 queda claro que la forma de trabajar estilo Claude/DS es demasiado fastidiosa.
Anthropic necesita tu dinero para sobrevivir, y así podrás dormir mejor pensando que usas lo más avanzado.
Incluso con herramientas distintas, un plan en Markdown funciona bastante bien. Si termino bajando de la suscripción 5x Max a Pro, pienso hacer eso.
También estoy haciendo un launcher que facilita usar proveedores de terceros desde Claude Code: https://ccode.kronis.dev
El proxy local ya funciona, y por ahora solo falta el cambio dinámico de modelo. No parece difícil de agregar y, dependiendo del calendario, debería entrar en 1 o 2 semanas.
No creo que sea inteligente irse del todo de Anthropic. El modelo es excelente y, si te suscribes, también obtienes funciones como Remote Control que me gustan mucho. Pero sí parece posible cambiar de nivel y ahorrar algo de dinero. Aun así, necesitas una línea base de calidad. Cuando antes usé GLM 4.6 en Cerebras, sí me encontré con bastantes resultados flojos.
Me gusta que esté enfocado en la eficiencia de aciertos de caché. Aplausos al equipo de DeepSeek por crear un gran producto que maximiza la eficiencia de costos para el usuario.
En los tramos sensibles al costo, gana; y si alguna startup lo empaqueta bien pensando en retención de datos, podría convertirse en un gran producto vendible para empresas. Porque en asistentes de programación el tema clave es la retención de datos y la privacidad.
“Proyecto independiente de código abierto · No afiliado a DeepSeek”.
No me queda claro cuáles son las palancas que se pueden ajustar aquí.
Lo probé y el área de entrada de texto tenía fondo negro con una fuente oscura.
Revisé la documentación y le pedí ayuda con la tipografía/estilo a DeepSeek v4, Claude y Gemini, pero nada funcionó salvo ejecutarlo en una terminal con tema oscuro. Es una locura. ¿Ninguno de los desarrolladores de este proyecto usa tema claro?
El tema claro se usa muy rara vez.