23 puntos por xguru 2026-05-03 | 8 comentarios | Compartir por WhatsApp
  • Ahorra los datos en bruto que las llamadas a herramientas MCP vierten en la ventana de contexto y extiende la duración de la sesión de ~30 minutos a ~3 horas
  • Ahorro de contexto: aísla los datos en bruto en un sandbox para reducirlos de 315 KB a 5.4 KB, una disminución del 98%
  • Continuidad de sesión: guarda e indexa todos los eventos —edición de archivos, trabajo con git, tareas, errores y decisiones del usuario— en SQLite+FTS5, y luego los busca con BM25 para rastrear eventos de sesión y recuperar compactaciones
  • Pensar con código: en vez de que el LLM lea los datos directamente, escribe scripts y devuelve solo los resultados (por ejemplo, al contar funciones, escribe el código relacionado sin gastar contexto y obtiene únicamente el resultado real)
  • Compresión de salida: reduce ~65-75% los tokens de salida, manteniendo la precisión técnica
  • Compatible con 14 plataformas: Claude Code (marketplace de plugins), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity, entre otras
    • Según el nivel de hooks disponible en cada plataforma (PreToolUse, PostToolUse, SessionStart, PreCompact), ofrece distintos niveles de soporte para continuidad de sesión y otras funciones
  • Incluye 11 herramientas MCP: ctx_execute (runtime para 11 lenguajes), ctx_batch_execute (ejecución por lotes de múltiples comandos y búsquedas), ctx_execute_file (procesamiento sandbox de archivos), ctx_index/ctx_search (indexación y búsqueda de base de conocimiento con FTS5+BM25), ctx_fetch_and_index (fetch de URL, indexación y caché TTL de 24 horas), ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight
  • Seguridad: aplica al sandbox MCP la misma configuración de permissions de Claude Code (patrones deny/allow), y también inspecciona por separado cada comando encadenado
  • Ejecución totalmente local: sin telemetría, sincronización en la nube ni seguimiento de uso; la base de datos SQLite se guarda en el directorio home
  • Ya lo usan equipos de grandes empresas como Microsoft, Google, Meta, Amazon, NVIDIA, Stripe y Datadog
  • Elastic License 2.0 (código fuente disponible, prohibido ofrecerlo como servicio hospedado)

8 comentarios

 
kirkyoon 2026-05-06

Siento que sí se nota. Estoy usando solo MCP y por ahora estoy dejando fuera los hooks.

 
kaydash 2026-05-04

¿Funciona bien..?

 
duse0001 2026-05-03

Se siente como una mezcla entre Claude mem y caveman.

 
recast7838 2026-05-03

Parece que últimamente están de moda los productos y prompts que dicen ahorrar tokens; no sé qué tan efectivo sea en la práctica, eso sí.

 
kurthong 2026-05-04

Creo que ahorrar tokens y ahorrar ventana de contexto se superponen, pero no son exactamente lo mismo.

Ahorrar tokens es un tema de costo, y ahorrar ventana de contexto es un tema de la calidad de la memoria de trabajo del modelo. Si metes tal cual logs masivos o un DOM snapshot, no solo aumenta el costo, sino que el problema mayor es que crece la posibilidad de que el modelo pase por alto pistas importantes dentro del ruido o haga referencias incorrectas.

Parece más acertado entender context-mode como una herramienta más cercana a “controlar qué se sube al contexto” que a simplemente “usar menos”.

 
ehlegeth 2026-05-04

Hay que distinguir entre ahorrar tokens y ahorrar ventana de contexto.
Como suelen tratarse juntos, es fácil confundirse.

 
shakespeares 2026-05-03

Sí, la verdad no sé qué tan práctico sea... me da la impresión de que si lo usas una o dos veces más, terminará consumiendo más tokens...

 
kyg5474 2026-05-03

¿En serio?