Context Mode: el servidor MCP que ahorra un 98% de la ventana de contexto de los agentes de IA para programar
(github.com/mksglu)- Ahorra los datos en bruto que las llamadas a herramientas MCP vierten en la ventana de contexto y extiende la duración de la sesión de ~30 minutos a ~3 horas
- Ahorro de contexto: aísla los datos en bruto en un sandbox para reducirlos de 315 KB a 5.4 KB, una disminución del 98%
- Continuidad de sesión: guarda e indexa todos los eventos —edición de archivos, trabajo con git, tareas, errores y decisiones del usuario— en SQLite+FTS5, y luego los busca con BM25 para rastrear eventos de sesión y recuperar compactaciones
- Pensar con código: en vez de que el LLM lea los datos directamente, escribe scripts y devuelve solo los resultados (por ejemplo, al contar funciones, escribe el código relacionado sin gastar contexto y obtiene únicamente el resultado real)
- Compresión de salida: reduce ~65-75% los tokens de salida, manteniendo la precisión técnica
- Compatible con 14 plataformas: Claude Code (marketplace de plugins), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity, entre otras
- Según el nivel de hooks disponible en cada plataforma (PreToolUse, PostToolUse, SessionStart, PreCompact), ofrece distintos niveles de soporte para continuidad de sesión y otras funciones
- Incluye 11 herramientas MCP:
ctx_execute(runtime para 11 lenguajes),ctx_batch_execute(ejecución por lotes de múltiples comandos y búsquedas),ctx_execute_file(procesamiento sandbox de archivos),ctx_index/ctx_search(indexación y búsqueda de base de conocimiento con FTS5+BM25),ctx_fetch_and_index(fetch de URL, indexación y caché TTL de 24 horas),ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight - Seguridad: aplica al sandbox MCP la misma configuración de
permissionsde Claude Code (patrones deny/allow), y también inspecciona por separado cada comando encadenado - Ejecución totalmente local: sin telemetría, sincronización en la nube ni seguimiento de uso; la base de datos SQLite se guarda en el directorio home
- Ya lo usan equipos de grandes empresas como Microsoft, Google, Meta, Amazon, NVIDIA, Stripe y Datadog
- Elastic License 2.0 (código fuente disponible, prohibido ofrecerlo como servicio hospedado)
8 comentarios
Siento que sí se nota. Estoy usando solo MCP y por ahora estoy dejando fuera los hooks.
¿Funciona bien..?
Se siente como una mezcla entre Claude mem y caveman.
Parece que últimamente están de moda los productos y prompts que dicen ahorrar tokens; no sé qué tan efectivo sea en la práctica, eso sí.
Creo que ahorrar tokens y ahorrar ventana de contexto se superponen, pero no son exactamente lo mismo.
Ahorrar tokens es un tema de costo, y ahorrar ventana de contexto es un tema de la calidad de la memoria de trabajo del modelo. Si metes tal cual logs masivos o un DOM snapshot, no solo aumenta el costo, sino que el problema mayor es que crece la posibilidad de que el modelo pase por alto pistas importantes dentro del ruido o haga referencias incorrectas.
Parece más acertado entender
context-modecomo una herramienta más cercana a “controlar qué se sube al contexto” que a simplemente “usar menos”.Hay que distinguir entre ahorrar tokens y ahorrar ventana de contexto.
Como suelen tratarse juntos, es fácil confundirse.
Sí, la verdad no sé qué tan práctico sea... me da la impresión de que si lo usas una o dos veces más, terminará consumiendo más tokens...
¿En serio?