Context Mode: el servidor MCP que ahorra un 98% de la ventana de contexto de los agentes de IA para

xguru · 2026-05-03T09:31:02+09:00

Ahorra los datos en bruto que las llamadas a herramientas MCP vierten en la ventana de contexto y extiende la duración de la sesión de ~30 minutos a ~3 horas Ahorro de contexto: aísla los datos en bruto en un sandbox para reducirlos de 315 KB a 5.4 KB, una disminución del 98% Continuidad de sesión: guarda e indexa todos los eventos —edición de archivos, trabajo con git, tareas, errores y decisiones del usuario— en SQLite+FTS5, y luego los busca con BM25 para rastrear eventos de sesión y recuperar compactaciones Pensar con código: en vez de que el LLM lea los datos directamente, escribe scripts y devuelve solo los resultados (por ejemplo, al contar funciones, escribe el código relacionado sin gastar contexto y obtiene únicamente el resultado real) Compresión de salida: reduce ~65-75% los tokens de salida, manteniendo la precisión técnica Compatible con 14 plataformas: Claude Code (marketplace de plugins), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity, entre otras Según el nivel de hooks disponible en cada plataforma (PreToolUse, PostToolUse, SessionStart, PreCompact), ofrece distintos niveles de soporte para continuidad de sesión y otras funciones Incluye 11 herramientas MCP: ctx_execute (runtime para 11 lenguajes), ctx_batch_execute (ejecución por lotes de múltiples comandos y búsquedas), ctx_execute_file (procesamiento sandbox de archivos), ctx_index/ctx_search (indexación y búsqueda de base de conocimiento con FTS5+BM25), ctx_fetch_and_index (fetch de URL, indexación y caché TTL de 24 horas), ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight Seguridad: aplica al sandbox MCP la misma configuración de permissions de Claude Code (patrones deny/allow), y también inspecciona por separado cada comando encadenado Ejecución totalmente local: sin telemetría, sincronización en la nube ni seguimiento de uso; la base de datos SQLite se guarda en el directorio home Ya lo usan equipos de grandes empresas como Microsoft, Google, Meta, Amazon, NVIDIA, Stripe y Datadog Elastic License 2.0 (código fuente disponible, prohibido ofrecerlo como servicio hospedado)

Ahorra los datos en bruto que las llamadas a herramientas MCP vierten en la ventana de contexto y extiende la duración de la sesión de ~30 minutos a ~3 horas
Ahorro de contexto: aísla los datos en bruto en un sandbox para reducirlos de 315 KB a 5.4 KB, una disminución del 98%
Continuidad de sesión: guarda e indexa todos los eventos —edición de archivos, trabajo con git, tareas, errores y decisiones del usuario— en SQLite+FTS5, y luego los busca con BM25 para rastrear eventos de sesión y recuperar compactaciones
Pensar con código: en vez de que el LLM lea los datos directamente, escribe scripts y devuelve solo los resultados (por ejemplo, al contar funciones, escribe el código relacionado sin gastar contexto y obtiene únicamente el resultado real)
Compresión de salida: reduce ~65-75% los tokens de salida, manteniendo la precisión técnica
Compatible con 14 plataformas: Claude Code (marketplace de plugins), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity, entre otras
- Según el nivel de hooks disponible en cada plataforma (PreToolUse, PostToolUse, SessionStart, PreCompact), ofrece distintos niveles de soporte para continuidad de sesión y otras funciones
Incluye 11 herramientas MCP: ctx_execute (runtime para 11 lenguajes), ctx_batch_execute (ejecución por lotes de múltiples comandos y búsquedas), ctx_execute_file (procesamiento sandbox de archivos), ctx_index/ctx_search (indexación y búsqueda de base de conocimiento con FTS5+BM25), ctx_fetch_and_index (fetch de URL, indexación y caché TTL de 24 horas), ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight
Seguridad: aplica al sandbox MCP la misma configuración de permissions de Claude Code (patrones deny/allow), y también inspecciona por separado cada comando encadenado
Ejecución totalmente local: sin telemetría, sincronización en la nube ni seguimiento de uso; la base de datos SQLite se guarda en el directorio home
Ya lo usan equipos de grandes empresas como Microsoft, Google, Meta, Amazon, NVIDIA, Stripe y Datadog
Elastic License 2.0 (código fuente disponible, prohibido ofrecerlo como servicio hospedado)

8 comentarios

kirkyoon 2026-05-06

Siento que sí se nota. Estoy usando solo MCP y por ahora estoy dejando fuera los hooks.

kaydash 2026-05-04

¿Funciona bien..?

duse0001 2026-05-03

Se siente como una mezcla entre Claude mem y caveman.

recast7838 2026-05-03

Parece que últimamente están de moda los productos y prompts que dicen ahorrar tokens; no sé qué tan efectivo sea en la práctica, eso sí.

kurthong 2026-05-04

Creo que ahorrar tokens y ahorrar ventana de contexto se superponen, pero no son exactamente lo mismo.

Ahorrar tokens es un tema de costo, y ahorrar ventana de contexto es un tema de la calidad de la memoria de trabajo del modelo. Si metes tal cual logs masivos o un DOM snapshot, no solo aumenta el costo, sino que el problema mayor es que crece la posibilidad de que el modelo pase por alto pistas importantes dentro del ruido o haga referencias incorrectas.

Parece más acertado entender context-mode como una herramienta más cercana a “controlar qué se sube al contexto” que a simplemente “usar menos”.

ehlegeth 2026-05-04

Hay que distinguir entre ahorrar tokens y ahorrar ventana de contexto.
Como suelen tratarse juntos, es fácil confundirse.

shakespeares 2026-05-03

Sí, la verdad no sé qué tan práctico sea... me da la impresión de que si lo usas una o dos veces más, terminará consumiendo más tokens...

kyg5474 2026-05-03

¿En serio?

Context Mode: el servidor MCP que ahorra un 98% de la ventana de contexto de los agentes de IA para programar

Lecturas relacionadas

8 comentarios