7 puntos por meghendra 2026-02-14 | 4 comentarios | Compartir por WhatsApp

Hola. Creé una herramienta de búsqueda de código local-first (code-local) llamada cgrep.

El objetivo principal es reducir el desperdicio de tokens y las búsquedas repetidas que ocurren cuando los agentes de codificación con IA exploran una base de código.
cgrep combina búsqueda BM25 (Tantivy) + análisis de símbolos AST (tree-sitter), y fue diseñada para permitir una exploración más alineada con la intención del código que una simple búsqueda por cadenas.

Funciones principales:

  • Exploración de código: definition / references / callers / dependents
  • Exploración de contexto: read / map
  • Flujo de 2 etapas para agentes: agent locate -> agent expand (encuentra candidatos con una carga pequeña y expande solo lo necesario)
  • Soporte para MCP: cgrep mcp serve + soporte para instalación en host
  • Soporte para instalación de agentes: claude-code, codex, copilot, cursor, opencode

Benchmark basado en PyTorch (6 escenarios de rastreo de implementación):

  • tokens-to-complete con grep: 127,665
  • tokens-to-complete con cgrep (agent locate/expand): 6,153
  • Reducción de tokens de 95.2% (20.75x menos)
  • Latencia promedio de búsqueda hasta completar: 1321.3ms -> 22.7ms (aprox. 58.2x)

Todo el procesamiento funciona localmente (sin dependencia de índices en la nube).

Agradecería su feedback:

  • Qué le falta en bases de código grandes reales
  • Qué mejoras hacen falta en la integración con MCP/agentes
  • Ideas para reforzar los escenarios de benchmark

Repo: https://github.com/meghendra6/cgrep
Docs: https://meghendra6.github.io/cgrep/
Benchmark: https://meghendra6.github.io/cgrep/benchmarks/…

4 comentarios

 
winterjung 2026-02-15

Parece tener un propósito similar a mgrep o la herramienta ck.
En macOS, al intentar ejecutar el binario de lanzamiento a partir de la versión v1.4.1, aparece una advertencia y no se ejecuta.
También pensé que estaría bien que hubiera skills o instructions que el agente pudiera consultar, como en el ejemplo de agent-browser.

 
meghendra 2026-02-16

Había un problema con la firma del binario y ya lo resolví.
¡Gracias por verificarlo y por la reseña!

 
woung717 2026-02-15

El efecto de reducción de tokens es muy bueno. Si en el README también hubiera resultados de benchmarks relacionados con programación, creo que la confiabilidad subiría aún más, incluso si el rendimiento en los benchmarks se mantuviera en un nivel similar.

 
meghendra 2026-02-17

Tal como sugirieron en los comentarios, también añadí los resultados del benchmark para escenarios de agentes de programación reales.
¡Gracias por sus comentarios!