turbo-graph – índice de RAG con restricciones que añade memoria de grafos/caché de filtros sobre turbovec
(github.com/bigmacfive)Hola. Creé turbo-graph, que añade una capa de memoria de grafos para RAG con restricciones basada en turbovec/TurboQuant.
turbovec ya funciona bien cuando hay flat top-k o una allowlist barata. Pero en un RAG real, la consulta a menudo termina viéndose así.
tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates
Esa combinación se termina armando cada vez en la capa de Python/SQL/app, luego se vuelve a pasar a la búsqueda vectorial, después se reordenan los resultados con graph/BM25, y se repite el código para explicar por qué salió ese resultado.
turbo-graph mantiene un núcleo compatible con turbovec, y es un experimento para mover a la capa de índice la compilación de vistas de grafos/metadatos a su alrededor, la reutilización de caché, el reranking con grafos y la telemetría para explicaciones.
Como todavía está en Alpha, más que recomendarlo para usarlo de inmediato en producción, quiero recibir feedback sobre qué API se necesita realmente en una ruta de RAG real.
Aún no hay comentarios.