1 puntos por mansuiki 4 시간 전 | Aún no hay comentarios. | Compartir por WhatsApp

Hola. Creé turbo-graph, que añade una capa de memoria de grafos para RAG con restricciones basada en turbovec/TurboQuant.

turbovec ya funciona bien cuando hay flat top-k o una allowlist barata. Pero en un RAG real, la consulta a menudo termina viéndose así.

tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates

Esa combinación se termina armando cada vez en la capa de Python/SQL/app, luego se vuelve a pasar a la búsqueda vectorial, después se reordenan los resultados con graph/BM25, y se repite el código para explicar por qué salió ese resultado.

turbo-graph mantiene un núcleo compatible con turbovec, y es un experimento para mover a la capa de índice la compilación de vistas de grafos/metadatos a su alrededor, la reutilización de caché, el reranking con grafos y la telemetría para explicaciones.

Como todavía está en Alpha, más que recomendarlo para usarlo de inmediato en producción, quiero recibir feedback sobre qué API se necesita realmente en una ruta de RAG real.

GitHub:
https://github.com/bigmacfive/turbo-graph

Aún no hay comentarios.

Aún no hay comentarios.