R2R V2 - motor RAG de código abierto listo para producción
(github.com/SciPhi-AI)- Diseñado para cerrar la brecha entre los experimentos locales con LLM y los sistemas de Retrieval-Augmented Generation (RAG) de nivel de producción
- Ofrece un sistema RAG integral y moderno, construido para que los desarrolladores lo usen fácilmente con un enfoque centrado en la API RESTful
Funciones principales
- Soporte multimodal: compatible con varios formatos de archivo como
.txt,.pdf,.json,.png,.mp3, entre otros. - Búsqueda híbrida: combina búsqueda semántica y por palabras clave para mejorar la relevancia.
- Graph RAG: extrae relaciones automáticamente y construye un grafo de conocimiento.
- Gestión de aplicaciones: administra documentos y usuarios de forma eficiente, y ofrece capacidades ricas de observabilidad y análisis.
- Cliente-servidor: compatible con API RESTful.
- Configurable: permite aprovisionar aplicaciones usando archivos de configuración intuitivos.
- Extensible: permite ampliar fácilmente la aplicación mediante el patrón builder + factory.
- Panel de control: incluye el panel de R2R, una app de código abierto en React+Next.js para una interacción fácil de usar.
Panel de R2R
Puedes interactuar con R2R usando el panel de código abierto en React+Next.js; consulta el Cookbook del panel para comenzar.
1 comentarios
Opiniones en Hacker News
Precisión y eficiencia de la extracción de datos: En los sistemas RAG, el proceso de extracción de datos es un desafío importante. Como los enfoques tradicionales de OCR se quedan cortos, se usa un enfoque de LLM multimodal + OCR para mejorar la precisión y la consistencia.
Experiencia operando un stack similar: Han operado un stack similar durante 2 años, usando tecnologías como Pgvector, HyDe, búsqueda web + búsqueda de documentos. También cuentan con un buen dashboard con logs y analítica.
Dificultades para empezar rápido: El inicio rápido en realidad no es tan rápido. Deberían ofrecer una configuración que incluya Docker Compose y una imagen de Postgres. También es incómodo tener que clonar un repositorio aparte para usar el dashboard.
Complejidad del proyecto: El proyecto incluye muchos elementos, pero eso no necesariamente facilita el desarrollo. No queda claro si es un SDK o una colección de apps. Deberían ofrecer una experiencia de instalación de "1 clic" para poder previsualizar todas las funciones.
Verificación de precisión: Preguntan cómo se puede verificar la precisión de las respuestas. También tienen curiosidad por saber si existe una forma de rastrear el proceso mediante el cual se generó una respuesta.
Dificultades en la recolección de datos: En muchos proyectos RAG, la recolección de datos no está bien resuelta. Preguntan cómo recopilar en lote una gran cantidad de documentos HTML en el sistema.
Recolección de datos multimodales: Piden una explicación más detallada del proceso de recolección de datos multimodales. Preguntan qué tipos de datos puede procesar actualmente R2R y cómo se generan embeddings para tipos de datos no textuales.
Optimización para equipos de desarrollo: Piden una explicación de cómo el proceso se volvió más rápido y optimizado para el equipo de desarrollo. Tiene un gran potencial para acelerar el tiempo de desarrollo de un MVP.
Trabajo con código fuente: Están buscando una solución RAG capaz de entender código fuente. Por ejemplo, quieren una función que pueda comprender el "evento analítico que se llama al hacer clic en el botón de envío".
En contra del uso de Neo4j: No quieren usar Neo4j porque consume muchos recursos.
Integración con frontends de chat populares: Preguntan si hay integración con frontends de chat populares como OpenWebUI.