OpenDocuments – plataforma RAG de código abierto para buscar documentos organizacionales dispersos con lenguaje natural
(github.com/joungminsung)Es una plataforma RAG self-hosted creada para resolver el problema de que los documentos del equipo están dispersos entre GitHub, Notion, Drive, Confluence y otros servicios, lo que dificulta encontrarlos.
Al conectar las fuentes de documentos, los parsea, fragmenta y genera embeddings para indexarlos; luego, al hacer preguntas en lenguaje natural, responde junto con sus fuentes.
- Conectores: GitHub, Notion, GDrive, S3, Confluence, Swagger, rastreador web, búsqueda web de Tavily
- Formatos de archivo: 12 tipos, incluyendo PDF, DOCX, XLSX, HTML, Jupyter, código fuente y correo electrónico
- LLM: puede ejecutarse localmente con Ollama (sin filtración de datos). También soporta OpenAI/Claude/Gemini/Grok
- Búsqueda: híbrida de vectores + palabras clave, reranking, protección contra alucinaciones
- Búsqueda cruzada coreano-inglés
- Integración con Claude Code/Cursor mediante servidor MCP
- Web UI, CLI con 17 comandos, SDK de TypeScript
- Sistema de plugins (parser/conector/modelo/middleware)
- Soporte para despliegue con Docker
Stack: TypeScript, Hono, React, SQLite, LanceDB, Turborepo
51 suites de prueba / ~300 pruebas
Licencia MIT.
3 comentarios
Les comparto la actualización v0.2.0.
Lo principal de esta versión es eliminar las barreras de instalación y mejorar la usabilidad en escenarios reales.
Integración de Ollama con un solo toque: detección automática de si está instalado → si no lo está, instalación automática según el OS → incluso descarga automática del modelo de embeddings, todo de una sola vez. Con una sola línea,
docker compose up, se levanta todo el stack, incluido el LLM local.Conversación multiturno: la versión anterior solo permitía consultas aisladas, pero ahora es posible mantener el contexto y tener una conversación continua.
Más de 10 parches de seguridad: corregimos de una sola vez los problemas detectados mediante feedback de la comunidad y auditoría interna, como inyección SQL en FTS5, path traversal, ataque de fijación de estado de OAuth y ReDoS.
Además: carga automática de
.env, 3 reintentos en caso de fallo al conectar con el modelo + mensajes de error específicos, y una ampliación integral de la documentación de la API de plugins.Notas de la versión: https://github.com/joungminsung/OpenDocuments/releases/
Si encuentran algún error o inconveniente durante el uso, les agradeceríamos que lo reportaran en un issue de GitHub.
Responderemos de inmediato en cuanto lo publiquen.
Se omitió la publicación del paquete de npm. Les pedimos disculpas a quienes no pudieron instalarlo después de clonarlo. Ya completamos la publicación correctamente, así que les agradeceríamos que lo intentaran de nuevo con el comando actualizado del Readme.