Hice una demo RAG para buscar 7 tipos de normativa en un solo lugar — MiniLex
(minilex.wellsa.ai)Cuando buscas normativa, es frustrante que tengas que saber algo como "artículo 14 de la Ley de Castigo de Delitos de Violencia Sexual" para poder encontrarlo, así que hice una demo RAG que devuelve los artículos relacionados cuando cualquier persona pregunta usando lenguaje cotidiano tal cual.
Los datos se obtienen de la OpenAPI pública del Ministerio de Legislación y se organizan en Markdown, con actualización diaria mediante cron.
• Leyes (law-kr): 5,589
• Reglamentos administrativos (regulate-kr): 10,765
• Jurisprudencia (precedent-kr): 171,014
• Interpretaciones legales (interpretation-kr): 8,728
• Decisiones del Tribunal Constitucional (constitution-kr): 38,092
• Normativa local (localrule-kr): 159,910
• Tratados (treaty-kr): 6,907
En total, más de 397K documentos Markdown.
Más de 1.36M artículos indexados en la base de datos de producción.
• Demo: https://minilex.wellsa.ai
• Datos/código (MIT): https://github.com/wellsa-ai
• Espejo en HF: https://huggingface.co/wellsa-ai
Verifiqué que en unos 5 escenarios ciudadanos (deepfake / impago de salarios / despido injustificado / filtración de datos personales / acoso) sí devuelve junto con la respuesta los artículos fuente correspondientes, pero todavía está lejos de generalizar bien.
Como depende bastante de palabras clave + expansión de sinónimos, la siguiente tarea es mejorar la generalización del ranking.
La stack es la habitual: Next.js + FastAPI + Celery + PostgreSQL + pgvector, y para embeddings uso nomic-embed-text-v2-moe (768d).
En una evaluación interna con muestras de seguridad obtuve aproximadamente R@5 0.86 / MRR 0.753.
No es una herramienta para sustituir la asesoría legal, sino un apoyo para explorar artículos fuente.
Para decisiones reales, consulta con un profesional calificado.
Se agradecen comentarios / PR.
Aún no hay comentarios.