2 puntos por maantano 6 일 전 | 2 comentarios | Compartir por WhatsApp

URL : https://lemini-brown.vercel.app/

Comparto Lemini, un chatbot RAG para consultar leyes y precedentes judiciales de Corea en lenguaje natural. Vi que hace poco se publicó un post sobre un servicio con una línea similar, y nosotros estamos abordando el mismo problema con dos modos distintos, así que lo publico para recibir retroalimentación técnica.

Por qué dos modos

Las preguntas legales suelen dividirse en dos tipos.

  1. "Mi situación es esta, ¿qué debería hacer?" — Al usuario le cuesta explicar adecuadamente los hechos. Si se procesa con un RAG general, solo devuelve respuestas genéricas.
  2. "Revisa este contrato / estos términos" — El documento ya existe, pero si se usa un único prompt de "revísalo", solo salen checklists estándar.

Estos dos tipos no se resuelven con el mismo RAG. Lemini fue diseñado separando los modos en dos.


Modo 1 — Ouroboros (convergencia interactiva de los hechos)

Pregunta → [¿los hechos son suficientes?] ──insuficientes── preguntas de seguimiento de opción múltiple ─┐
│ suficientes │
▼ ←─ respuesta del usuario ┘
RAG (leyes + precedentes + normas autónomas)

Análisis estructurado
· hechos favorables / puntos de atención
· plan de acción
· advertencia de plazos (prescripción)
· precedentes relacionados

Bucle de verificación de citas — elimina citas que no aparecen en los hits de búsqueda

Idea clave en una línea: antes de responder, el modelo se pregunta por sí mismo si "los hechos son suficientes".

Si no lo son, hace preguntas de seguimiento con tarjetas de opción múltiple; si sí lo son, pasa a RAG → análisis estructurado. El usuario no necesita diseñar por su cuenta las preguntas de seguimiento.


Modo 2 — análisis especializado (cadena de 6 pasos para revisión documental)

Entrada del documento

① escaneo completo — naturaleza del documento, resumen de secciones
② mapeo del marco institucional externo — declara en qué marco se apoya este documento
③ RAG por eje — búsqueda de leyes y precedentes para cada eje institucional
② mapeo del marco institucional externo — declara en qué marco se apoya este documento
③ RAG por eje — búsqueda de leyes y precedentes para cada eje institucional
④ revisión por cláusula — observations / gaps / external
⑤ cadena paralela (3 simultáneas)
├ consistencia entre objetivo y medio
├ revisión desde la perspectiva institucional
└ escenarios de riesgo
⑥ verdict de juicio — solo cuando es una pregunta de tipo decisional

Idea clave en una línea: no es un simple "revísalo" con un único prompt, sino que "primero declara el marco institucional externo al documento y entra a partir de ahí".

Este paso ② no salía bien con un único prompt, así que separamos la cadena.


Base común que sostiene ambos modos

  • Bucle de verificación de citas — el LLM compara las citas generadas con los hits de búsqueda, y elimina de la respuesta las que no existen. Evita artículos inventados pero plausibles.
  • Mismo pool para tres tipos de datos — leyes + precedentes + normas autónomas (contratos estándar de la FTC de Corea, reglamentos de asociaciones, lineamientos de KISA y de la Comisión de Protección de Información Personal) cargados en el mismo espacio vectorial.
    Cero bifurcaciones de dominio en el código; solo se distingue por document_type.
  • Pipeline propio de recolección — las leyes se actualizan automáticamente una vez por semana con la API de DRF; los precedentes usan la API compartida del Sistema Nacional de Información Jurídica y caché on-demand.
  • En los prompts priorizamos al máximo la generalidad. No entregamos información para inducir una respuesta, sino que los diseñamos para que produzcan la respuesta adecuada según la pregunta.

Stack

FastAPI / Cloud Run · Next.js · Gemini (JSON estructurado + multichain) · SQLite + matriz propia de embeddings (tres ejes: vectorial, lexical y exacto)

Privacidad

Sin registro ni inicio de sesión, sin almacenamiento de conversaciones en la DB del servidor (browser localStorage), stateless, y la IP solo se usa en memoria para rate limiting.

Limitaciones

No es asesoría legal, sino una herramienta de búsqueda y análisis de información. Hay vacíos en los datos de anexos/formularios y en la cobertura de precedentes. La capacidad de razonamiento del modelo depende de un LLM externo, y el punto donde buscamos diferenciarnos no es en una "respuesta plausible", sino en una "respuesta estructurada con fundamentos verificados".

Qué feedback nos gustaría recibir

  • Modo 1 — casos donde las preguntas de seguimiento de Ouroboros sean fuera de lugar o excesivas
  • Modo 2 — perspectivas faltantes en la cadena de 6 pasos para revisión documental
  • citas incorrectas que el bucle de verificación no haya detectado
  • enfoques que falten frente a otros servicios del mismo dominio

Si lo prueban y nos dejan feedback sin filtro, se los agradeceremos.

2 comentarios

 
dydwls140 6 일 전

Resultado de la revisión del documento
No se pudo verificar
Ocurrió un error durante la revisión del documento. Parece que se produce un error mientras se usa el chatbot y, al buscar el nombre de una ley, el primero aparece con 50%, pero los demás muestran puntajes absurdos como 4565%.

 
maantano 5 일 전

¡¡Gracias!! :'( ¡¡Lo revisaré!!