Novedades de la actualización de legalize-kr: se agregan reglamentos administrativos/ordenanzas locales, CLI/MCP/Skill, página del ecosistema y más
(github.com/legalize-kr)Después de presentarlo anteriormente en Show GN, comparto un resumen de las actualizaciones del proyecto legalize-kr durante 1 mes (31 días). Gracias al interés y apoyo de muchas personas, pudimos mejorar varias cosas. ¡Muchas gracias!
¿Qué es legalize-kr?
legalize-kr es un proyecto que archiva las leyes y precedentes judiciales de Corea del Sur que ofrece Open API de información legal nacional del Ministerio de Legislación Gubernamental en formato Markdown + historial de Git. Todas las leyes fueron archivadas como documentos Markdown y todo el historial de reformas como commits de Git; los precedentes también fueron archivados como documentos Markdown y como historial de Git basado en la fecha de la sentencia.
¿Por qué lo hice?
El 30 de marzo encontré en GitHub Trending un proyecto llamado legalize.dev, que gestiona legislación de España y del mundo angloparlante con Markdown y commits de Git. Asumí que también existiría algo similar para la legislación coreana, pero al buscar no encontré nada. Pensé que sería bueno que existiera al menos uno, así que lo hice.
Actualización 1. Se agregan repositorios de reglamentos administrativos / ordenanzas locales
Antes solo manejábamos leyes y precedentes, pero ahora también agregamos, en repositorios separados, los reglamentos administrativos y las ordenanzas locales que ofrece la misma plataforma de información legal nacional. Ahora es posible rastrear en un solo lugar los principales documentos legales públicos de Corea del Sur con Markdown + historial de Git:
- Repositorio de leyes: github.com/legalize-kr/legalize-kr
- Repositorio de precedentes: github.com/legalize-kr/precedent-kr
- Repositorio de reglamentos administrativos: github.com/legalize-kr/admrule-kr
- Repositorio de ordenanzas locales: github.com/legalize-kr/ordinance-kr
Los reglamentos administrativos incluyen directivas, normas interpretativas y avisos de cada ministerio, mientras que las ordenanzas locales son ordenanzas y reglamentos de los gobiernos locales. Como su volumen es mayor que el de las leyes y además se reforman con más frecuencia, me pareció que su valor al rastrearlos con historial de Git puede ser bastante grande. Sin embargo, en el caso de los reglamentos administrativos, rastrear cambios en los nombres de los ministerios o en la distribución de funciones resulta bastante complicado; aunque lo hemos mejorado varias veces, todavía queda bastante camino por recorrer. Les agradeceré mucho su interés y participación.
Actualización 2. Se agregan herramienta CLI, MCP y Agent Skill
La forma más cómoda y recomendable es usar todo el repositorio con git clone, pero como puede ser pesado descargar cada vez repositorios de decenas de GB, creé una herramienta CLI basada en la GitHub REST API. Además, sobre la misma base de código también se ofrece un servidor MCP, y agregué Agent Skills que se pueden usar directamente desde Claude Code / Codex, entre otros:
- Repositorio de CLI / MCP: github.com/legalize-kr/cli-tools
- Repositorio de Agent Skills: github.com/legalize-kr/agent-skills
Sin descargar el repositorio completo, es posible buscar leyes o precedentes específicos, consultar a nivel de artículo o rastrear el historial de reformas, y mediante MCP un LLM/Agent también puede invocarlo directamente. AGENT SKILL también incluye una guía sobre qué conviene usar según la situación: CLI / MCP / git clone / acceso directo a GitHub. Eso sí, la GitHub REST API solo permite 60 solicitudes por hora sin autenticación adicional, por lo que, si lo necesitan, deberán emitir y usar un token de GitHub (hasta 5,000 por hora).
Actualización 3. Se agregan casos de uso / página del ecosistema
Han empezado a aparecer poco a poco proyectos que usan los datasets que ofrece legalize-kr, así que empecé a organizarlos en la parte inferior de la página principal del sitio web y en el menú de “Cómo usarlo”. Además de proyectos que lo usan directamente, también estoy incluyendo otros proyectos o herramientas con objetivos similares (Beommang, Korean Law MCP, etc., que ya habían sido presentados antes en GN).
Si están usando uno o más de los datasets de legalize-kr, o si tienen un proyecto que trabaja en un área similar, avísenme por PR, issue o en los comentarios de esta publicación y lo agregaré a la lista.
Actualización 4. Otras mejoras para un mejor aprovechamiento de los datos
Tomando como referencia los issues de varios repositorios, seguimos trabajando en las reglas de parsing de datos y en la organización de metadatos. Los principales cambios son los siguientes:
- Mejora de las reglas de parsing para unidades adicionales como “inciso” y “subinciso”, además de las ya existentes “parte/capítulo/sección/subsección” (legalize-kr/legalize-kr#32)
- Corrección de la pérdida del patrón
<제M조의 N>(legalize-kr/legalize-kr#31 y legalize-kr/legalize-pipeline#2) - Complemento de leyes faltantes, por ejemplo: Código de Comercio y su decreto de aplicación (legalize-kr/legalize-kr#9)
- Corrección de un problema donde
git logregistraba “agregado” en vez de “modificado” debido a la permanencia de archivos antiguos del reglamento de aplicación previo a la reforma (legalize-kr/legalize-kr#24) - Cambio en los nombres de archivo de precedentes y clasificación de directorios según la fecha de sentencia (legalize-kr/precedent-kr#4)
- Corrección de la ruptura del formato de direcciones en coreano en las URL fuente de los precedentes (error 404 de law.go.kr) (legalize-kr/precedent-kr#3)
- Complemento de 17 commits de Git faltantes en fechas de sentencia expresadas con la era Dangi (檀紀) (legalize-kr/precedent-kr#1)
- Se agregan como lista en el frontmatter de Markdown los enlaces a archivos adjuntos relacionados con cada ley / precedente / reglamento administrativo / ordenanza local
Pueden ver más detalles en los issues cerrados de los principales repositorios:
- Issues cerrados de legalize-kr: https://github.com/legalize-kr/legalize-kr/…
- Issues cerrados de precedent-kr: https://github.com/legalize-kr/precedent-kr/…
- Issues cerrados de legalize-pipeline: https://github.com/legalize-kr/legalize-pipeline/…
Por último
Al principio era algo así como “si lo hago y lo dejo listo, ya se usará en algún lado”, pero desde el último Show GN, con muchas ⭐ y también varios issues, el alcance se ha ido ampliando de forma natural. Sigo dándole mantenimiento y gestionándolo de manera continua, así que agradeceré mucho su interés, apoyo y difusión. ¡Gracias!
2 comentarios
Hay algo que estamos desarrollando en nuestro ministerio con RAG; queremos clonar esto y usarlo extrayendo solo las leyes y regulaciones relacionadas con nuestra área.
¿Sería posible hacerlo así?
Sí, no sé cómo está configurado actualmente el pipeline, pero en principio parece que bastaría con agregar las tareas relacionadas antes de insertar los documentos en la base de datos vectorial para la configuración RAG actual.
Sin embargo, creo que la clave será cómo extraen la "legislación relacionada"; quizá podrían intentar filtrarla en función del nombre de la ley o de palabras clave principales. ^^;
¡Gracias!