26 puntos por shuggie 2025-12-19 | Aún no hay comentarios. | Compartir por WhatsApp

Lo desarrollé para resolver las incomodidades del trabajo con documentos HWP, tras 9 años trabajando en un instituto de investigación gubernamental.

Antecedentes del desarrollo

  • 2018: en mis inicios con Python, intenté un convertidor HML/HWPML basado en expresiones regulares - https://github.com/msjang/md2hml
  • Enero de 2025: desarrollo de hwpfy
    • Consolidación de reportes semanales de trabajo de unas 20 personas basada en una wiki con edición colaborativa en tiempo real
    • Wiki → exportar a DOCX → convertir a DOCX con formato para organismos públicos (hwpfy) → abrir en la app de Hancom y guardar como HWPX → compartir como HWPX con el departamento superior dentro de la institución
  • Diciembre de 2025: pypandoc-hwpx
    • Como sentí que ya había acumulado suficiente experiencia, esta vez lo desarrollé dedicándole tiempo en serio.

Método de desarrollo

  1. Creé un DOCX con el formato deseado y lo guardé como HWPX.
  2. Descomprimí el DOCX y el HWPX generados para revisar los XML, eliminé propiedades innecesarias y los ajusté. También verifiqué que se abrieran correctamente tanto en Word como en la app de Hancom.
  3. Creé un documento para comparar los formatos md, html, docx y hwpx. - https://github.com/msjang/pypandoc-hwpx/…
  4. Originalmente iba a usar el format_comparison.md de arriba para pedirle a un LLM que escribiera el código, pero me di cuenta de que ya tenía un HWPX de referencia con la respuesta correcta.
  5. Lo fui construyendo tras varias rondas de retroalimentación con Antigravity (Gemini Pro 3). Como no salía en el formato que quería, revisé el XML en detalle y fui dando feedback. Aunque no mencioné de forma directa el documento de comparación de formatos, haber asimilado su contenido me ayudó mucho al revisar.

Próximos pasos

Quiero quitar Python de Pypandoc, programarlo en Haskell y contribuir un writer de HWPX a Pandoc.

Aún no hay comentarios.

Aún no hay comentarios.