2 puntos por rkawkancla 4 시간 전 | Aún no hay comentarios. | Compartir por WhatsApp
Publicidad

Creé una herramienta de código abierto que permite grabar reuniones en coreano localmente, transcribirlas, resumirlas, organizarlas en un Decision Wiki y buscarlas (chat con IA).

Creo que podría ser útil para quienes, como yo, por su entorno de trabajo no pueden usar IA externa ni servicios de grabación o transcripción de reuniones.
En los días en que hay más de 10 reuniones, con solo revisar las minutas y los action items que salieron de ellas ya te espera quedarte trabajando hasta tarde.
El problema no era tanto dejar registro de la minuta, sino dejarla en una forma que pudiera encontrarse de nuevo más adelante.

Por eso, más que una simple transcripción de reuniones, lo estoy construyendo con el objetivo de crear un Decision Wiki local que vaya acumulando las decisiones y los action items surgidos en las reuniones junto con la evidencia en el texto original.

  • Para que pueda funcionar incluso en un equipo del nivel de una M4 con 16 GB....

Actualmente apunta a este flujo:

  • Ejecución local en Mac con Apple Silicon
  • Grabación/transcripción de reuniones en coreano
  • Separación de hablantes
  • Corrección/resumen basado en LLM local (Gemma E4B)
  • Búsqueda de reuniones basada en ChromaDB + SQLite FTS5
  • Organización de decisiones y action items en un Wiki Markdown
  • Verificación de la evidencia del timestamp original desde los artículos del Wiki
  • Búsqueda/chat basados en el texto original de la reunión y el Wiki

Todo el procesamiento fue diseñado para realizarse localmente. Se priorizaron entornos en los que es difícil enviar datos de reuniones a APIs externas o subir discusiones internas de la organización a servicios externos.

Aún está en beta temprana y es solo para Mac con Apple Silicon. (Me resulta difícil probar otros entornos...)

Como necesita varios modelos, el proceso de instalación tampoco es del todo ligero.
Para usar el modelo de separación de hablantes de pyannote, hace falta aceptar el gated model de HuggingFace y configurar un token, y como se usan modelos locales también hay requisitos de hardware.

Aun así, lo publiqué porque creo que puede ser útil para personas que, como yo, tienen muchas reuniones, invierten mucho tiempo en ordenar cada decisión y trabajan en entornos donde es difícil conectar con IA externa.

Agradecería mucho sus comentarios o que compartan experiencias con problemas similares.

Aún no hay comentarios.

Aún no hay comentarios.