13 puntos por skytin1004 2024-11-01 | 4 comentarios | Compartir por WhatsApp

👀 Seguramente alguna vez has experimentado lo tedioso que puede ser traducir y gestionar un proyecto en varios idiomas. Sobre todo cuando hay muchos documentos Markdown por traducir o incluso imágenes dentro del proyecto que también necesitan traducción, la cosa se vuelve todavía más compleja.

✅ Para resolver esta complicación, desarrollamos un proyecto open source que aprovecha los servicios de Azure AI y la tecnología LLM más reciente para gestionar el contenido multilingüe de un proyecto con una sola línea de comando.

✅ Co-op Translator es un paquete de Python que usa Azure OpenAI y Azure Computer Vision para traducir automáticamente archivos Markdown y texto dentro de imágenes a varios idiomas, y organizarlos en la carpeta de traducción especificada. Permite traducir todos los archivos de documentación del proyecto con una sola línea, lo que ayuda a gestionar de forma eficiente el soporte multilingüe.

✅ Funciones y características principales:

Traducción automatizada: permite realizar traducciones multilingües fácilmente.

Conservación del formato Markdown: mantiene el formato Markdown original durante la traducción.

Traducción de texto dentro de imágenes: también traduce y guarda el texto incluido en imágenes, y reemplaza en la versión traducida de Markdown los enlaces adjuntos por enlaces traducidos.

Soporte para varios idiomas: puede traducir a alrededor de 40 idiomas, incluido el coreano.

Integración sencilla: se integra fácilmente en proyectos para añadir soporte multilingüe rápidamente.

✅ En el README de Co-op Translator encontrarás explicaciones detalladas y una guía para el soporte multilingüe. ¡Vale la pena revisarlo!

: https://github.com/Azure/co-op-translator

✅ Actualmente, el proyecto oficial open source de Microsoft, Phi-3 Cookbook, gestiona su contenido multilingüe usando Co-op Translator. Si te interesa ver un ejemplo de gestión de traducciones multilingües con Co-op Translator, puede ser buena idea echarle un vistazo.
: https://github.com/microsoft/Phi-3CookBook

Si lo pruebas y hay alguna función que te gustaría que se agregara, o si tienes alguna duda, te agradeceremos que la dejes en un issue de GitHub o en los comentarios.

4 comentarios

 
jwseo 2024-11-01

Pensé que era un repositorio personal, ¿pero es oficial de Azure??

 
skytin1004 2024-11-01

Sí, así es 😊. Para contar un poco la historia...

Al principio, mientras participaba como colaborador en el proyecto open source Phi-3 CookBook de Microsoft, propuse crear una traducción al coreano, y justo entonces, a través de un empleado de MS, escuché que en el programa de patrocinio universitario de Microsoft se estaba llevando a cabo un proyecto de automatización de traducción multilingüe.

Por suerte pude conectar con ese equipo y, al revisar el proyecto, vi que estudiantes del Imperial College del Reino Unido ya habían implementado las funciones iniciales y el POC (prueba de concepto), pero la estructura era algo compleja para comercializarlo.

Así que, con base en ese POC (prueba de concepto), lo rediseñé desde cero como un open source en Python apto para producción e implementé las funciones necesarias. Después, este proyecto pasó a convertirse en un open source oficial de Azure, ¡y actualmente soy su mantenedor principal!

Muchas gracias por leer este texto tan largo. Seguiré mejorando las funciones para que cada vez más personas puedan usarlo cómodamente.

 
cosine20 2024-11-01

¡Es un proyecto muy bueno! Gracias por compartirlo :)

Sin embargo, a futuro creo que sería aún mejor si la parte de traducción pudiera cambiarse fácilmente por otro servicio de traducción. No es que no me guste Azure; es un proyecto muy útil y versátil en términos generales, pero como el servicio de backend depende de Azure, da un poco de pena pensar que, fuera de MS internamente o de empresas que ya tienen contrato con Azure, probablemente no habrá tanta gente interesada en probarlo.

 
skytin1004 2024-11-01

¡Hola, muchas gracias por tus buenos comentarios! 😊

La verdad, me parece una excelente sugerencia. Actualmente fue desarrollado con base en servicios de Azure, pero como mencionas, creo que si incorporamos una estructura que permita cambiar fácilmente a otros servicios de traducción para que más personas puedan usarlo libremente, el valor del proyecto también podría aumentar aún más.

Seguiré reflexionando continuamente sobre tus comentarios. ¡Gracias por hacérmelo saber!