5 puntos por xguru 2019-12-06 | 7 comentarios | Compartir por WhatsApp

Una base de datos de voz de código abierto que reúne y depura datos de distintos idiomas para crear y hacer accesible una tecnología de reconocimiento de voz que cualquiera pueda usar.

En coreano todavía faltan muchos datos. Participa y construyámosla juntos.

La mayoría de los conjuntos de datos de voz que crean las empresas son difíciles de usar desde fuera.

Por eso es importante contar con datos creados de forma abierta. En especial para el coreano, aún más.

7 comentarios

 
sduck4 2019-12-06

No puedo continuar porque no aparece coreano en la parte de configuración del objetivo...

 
sduck4 2019-12-06

Entonces, el dataset en coreano todavía no estaba disponible porque aún faltaba localizar el sitio de oraciones o no había suficiente conjunto de oraciones.

 
sduck4 2019-12-06

Traducción del sitio al coreano: https://pontoon.mozilla.org/projects/common-voice/

Sitio de recopilación de oraciones: https://common-voice.github.io/sentence-collector

Parece que, una vez que se complete la traducción del sitio y se recopilen más de 5000 oraciones, será posible recopilar y validar voces. Se agradece mucho la participación de quienes estén interesados.

 
xguru 2019-12-06

Yo dejé el mismo comentario y luego lo borré jaja

https://discourse.mozilla.org/t/…

Aquí está explicado así.

 
sduck4 2019-12-06

Ah... sí jaja, yo también intenté borrarlo, pero me desconcerté porque no había botón de eliminar..

Relacionado con eso, parece que hay algunos corpus en coreano, pero no sé si se puedan subir por temas de derechos de autor.

 
xguru 2019-12-06

Ah, para borrar un comentario, haz clic en el enlace de la hora junto al ID sobre el comentario y podrás eliminarlo desde la página del comentario.

 
xguru 2019-12-06

También existe el proyecto Zeroth, que usa Kaldi, entre los open source de reconocimiento de voz en coreano que ya se habían publicado.

(Según el contenido de GitHub, parece que el modelo final es la versión de julio de 2018)

https://github.com/goodatlas/zeroth