Mozilla Common Voice
(voice.mozilla.org)Una base de datos de voz de código abierto que reúne y depura datos de distintos idiomas para crear y hacer accesible una tecnología de reconocimiento de voz que cualquiera pueda usar.
En coreano todavía faltan muchos datos. Participa y construyámosla juntos.
La mayoría de los conjuntos de datos de voz que crean las empresas son difíciles de usar desde fuera.
Por eso es importante contar con datos creados de forma abierta. En especial para el coreano, aún más.
7 comentarios
No puedo continuar porque no aparece coreano en la parte de configuración del objetivo...
Entonces, el dataset en coreano todavía no estaba disponible porque aún faltaba localizar el sitio de oraciones o no había suficiente conjunto de oraciones.
Traducción del sitio al coreano: https://pontoon.mozilla.org/projects/common-voice/
Sitio de recopilación de oraciones: https://common-voice.github.io/sentence-collector
Parece que, una vez que se complete la traducción del sitio y se recopilen más de 5000 oraciones, será posible recopilar y validar voces. Se agradece mucho la participación de quienes estén interesados.
Yo dejé el mismo comentario y luego lo borré jaja
https://discourse.mozilla.org/t/…
Aquí está explicado así.
Ah... sí jaja, yo también intenté borrarlo, pero me desconcerté porque no había botón de eliminar..
Relacionado con eso, parece que hay algunos corpus en coreano, pero no sé si se puedan subir por temas de derechos de autor.
Ah, para borrar un comentario, haz clic en el enlace de la hora junto al ID sobre el comentario y podrás eliminarlo desde la página del comentario.
También existe el proyecto Zeroth, que usa Kaldi, entre los open source de reconocimiento de voz en coreano que ya se habían publicado.
(Según el contenido de GitHub, parece que el modelo final es la versión de julio de 2018)
https://github.com/goodatlas/zeroth