ppaso-tts: TTS coreano liviano para dispositivos edge
(huggingface.co)Me interesa la IA standalone para dispositivos edge.
El chipset RK3576 tiene una NPU de 6 TOPS; aunque a veces se ven modelos TTS livianos en inglés, casi no hay modelos TTS en coreano.
En el caso de MeloTTS-ko, fue posible usar coreano convirtiéndolo directamente a RKNN, pero el Encoder no se podía convertir a RKNN y tampoco era especialmente rápido.
Por eso hice un modelo TTS coreano liviano que pueda usarse también en dispositivos edge, enfocándome más en la velocidad que en la calidad.
Aunque la voz suena artificial y poco natural, es posible generar audio a un nivel cercano al tiempo real. (basado en RK3576)
Al publicarlo bajo Apache 2.0, pensé que podría servirle a quien esté buscando un TTS coreano para dispositivos edge donde importe más la velocidad que la calidad, así que lo comparto.
Aún no hay comentarios.