Supertonic 3 - Lanzamiento de TTS ultraligero on-device, compatible con 31 idiomas y etiquetas emocionales
(github.com/supertone-inc)- Compatible con 31 idiomas, incluido el coreano
- Nuevo soporte para etiquetas emocionales: se pueden insertar 10 tipos de etiquetas en el texto, como
<laugh>,<breath>y<scream>, para expresar emociones - Mejoras de calidad: mayor precisión en la pronunciación, menos fallos de repetición/omisión de palabras y mejor rendimiento en clonación de voz
- Tamaño del modelo: 99M Parameters
- TTS on-device: privacidad total garantizada, sin latencia de red
- Facilidad de despliegue: puede ejecutarse en navegador, PC, móvil, Raspberry Pi, etc.
- Incluye 10 voces predefinidas
- Modelo abierto: permite uso comercial (OpenRAIL-M)
4 comentarios
Me pregunto si no será difícil crear una voz propia en lugar de usar solo los 10 presets.
En comparación con otros modelos ligeros, este se ve bastante estable.
Habrá que probarlo en una Orange Pi 5, supongo.
Estaba usando supertonic en Home Agent, y lo anterior tampoco estaba nada mal, pero ya lo actualizaron. Tendré que probarlo.