- Compatible con 31 idiomas, incluido el coreano
- Nuevo soporte para etiquetas emocionales: se pueden insertar 10 tipos de etiquetas en el texto, como
<laugh>, <breath> y <scream>, para expresar emociones
- Mejoras de calidad: mayor precisión en la pronunciación, menos fallos de repetición/omisión de palabras y mejor rendimiento en clonación de voz
- Tamaño del modelo: 99M Parameters
- TTS on-device: privacidad total garantizada, sin latencia de red
- Facilidad de despliegue: puede ejecutarse en navegador, PC, móvil, Raspberry Pi, etc.
- Incluye 10 voces predefinidas
- Modelo abierto: permite uso comercial (OpenRAIL-M)
3 comentarios
En comparación con otros modelos ligeros, este se ve bastante estable.
Habrá que probarlo en una Orange Pi 5, supongo.
Estaba usando supertonic en Home Agent, y lo anterior tampoco estaba nada mal, pero ya lo actualizaron. Tendré que probarlo.