22 puntos por rbynddd 2026-05-15 | 4 comentarios | Compartir por WhatsApp
  • Compatible con 31 idiomas, incluido el coreano
  • Nuevo soporte para etiquetas emocionales: se pueden insertar 10 tipos de etiquetas en el texto, como <laugh>, <breath> y <scream>, para expresar emociones
  • Mejoras de calidad: mayor precisión en la pronunciación, menos fallos de repetición/omisión de palabras y mejor rendimiento en clonación de voz
  • Tamaño del modelo: 99M Parameters
  • TTS on-device: privacidad total garantizada, sin latencia de red
  • Facilidad de despliegue: puede ejecutarse en navegador, PC, móvil, Raspberry Pi, etc.
  • Incluye 10 voces predefinidas
  • Modelo abierto: permite uso comercial (OpenRAIL-M)

4 comentarios

 
netcleaner 2026-05-16

Me pregunto si no será difícil crear una voz propia en lugar de usar solo los 10 presets.

 
hshim 2026-05-15

En comparación con otros modelos ligeros, este se ve bastante estable.

 
greekr4 2026-05-15

Habrá que probarlo en una Orange Pi 5, supongo.

 
dbs0829 2026-05-15

Estaba usando supertonic en Home Agent, y lo anterior tampoco estaba nada mal, pero ya lo actualizaron. Tendré que probarlo.