OpenVoice v2 - clonación de voz instantánea y versátil

xguru · 2024-04-29T09:31:01+09:00

Con el lanzamiento de v2, ofrece mejor calidad de audio, soporte multilingüe que incluye coreano y uso comercial gratuito Puede clonar una voz a partir de un clip de audio corto del hablante y generar voz en varios idiomas No solo replica el timbre del hablante de referencia, sino que también permite controlar con precisión el estilo de voz, como emociones, entonación, ritmo, pausas y acento Logra clonación de voz cruzada entre idiomas en zero-shot, incluso para idiomas no incluidos en el conjunto de entrenamiento Ofrece un rendimiento sobresaliente con un costo computacional decenas de veces menor que el de APIs comercialmente disponibles Cambios de V2 (lanzado en 2024/04), que incluye todas las funciones de V1 Mejor calidad de audio: V2 adopta una estrategia de entrenamiento distinta que ofrece mejor calidad de audio Soporte multilingüe nativo: inglés, español, francés, chino, japonés y coreano están soportados de forma nativa en OpenVoice V2 Uso comercial gratuito: desde abril de 2024, tanto V2 como V1 se publican bajo licencia MIT, por lo que su uso comercial también es gratuito

(github.com/myshell-ai)

34 puntos por xguru 2024-04-29 | 1 comentarios | Compartir por WhatsApp

Con el lanzamiento de v2, ofrece mejor calidad de audio, soporte multilingüe que incluye coreano y uso comercial gratuito
Puede clonar una voz a partir de un clip de audio corto del hablante y generar voz en varios idiomas
No solo replica el timbre del hablante de referencia, sino que también permite controlar con precisión el estilo de voz, como emociones, entonación, ritmo, pausas y acento
Logra clonación de voz cruzada entre idiomas en zero-shot, incluso para idiomas no incluidos en el conjunto de entrenamiento
Ofrece un rendimiento sobresaliente con un costo computacional decenas de veces menor que el de APIs comercialmente disponibles
Cambios de V2 (lanzado en 2024/04), que incluye todas las funciones de V1
- Mejor calidad de audio: V2 adopta una estrategia de entrenamiento distinta que ofrece mejor calidad de audio
- Soporte multilingüe nativo: inglés, español, francés, chino, japonés y coreano están soportados de forma nativa en OpenVoice V2
- Uso comercial gratuito: desde abril de 2024, tanto V2 como V1 se publican bajo licencia MIT, por lo que su uso comercial también es gratuito

1 comentarios

xguru 2024-04-29

GN⁺: OpenVoice: tecnología versátil de clonación de voz instantánea
GN⁺: OpenVoice - tecnología versátil de clonación de voz instantánea

Ya se había publicado varias veces a través de GN+, y ahora con la salida de V2 se agregó compatibilidad multilingüe y también soporte para coreano.

OpenVoice v2 - clonación de voz instantánea y versátil

Lecturas relacionadas

1 comentarios