- Con el lanzamiento de v2, ofrece mejor calidad de audio, soporte multilingüe que incluye coreano y uso comercial gratuito
- Puede clonar una voz a partir de un clip de audio corto del hablante y generar voz en varios idiomas
- No solo replica el timbre del hablante de referencia, sino que también permite controlar con precisión el estilo de voz, como emociones, entonación, ritmo, pausas y acento
- Logra clonación de voz cruzada entre idiomas en zero-shot, incluso para idiomas no incluidos en el conjunto de entrenamiento
- Ofrece un rendimiento sobresaliente con un costo computacional decenas de veces menor que el de APIs comercialmente disponibles
- Cambios de V2 (lanzado en 2024/04), que incluye todas las funciones de V1
- Mejor calidad de audio: V2 adopta una estrategia de entrenamiento distinta que ofrece mejor calidad de audio
- Soporte multilingüe nativo: inglés, español, francés, chino, japonés y coreano están soportados de forma nativa en OpenVoice V2
- Uso comercial gratuito: desde abril de 2024, tanto V2 como V1 se publican bajo licencia MIT, por lo que su uso comercial también es gratuito
1 comentarios
GN⁺: OpenVoice: tecnología versátil de clonación de voz instantánea
GN⁺: OpenVoice - tecnología versátil de clonación de voz instantánea
Ya se había publicado varias veces a través de GN+, y ahora con la salida de V2 se agregó compatibilidad multilingüe y también soporte para coreano.