- Genera clips de audio de alta calidad en diversos estilos, al igual que las IA de generación de imágenes/texto
- También permite modificar muestras de audio dadas
- No solo sintetiza voz en 6 idiomas, sino que también realiza eliminación de ruido, edición de contenido, transferencia de estilo y generación de muestras diversas
- La IA generativa de voz existente requería datos de entrenamiento cuidadosamente preparados para cada tarea. Voicebox se entrena con audio sin procesar y datos de transcripción usando un nuevo método
- Fue entrenado con más de 50 mil horas de audiolibros de dominio público en inglés, francés, español, alemán, polaco y portugués
2 comentarios
No sé si se podrá usar para quitar solo la voz de una canción y crear un MR de alta calidad.
Ya existe un open source bastante útil para eso:
https://github.com/Anjok07/ultimatevocalremovergui