Voice-Pro – WebUI de Gradio con reconocimiento de voz, traducción y síntesis de voz
(github.com/abus-aikorea)Voice-Pro es una WebUI de Gradio compatible con reconocimiento de voz, traducción y síntesis de voz.
Funciones principales:
- Clonación de voz zero-shot. Solo se necesita una muestra de voz de 15 segundos. Incluye voces de más de 50 celebridades
- Descarga de audio de YouTube
- Separación de vocales
- Conversión de texto a voz multilingüe (Edge-TTS, F5-TTS)
- Traducción multilingüe
- Compatibilidad con varios motores de Whisper (Whisper, Faster-Whisper, Whisper-Timestamped)
Demostraciones en video:
-
Tutorial de uso de Voice-Pro: https://youtu.be/z8g8LMhoh_o
-
Demo de creación de podcast con Voice-Cloning: https://youtu.be/Wfo7vQCD4no
-
Demos y videos de muestra: https://youtube.com/playlist/?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq
1 comentarios
Parece que lo hizo un coreano.