9 puntos por vulcanidic 2024-12-08 | 1 comentarios | Compartir por WhatsApp

Voice-Pro es una WebUI de Gradio compatible con reconocimiento de voz, traducción y síntesis de voz.

Funciones principales:

  • Clonación de voz zero-shot. Solo se necesita una muestra de voz de 15 segundos. Incluye voces de más de 50 celebridades
  • Descarga de audio de YouTube
  • Separación de vocales
  • Conversión de texto a voz multilingüe (Edge-TTS, F5-TTS)
  • Traducción multilingüe
  • Compatibilidad con varios motores de Whisper (Whisper, Faster-Whisper, Whisper-Timestamped)

Demostraciones en video:

GitHub:
https://github.com/abus-aikorea/voice-pro

1 comentarios

 
yangeok 2024-12-16

Parece que lo hizo un coreano.