ElevenLabs Voice Isolator - separa limpiamente solo la voz
(elevenlabs.io)- Elimina el ruido de fondo de películas, podcasts, entrevistas, etc., y extrae limpiamente solo la voz
- El tamaño máximo es de 500 MB y admite audio de hasta 1 hora
- No está diseñado ni optimizado para voces de canciones, aunque según el contenido puede funcionar
- Aún no han publicado una API para streaming en tiempo real, pero planean lanzarla pronto
- El costo de uso es de 1000 caracteres por minuto de audio
6 comentarios
¿Qué significa esto? No entiendo por qué hablan de caracteres.
¿No es un concepto parecido a un token?
Como cuando en GPT las imágenes también se calculan como
text token.Viendo los otros servicios que ofrece la empresa, se entiende. Parece que funciona con un método de Speech to Text to Speech, así que cobran por el texto intermedio.
Por otro lado, MVSep, que ofrece separación de voces mediante varios modelos abiertos tanto gratis como de pago, también proporciona varios tipos de modelos de separación de voz/ruido.
https://mvsep.com
Adobe Podcast AI también ofrece una función similar. Parece que incluso hay una versión gratuita: https://podcast.adobe.com/enhance
Según la versión gratuita, da la impresión de que el coreano no está optimizado..