8 puntos por xguru 2025-02-19 | 2 comentarios | Compartir por WhatsApp

¿Qué es Audiblez?

  • Herramienta para convertir libros electrónicos .epub en audiolibros .m4b
  • Usa síntesis de voz de alta calidad basada en Kokoro-82M
  • Se ofrece bajo licencia Apache y fue entrenado con menos de 100 horas de datos de audio
  • En la GPU T4 de Google Colab puede convertir "Animal Farm" en unos 5 minutos, con una "velocidad de conversión de 600 caracteres por segundo"
  • En una M2 MacBook Pro (modo CPU), "toma alrededor de 1 hora a una velocidad de 60 caracteres por segundo"
    • Actualmente no hay soporte para CUDA en Apple Silicon (M1, M2); está pendiente el soporte para MLX

Principales actualizaciones de Audiblez 4.2

  • Soporte para GUI multiplataforma basada en wxWidgets (Mac, Windows, Linux)
  • Soporte para varios idiomas (inglés, español, francés, hindi, italiano, japonés, portugués, chino)
  • Cambio de ONNX a una base en Torch usando el paquete kokoro
  • Soporte para aceleración CUDA (aunque en Apple Silicon se ejecuta en modo CPU)
  • Incluye imagen de portada y marcas de tiempo de capítulos en el audiolibro
  • Mejoras en el soporte para Windows

2 comentarios

 
xguru 2025-02-19

Convertir ebooks en audiolibros con el modelo Kokoro-82M
Está basado en esto, pero el coreano incluido aquí no está en Audiblez (aunque en los comentarios sí mencionan que la calidad del coreano de Kokoro no es muy buena)

 
inosphe 2025-02-19

Si revisas los registros anteriores del proyecto kokoro, claramente había una voz en coreano, pero según las discusiones en Discord, parece que están teniendo dificultades para distribuirla debido a la cláusula de AI Hub de Corea que prohíbe la transferencia de datos al extranjero…