11 puntos por xguru 2023-02-15 | 1 comentarios | Compartir por WhatsApp
  • GUI y API de código abierto para usar fácilmente OpenAI Whisper (modelo de reconocimiento de voz) en un entorno local
  • Ofrece funciones como transcribe/detect/download mediante una API REST
  • Es posible iniciar el trabajo subiendo archivos de audio/video desde la página web
  • Se ejecuta y utiliza con docker-compose (pone en marcha 3 contenedores Docker, como redis/api/worker)
  • El modelo mínimo, tiny, requiere aproximadamente 1 GB de VRAM (el máximo, large, 10 GB)