WaaS - Whisper como servicio

xguru · 2023-02-15T10:47:02+09:00

GUI y API de código abierto para usar fácilmente OpenAI Whisper (modelo de reconocimiento de voz) en un entorno local Ofrece funciones como transcribe/detect/download mediante una API REST Es posible iniciar el trabajo subiendo archivos de audio/video desde la página web Se ejecuta y utiliza con docker-compose (pone en marcha 3 contenedores Docker, como redis/api/worker) El modelo mínimo, tiny, requiere aproximadamente 1 GB de VRAM (el máximo, large, 10 GB)

(github.com/schibsted)

11 puntos por xguru 2023-02-15 | 1 comentarios | Compartir por WhatsApp

GUI y API de código abierto para usar fácilmente OpenAI Whisper (modelo de reconocimiento de voz) en un entorno local
Ofrece funciones como transcribe/detect/download mediante una API REST
Es posible iniciar el trabajo subiendo archivos de audio/video desde la página web
Se ejecuta y utiliza con docker-compose (pone en marcha 3 contenedores Docker, como redis/api/worker)
El modelo mínimo, tiny, requiere aproximadamente 1 GB de VRAM (el máximo, large, 10 GB)

1 comentarios

xguru 2023-02-15

Whisper - sistema de reconocimiento de voz multilingüe (ASR) que OpenAI publicó como código abierto
OpenAI publica el modelo Whisper v2

WaaS - Whisper como servicio

Lecturas relacionadas

1 comentarios