7 puntos por leelou2 2025-11-17 | Aún no hay comentarios. | Compartir por WhatsApp

Cómo usar rápidamente el nuevo ElevenLabs Realtime Speech to Text

Implementé solo la función de transcripción de voz de la forma más simple posible 🙏

  1. git clone https://github.com/lee-lou2/ai-note.git
  2. En https://elevenlabs.io/app/developers/api-keys, entra a Speech to Text y genera una API key
  3. En la página del proyecto clonado, duplica .env.sample para crear el archivo .env
  4. Registra la ElevenLabs API Key generada en ELEVENLABS_API_KEY, y en BASIC_AUTH_USERNAME, BASIC_AUTH_PASSWORD registra la información de la cuenta que usarás para acceder a la página
  5. Instalar paquetes: pip install -r requirements.txt
  6. Ejecutar: uvicorn main:app --reload --port 8000

Y luego, al entrar a http://localhost:8000, se puede usar de inmediato

Definitivamente, ElevenLabs Realtime Speech to Text v2 es rápido y preciso
Actualmente también puede ser usado por usuarios gratuitos (más adelante la política de precios de ElevenLabs podría cambiar)

Este repositorio de GitHub seguirá actualizándose

  • (Planeado) Una función para que varios usuarios se conecten juntos y actualicen un mismo documento
  • (Planeado) Una función para resumir el contenido transcrito
  • (Planeado) Una función para resumir junto con el documento escrito

Aún no hay comentarios.

Aún no hay comentarios.