- Una app gratuita de voz a texto de código abierto que funciona completamente sin conexión, basada en una app de escritorio Tauri con Rust + React/TypeScript
- Al presionar una tecla rápida, empieza a grabar → hablas y hace la conversión local sin enviar nada a la nube → el texto se introduce automáticamente
- Utiliza los modelos Whisper y Parakeet V3, con aceleración por GPU u optimización para CPU, y es compatible con Windows, macOS y Linux
- El objetivo del proyecto no es ser “la app de reconocimiento de voz más perfecta”, sino crear la app más fácil de hacer fork, que cualquiera pueda modificar y ampliar fácilmente y que ofrezca soporte de código abierto, gratuito y sin conexión
- Stack tecnológico
- Frontend: React + TypeScript + Tailwind CSS
- Backend: basado en Rust, encargado del procesamiento de audio y la inferencia de aprendizaje automático
- Librerías clave:
whisper-rs (reconocimiento de voz basado en Whisper)
transcription-rs (modelo Parakeet optimizado para CPU)
cpal (audio I/O multiplataforma)
vad-rs (detección de actividad de voz)
rdev (teclas rápidas globales y manejo de eventos)
rubato (remuestreo de audio)
- Sitio oficial: https://handy.computer/
1 comentarios
Genial.