31 puntos por xguru 2025-10-04 | 1 comentarios | Compartir por WhatsApp
  • Una app gratuita de voz a texto de código abierto que funciona completamente sin conexión, basada en una app de escritorio Tauri con Rust + React/TypeScript
  • Al presionar una tecla rápida, empieza a grabar → hablas y hace la conversión local sin enviar nada a la nube → el texto se introduce automáticamente
  • Utiliza los modelos Whisper y Parakeet V3, con aceleración por GPU u optimización para CPU, y es compatible con Windows, macOS y Linux
  • El objetivo del proyecto no es ser “la app de reconocimiento de voz más perfecta”, sino crear la app más fácil de hacer fork, que cualquiera pueda modificar y ampliar fácilmente y que ofrezca soporte de código abierto, gratuito y sin conexión
  • Stack tecnológico
    • Frontend: React + TypeScript + Tailwind CSS
    • Backend: basado en Rust, encargado del procesamiento de audio y la inferencia de aprendizaje automático
    • Librerías clave:
      • whisper-rs (reconocimiento de voz basado en Whisper)
      • transcription-rs (modelo Parakeet optimizado para CPU)
      • cpal (audio I/O multiplataforma)
      • vad-rs (detección de actividad de voz)
      • rdev (teclas rápidas globales y manejo de eventos)
      • rubato (remuestreo de audio)
  • Sitio oficial: https://handy.computer/

1 comentarios

 
shakespeares 2025-10-07

Genial.