vvrite — app de tipeo por voz con IA on-device de código abierto para macOS
(github.com/shaircast)Hola, originalmente estaba usando herramientas de tipeo por voz ya existentes como superwhisper o spokenly conectadas con un gamepad 8bitdo micro. Pero la latencia de red me resultaba extrañamente molesta.
Así que seguí probando modelos locales y, esta vez, al probar el modelo Qwen3-ASR sentí que era exactamente lo que buscaba. Es muy ágil y ofrece un rendimiento que no se queda atrás frente a los modelos en la nube, así que creé vvrite para ejecutar esto de forma local y buscar la misma ux. Dependiendo del rendimiento del dispositivo, es bastante rápido y además no consume mucha memoria.
vvrite es una app que, al presionar una hotkey en la barra de menú de macOS (por defecto Option+Space), comienza a grabar de inmediato y, al volver a presionarla, reconoce la voz con IA on-device y la pega automáticamente en el campo de entrada actual. Es compatible con Apple Silicon Mac con macOS 13 o superior. Se puede instalar directamente desde GitHub Releases con un DMG firmado y notarizado.
13 comentarios
Quería probar handy, pero si este soporta mejor el coreano, entonces tendré que usarlo. Gracias.
Me molestaba la herramienta de reconocimiento de voz en coreano que estaba usando,
así que como
grokme recomendó esta entre los proyectos open source(me la recomendó al final, en letras bien chiquitas), la probé.
Me gustó, así que la estoy usando con algunas personalizaciones.
También le agregué 3 modelos más,
bajé el volumen del sonido de notificación porque estaba demasiado fuerte...
y también corregí algunos bugs.
Por un tiempo voy a seguir con esta
y me voy a divertir haciendo vibe coding por voz.
Al abrir el código, me dio la impresión de que es un proyecto
llevado por alguien que no es desarrollador,
y por eso dan más ganas de apoyarlo~~
Es cien veces mejor que cierta gente (yo...)
que siempre solo lo piensa y lo va postergando 😂
También, al ver que todavía quedaban rastros de
superpowers,pensé: "ah, así es como lo hacen..."
Vaya, lo probé y es rápido y bueno. Lo usaré bien.
¡Gracias!
Estoy creando una app de comandos de voz para Android, y Qwen la verdad es que sí está muy bueno. Pero todavía no he podido optimizarlo, así que estoy usando una versión de Whisper base afinada con un dataset en coreano.
¿Es mejor que Whisper large v3 turbo? Yo todavía sigo usando este, así que me da curiosidad saber si ya lo compararon. También vi Moonshine aquí y dije que lo iba a probar, pero ya pasaron 3 semanas jaja
En coreano, definitivamente es mejor que Whisper.
Moonshine no fue muy distinto de parakeet.
¿Cuál es la diferencia con handy?
Las apps de este tipo probablemente tienen una UX casi igual. vvrite tampoco es muy diferente. Al final todo depende del rendimiento del modelo.
Si solo van a usar inglés, con algo como parakeet, que es compatible con handy, basta.
Pero para compatibilidad con coreano, por experiencia Qwen3-ASR me pareció la mejor opción.
Pero como no había ningún lugar que lo ofreciera, lo hice yo mismo.
Vaya, qué herramienta tan genial.
En lo personal, creo que sería aún mejor si agregaran una UI para poder volver a consultar la guía de uso (manual). Como al principio, durante la instalación, solo fui haciendo clic sin pensar, luego me confundí sobre cómo usarla jajaja
¿Cómo se lee el nombre de la herramienta? ¿Se pronuncia "raite"?
¡Gracias por tu opinión! La reflejaré en la próxima versión.
Sí, la intención era que se leyera “light”, pero… la verdad es que yo tampoco sé muy bien cuál sería la mejor forma de leerlo.
¿Qué les parece Brighte?
vvrite - vwrite - bright, reuniendo los tres significados...