En las reuniones en inglés, como es natural, lleva ventaja quien se siente cómodo con el idioma. Sobre todo en una reunión, el momento de intervenir es realmente importante; por más perfecta que tenga la idea en la cabeza, si el inglés no es mi lengua materna, me termino quedando en blanco y simplemente renuncio a hablar.
Pensé que este problema podía resolverse con los LLM, que destacan especialmente en el uso del lenguaje, y por eso empecé a crear este producto.
Este producto es una aplicación de escritorio independiente que permite mostrar una ventana transparente sobre herramientas de reuniones remotas como Zoom, Google meet y Teams.
Ofrece las siguientes funciones clave.
- Detecta lo que dicen otras personas en una reunión real y la entrada de mi micrófono, transcribe en tiempo real lo que dice la otra parte y lo traduce rápidamente.
- Si durante la reunión parece que la otra persona me hizo una pregunta, lo detecta automáticamente y genera una respuesta adecuada para mostrarla.
- Si durante la reunión no se me ocurre cómo decir en inglés una frase o palabra que quiero expresar, puedo escribirla y recibir una expresión en inglés a gran velocidad.
- Cuando termina la reunión, con base en su contenido analiza y retroalimenta en profundidad las frases que yo dije, y además las reformula todas con expresiones que realmente usaría un hablante nativo, entregándolas en un reporte.
La parte técnica en la que más me enfoqué y trabajé fue en obtener respuestas lo más rápido posible. Por muy bueno que sea el rendimiento, en una reunión que avanza de forma caótica, si pasan apenas 2 segundos, la información deja de tener sentido.
El rendimiento de los LLM ya es suficientemente bueno para ayudar con el inglés, pero la velocidad de generación de tokens varía muchísimo según el modelo, y dediqué muchísimo tiempo a encontrar ese equilibrio. Probé varias decenas de modelos fundacionales, y actualmente sigo optimizando al encontrar la combinación adecuada de modelos fundacionales para cada objetivo.
Como resultado, no solo en la traducción sino también en la sugerencia de expresiones, hemos logrado usar LLM en todo mientras obtenemos resultados de buena calidad con una velocidad de respuesta casi en tiempo real.
Durante 3 meses, realicé chats diarios por KakaoTalk e entrevistas 1:1 por videollamada con 150 alpha testers, y fui mejorando el producto poco a poco cada semana; por fin llegó el lanzamiento oficial.
Después de años leyendo GeekNews solo como observador y recibiendo notificaciones por Slack, ahora que escribo una publicación directamente me siento un poco nervioso... Si el producto les llama la atención, me encantaría que le echaran un vistazo en el enlace de abajo y me dejaran sus comentarios; de verdad sería de mucha ayuda.
Pueden probarlo gratis sin registrar una tarjeta de crédito.
https://trysmooth.ai
Aún no hay comentarios.