- Los asistentes de voz con IA están transformando de forma revolucionaria la interacción con la tecnología, pero las conversaciones con los asistentes de voz existentes pueden sentirse mecánicas e incómodas
- Tienen dificultades para comprender y adaptarse a los matices y aspectos emocionales de la conversación humana
- ¿Cómo sería si un asistente de voz completamente abierto se implementara de esta manera?
- Respondería a las solicitudes del usuario en tiempo real, con una voz natural, empatía e inteligencia emocional
- Comprendería el contexto de largo plazo de conversaciones anteriores y podría manejar conversaciones entre varias personas, interrupciones, confirmaciones y también las pausas para pensar
- Funcionaría completamente en local en hardware de consumo
Desarrollo de BUD-E (Buddy for Understanding and Digital Empathy)
- LAION desarrolló BUD-E en colaboración con ELLIS Institute Tübingen, Collabora y Tübingen AI Center
- Comenzaron con el desarrollo de un asistente de voz base de baja latencia y, a enero de 2024, lograron una latencia de 300~500 ms
- Se espera que con modelos más grandes sea posible alcanzar tiempos de respuesta por debajo de 300 ms
Hoja de ruta de desarrollo de BUD-E
- Incluso la conversación con el modelo base resulta mucho más natural que lo que se había visto hasta ahora
- Pero aún quedan muchos problemas por resolver y funciones por desarrollar
- Reducir la latencia y minimizar los requisitos del sistema
- Aumentar la naturalidad de la conversación y de las respuestas
- Seguimiento de conversaciones a lo largo de días, meses y años
- Mejorar la funcionalidad y las capacidades del asistente de voz
- Mejorar la comprensión multimodal y del contexto emocional
- Construir infraestructura para interfaz de usuario, integración continua y empaquetado sencillo
- Escalar a múltiples idiomas y múltiples hablantes
Colaboración para construir el futuro de la inteligencia artificial conversacional
- El desarrollo de BUD-E es un proceso continuo que requiere el esfuerzo colectivo de diversas comunidades
- Invitan a desarrolladores open source, investigadores y personas entusiastas a mejorar los módulos individuales de BUD-E y contribuir a su crecimiento
- Esperan poder construir juntos un asistente de voz con inteligencia artificial capaz de mantener conversaciones naturales, intuitivas y empáticas
Aún no hay comentarios.