4 puntos por xguru 2024-02-13 | Aún no hay comentarios. | Compartir por WhatsApp
  • Los asistentes de voz con IA están transformando de forma revolucionaria la interacción con la tecnología, pero las conversaciones con los asistentes de voz existentes pueden sentirse mecánicas e incómodas
  • Tienen dificultades para comprender y adaptarse a los matices y aspectos emocionales de la conversación humana
  • ¿Cómo sería si un asistente de voz completamente abierto se implementara de esta manera?
    • Respondería a las solicitudes del usuario en tiempo real, con una voz natural, empatía e inteligencia emocional
    • Comprendería el contexto de largo plazo de conversaciones anteriores y podría manejar conversaciones entre varias personas, interrupciones, confirmaciones y también las pausas para pensar
    • Funcionaría completamente en local en hardware de consumo

Desarrollo de BUD-E (Buddy for Understanding and Digital Empathy)

  • LAION desarrolló BUD-E en colaboración con ELLIS Institute Tübingen, Collabora y Tübingen AI Center
  • Comenzaron con el desarrollo de un asistente de voz base de baja latencia y, a enero de 2024, lograron una latencia de 300~500 ms
  • Se espera que con modelos más grandes sea posible alcanzar tiempos de respuesta por debajo de 300 ms

Hoja de ruta de desarrollo de BUD-E

  • Incluso la conversación con el modelo base resulta mucho más natural que lo que se había visto hasta ahora
  • Pero aún quedan muchos problemas por resolver y funciones por desarrollar
    • Reducir la latencia y minimizar los requisitos del sistema
    • Aumentar la naturalidad de la conversación y de las respuestas
    • Seguimiento de conversaciones a lo largo de días, meses y años
    • Mejorar la funcionalidad y las capacidades del asistente de voz
    • Mejorar la comprensión multimodal y del contexto emocional
    • Construir infraestructura para interfaz de usuario, integración continua y empaquetado sencillo
    • Escalar a múltiples idiomas y múltiples hablantes

Colaboración para construir el futuro de la inteligencia artificial conversacional

  • El desarrollo de BUD-E es un proceso continuo que requiere el esfuerzo colectivo de diversas comunidades
  • Invitan a desarrolladores open source, investigadores y personas entusiastas a mejorar los módulos individuales de BUD-E y contribuir a su crecimiento
  • Esperan poder construir juntos un asistente de voz con inteligencia artificial capaz de mantener conversaciones naturales, intuitivas y empáticas

Aún no hay comentarios.

Aún no hay comentarios.