- Meta AI presentó SeamlessM4T, un modelo base multilingüe y multitarea que permite traducir y transcribir de forma fluida entre voz y texto
- Admite reconocimiento automático de voz, traducción de voz a texto, traducción de voz a voz, traducción de texto a texto y traducción de texto a voz para diversos idiomas
- Reconocimiento automático de voz para más de 100 idiomas
- Traducción de voz a texto para más de 100 idiomas de entrada y salida
- Traducción de voz a voz compatible con más de 100 idiomas de entrada y 35 idiomas de salida (+ inglés)
- Traducción de texto a texto para más de 100 idiomas
- Conversión de texto a voz, con soporte para más de 100 idiomas de entrada y 35 idiomas de salida (+ inglés)
- El modelo SeamlessM4T se publicó bajo CC BY-NC 4.0 para investigadores y desarrolladores
- También se publicó SeamlessAlign, un conjunto de datos de traducción multimodal de 27 horas de duración
1 comentarios
Leer más