Google presenta SoundStream, un códec de audio neuronal end-to-end
(ai.googleblog.com)- El primer códec de red neuronal aplicable tanto a voz como a música
→ Puede ejecutarse en tiempo real en la CPU de un smartphone
→ Codifica diversos tipos de sonido, incluyendo audio de alta calidad y voz limpia, voz con mucho ruido y reverberación, música y sonidos ambientales
- Entrenado usando redes neuronales en ambos extremos, realiza simultáneamente compresión y mejora de la calidad del sonido para ofrecer audio de alta calidad
→ SoundStream supera a Opus de 12 kbps a 3 kbps y ofrece una calidad similar a EVS 9.6 kbps
→ Como usa entre 3.2x y 4x menos bits, puede reducir drásticamente el volumen de transmisión
→ Permite una excelente reducción de ruido
- Está previsto que se integre en Lyra, el códec de voz de bajo bitrate presentado a principios de este año
1 comentarios
Opus también es famoso por ser bastante bueno,
impresionante.