Google presenta SoundStream, un códec de audio neuronal end-to-end

xguru · 2021-08-16T09:22:01+09:00

El primer códec de red neuronal aplicable tanto a voz como a música → Puede ejecutarse en tiempo real en la CPU de un smartphone → Codifica diversos tipos de sonido, incluyendo audio de alta calidad y voz limpia, voz con mucho ruido y reverberación, música y sonidos ambientales Entrenado usando redes neuronales en ambos extremos, realiza simultáneamente compresión y mejora de la calidad del sonido para ofrecer audio de alta calidad → SoundStream supera a Opus de 12 kbps a 3 kbps y ofrece una calidad similar a EVS 9.6 kbps → Como usa entre 3.2x y 4x menos bits, puede reducir drásticamente el volumen de transmisión → Permite una excelente reducción de ruido Está previsto que se integre en Lyra, el códec de voz de bajo bitrate presentado a principios de este año

(ai.googleblog.com)

12 puntos por xguru 2021-08-16 | 1 comentarios | Compartir por WhatsApp

El primer códec de red neuronal aplicable tanto a voz como a música

→ Puede ejecutarse en tiempo real en la CPU de un smartphone

→ Codifica diversos tipos de sonido, incluyendo audio de alta calidad y voz limpia, voz con mucho ruido y reverberación, música y sonidos ambientales

Entrenado usando redes neuronales en ambos extremos, realiza simultáneamente compresión y mejora de la calidad del sonido para ofrecer audio de alta calidad

→ SoundStream supera a Opus de 12 kbps a 3 kbps y ofrece una calidad similar a EVS 9.6 kbps

→ Como usa entre 3.2x y 4x menos bits, puede reducir drásticamente el volumen de transmisión

→ Permite una excelente reducción de ruido

Está previsto que se integre en Lyra, el códec de voz de bajo bitrate presentado a principios de este año

1 comentarios

alstjr7375 2021-08-17

Opus también es famoso por ser bastante bueno,

impresionante.

Google presenta SoundStream, un códec de audio neuronal end-to-end

Lecturas relacionadas

1 comentarios