2 puntos por GN⁺ 2024-06-14 | 1 comentarios | Compartir por WhatsApp
  • Meta ofrece comunicación en tiempo real (RTC) a miles de millones de personas a través de apps como WhatsApp, Instagram y Messenger.
  • Sigue trabajando para ofrecer una experiencia de alta calidad incluso a usuarios que no cuentan con conexiones rápidas ni teléfonos modernos.
  • Meta desarrolló el códec Meta Low Bitrate (MLow) para mejorar la calidad de audio incluso en conexiones lentas.

Motivos para desarrollar un nuevo códec

  • El uso masivo de RTC en los productos de Meta les permitió observar el rendimiento de los códecs en diversos escenarios de red.
  • Muchas llamadas se realizan en situaciones con mala conectividad de red.
  • El códec Opus no logra ofrecer suficiente calidad de audio a bitrates bajos.
  • Los nuevos códecs de audio basados en ML ofrecen buena calidad a bitrates bajos, pero su alto costo computacional es un problema.
  • Como muchos usuarios usan dispositivos de gama baja, se necesita un códec de audio de alta calidad con bajos requerimientos de cómputo.

Códec MLow

  • El códec MLow ofrece una calidad dos veces mejor que Opus y una complejidad computacional 10% menor.
  • MLow ya fue implementado por completo en Instagram y Messenger, y también se está incorporando activamente en WhatsApp.
  • Puede codificar audio de alta calidad incluso a bitrates bajos, lo que mejora de forma significativa la calidad de audio en escenarios con pérdida de paquetes.

Estructura interna de MLow

  • MLow utiliza una tecnología avanzada basada en los conceptos del códec CELP (Code Excited Linear Prediction).
  • Divide la señal de entrada en bandas de baja y alta frecuencia, y codifica cada una por separado.
  • Codifica la banda de alta frecuencia con pocos bits para ofrecer SuperWideBand (muestreo de 32 kHz) a bajo bitrate.

Planes a futuro

  • MLow mejora de forma notable la calidad de audio incluso en dispositivos de gama baja.
  • Planean ofrecer de forma más eficiente más audio redundante para mejorar la recuperación de audio en redes con mucha pérdida de paquetes.

Opinión de GN⁺

  • Ventajas de MLow: ofrece alta calidad de audio incluso en conexiones lentas, mejorando mucho la experiencia del usuario.
  • Desafío técnico: mantener una alta calidad con baja complejidad computacional es un reto técnico muy difícil.
  • Productos competidores: además de Opus, existen varios códecs de audio, pero MLow ofrece un rendimiento sobresaliente incluso en dispositivos de gama baja.
  • Aspectos a considerar en la adopción: al introducir un nuevo códec, son importantes la compatibilidad con los sistemas existentes y las pruebas de rendimiento.
  • Impacto en los usuarios: puede beneficiar enormemente a muchos usuarios que utilizan dispositivos de gama baja.

1 comentarios

 
GN⁺ 2024-06-14
Comentarios de Hacker News
  • Nuevos códecs de bajo bitrate: en la comunicación en tiempo real, la tasa de paquetes debe ser alta para reducir la latencia, y por eso el overhead puede terminar siendo mayor que la carga útil real. Aun así, podría ser útil en comunicaciones por conmutación de circuitos o en sistemas VoIP que usan compresión de encabezados.

  • Difusión de la investigación de Meta: parece que Meta está recuperando popularidad al compartir mucha investigación y trabajo open source. La reputación de Facebook era mala, pero da la impresión de que lo ha compensado.

  • Falta de comparación con Codec2: al no haber comparación con Codec2, surgen dudas sobre el valor real y la motivación de este trabajo. No hace falta otro códec de audio nuevo atado a propiedad intelectual.

  • Comparación con Google Meet: Google Meet maneja bien las llamadas de audio incluso con internet lento, así que da curiosidad saber si este códec es mejor que Google Meet. La tecnología de Google Meet no es pública.

  • Calidad de las llamadas telefónicas: da curiosidad por qué hoy en día las llamadas telefónicas suenan menos claras que el μ-law ADPCM de 8 kHz y 8 bits de los años 90.

  • Falta de comparación con Pied Piper: no hay comparación con Pied Piper.

  • Lanzamiento: da curiosidad saber si este códec realmente se va a lanzar o si solo es una demostración técnica. Meta AI Research es innovador, pero no se pueden encontrar otras referencias sobre este códec.

  • Licencia: no hay información sobre la licencia.

  • Falta de mención de NoLACE: como no se menciona NoLACE, las muestras comparativas resultan menos útiles.

  • Comparación con Opus: mientras que Opus suena más suave a 6 kbps, las muestras de MLow tienen artefactos ásperos y artificiales. A bitrates más altos, la elección probablemente sería más clara.