1 puntos por GN⁺ 4 시간 전 | 1 comentarios | Compartir por WhatsApp
  • AV2 es la especificación de codificación de video de próxima generación de AOMedia, orientada a lograr mayor eficiencia de compresión y entrega de alta calidad con menores bitrates sobre la base de AV1
  • La especificación final v1.0.0 cubre la sintaxis del bitstream, la semántica y los procedimientos de decodificación, y sirve como referencia técnica para evaluar la conformidad de las implementaciones de AV2
  • Está optimizada para streaming, broadcasting y videoconferencias en tiempo real, y también soporta mejoras para AR/VR, entrega en pantalla dividida y procesamiento de contenido en pantalla
  • La versión actual consta de AV2 Bitstream & Decoding Process Specification v1.0.0, publicada el 28 de mayo de 2026, y del software de referencia AVM
  • Los implementadores pueden usar la especificación en línea, el PDF, las tablas de consulta en encabezados C, el Syntax Browser y la etiqueta AVM v1.0.0; el borrador v13 se mantiene como referencia

Resumen de AV2

  • AV2 es la especificación de codificación de video de próxima generación de Alliance for Open Media (AOMedia), diseñada para ofrecer mayor eficiencia de compresión sobre la base de AV1
  • Su objetivo es entregar video de alta calidad con bitrates mucho más bajos, y está optimizada para las necesidades de streaming, broadcasting y videoconferencias en tiempo real
  • La especificación v1.0.0 es la referencia técnica final para implementar AV2 y cubre la sintaxis del bitstream, la semántica y los procedimientos de decodificación necesarios para una conformidad completa
  • AV2 soporta aplicaciones de AR/VR, entrega en pantalla dividida de múltiples programas, mejoras en el procesamiento de contenido en pantalla y operación dentro de un rango más amplio de calidad visual
  • Se ofrece AOMedia Video Model (AVM) como software oficial de referencia para implementadores
  • Los comentarios y reportes de problemas pueden enviarse a wg-codec-chair@aomedia.org o registrarse en el AVM issue tracker

Lanzamiento y recursos de implementación

  • AV2 specification and reference code v1.0.0

    • La versión actual es AV2 Bitstream & Decoding Process Specification v1.0.0, publicada el 28 de mayo de 2026, junto con el correspondiente software de referencia AVM
    • Read Online: documentación en línea de la especificación v1.0.0
    • Download PDF: PDF completo de la especificación v1.0.0
    • Additional Tables: archivo de encabezado C con tablas de consulta extraídas de la sección 9
    • Syntax Browser: navegador para explorar la estructura sintáctica y la semántica en conjunto
    • Software: software de referencia AVM con la etiqueta v1.0.0
  • AV2 working draft v13

    • El borrador de trabajo v13 se publicó el 5 de enero de 2026 y fue reemplazado por v1.0.0
    • La etiqueta “v13” se refiere al hito del borrador de trabajo y no significa que sea una versión más nueva que v1.0.0
    • Se conserva con fines de referencia
    • Read Online: documentación en línea de v13
    • Additional Tables: tablas adicionales de v13
    • Syntax Browser: navegador de sintaxis de v13
    • Software: software de referencia research-v13.0.0
    • Release Notes: notas de lanzamiento de v13
  • Recursos para usar la especificación

    • La especificación completa incluye desde el alcance y las definiciones hasta los apéndices, y abarca formato, sintaxis, semántica y procedimientos de decodificación
    • La versión en PDF ofrece la especificación completa v1.0.0 para consulta offline
    • Additional Tables es un recurso que extrae como archivo de encabezado C las tablas de consulta de la sección 9, útil como referencia de implementación
    • Syntax Browser ofrece las Syntax Structures de la sección 5 y la Semantics de la sección 6 en una interfaz de panel dividido
    • En Syntax Browser es posible ver lado a lado las definiciones sintácticas y la semántica, hacer clic en elementos gramaticales, buscar en ambas secciones y copiar estructuras sintácticas
    • Reference Software es AVM correspondiente a la especificación v1.0.0, y la etiqueta v1.0.0 corresponde a esa versión

1 comentarios

 
GN⁺ 4 시간 전
Comentarios en Hacker News
  • AV2 es solo una etapa de un camino muy largo, y en su estado actual parece prácticamente imposible de usar
    Incluso en hardware bueno, el codificador suele ir a alrededor de 1 fps, así que probablemente seguirá así hasta más o menos 2028, cuando salga el primer chip con aceleración por hardware para AV2, y quizá hasta 2030 los streams AV2 se vuelvan comunes
    Si se mira solo la mejora de eficiencia, el 20~30% frente a AV1 sí es considerable, pero no está tan claro si AV2 realmente vale la pena. Aun así, el soporte de múltiples streams es una gran ventaja para VR y deportes en vivo, y también es interesante que se pueda enviar el canal alfa como un stream separado y componerlo en el archivo para admitir video con transparencia de verdad

    • Viendo la trayectoria de AV1, la codificación por hardware no es estrictamente necesaria. Sería bueno tenerla, pero el codificador actual es un codificador de referencia
      Ahora que la especificación está cerrada, la velocidad podría mejorar mucho en codificadores reales para productos, aunque la codificación en tiempo real probablemente siga siendo difícil hasta que llegue al hardware
    • Si “la mayor función añadida es el soporte de múltiples streams”, yo pensaba que eso correspondía más al terreno del formato contenedor que al de un códec de video
    • Si la tendencia actual sigue así, no creo que vayamos a ver pronto un codificador AV2 por hardware en PC. Casi toda la capacidad de fabricación de chips más nuevos y avanzados está siendo absorbida por Apple y las empresas de IA
      A menos que los fabricantes de chips lleven el diseño de AV2 a procesos más viejos y baratos, será difícil para el usuario común; los fabricantes chinos de chips para TV quizá metan decodificadores AV2 para marcar la casilla, pero un codificador real parece difícil de esperar por un buen tiempo
    • Viendo cómo el desarrollo de GPU se está desviando hacia las NPU, esto se siente como una meta, en el mejor de los casos, de 2035. Los fabricantes van a querer maximizar el área de silicio dedicada a operaciones matriciales
      En una época en la que se invierten billones en datacenters, el costo del tráfico pasa a segundo plano, y quienes realmente se benefician podrían ser solo YouTube o Netflix. A esa escala, tal vez hasta salga más barato invertir en cachés a nivel ISP
    • Si el objetivo es “ofrecer video de alta calidad con bitrate mucho más bajo”, pero los dispositivos lentos que realmente lo necesitarían todavía ni existen, no entiendo bien qué sentido tiene
  • Me da curiosidad cómo AV2 va a mejorar el formato de imagen AVIF. AVIF aplasta a los formatos competidores en imágenes estáticas de bajo bitrate, especialmente cuando se usa chroma subsampling
    Pero no pasa lo mismo con imágenes sin pérdida. Comparado con JPEG XL sin pérdida y WEBP sin pérdida, AVIF sin pérdida hasta da risa

    • AVIF es ahora mismo mi formato de imagen favorito. Casi no hay formatos que tengan sin pérdida, HDR, transparencia y soporte en navegadores al mismo tiempo
      Incluso en imágenes comprimidas de forma muy agresiva funciona excelente, y sorprende lo pequeños que pueden quedar los archivos. A diferencia de HEIC o Ultra HDR JPEG, no depende de trucos como sidecar gain map, sino que soporta HDR de forma nativa en el propio formato de archivo. No será importante para todos, pero me gusta el HDR, y AVIF se siente como el único formato que realmente se lo toma en serio
    • No siempre es así https://tonisagrista.com/blog/2023/jpegxl-vs-avif/
    • Si libavif agrega soporte para AV2, quizá con solo actualizar a una versión como v2.0.0 ya se pueda obtener eficiencia adicional
    • Sinceramente, lo que necesitamos ahora no es AVIF2. Ya hay demasiados formatos de imagen minoritarios
  • Con AV1, varias empresas ya están armando activamente claim charts, y parece casi seguro que van a llegar demandas. En AV2 ya empezó el mismo proceso, pero la mayoría está esperando a que maduren primero los casos relacionados con AV1
    La gente sigue llamando a los códecs de la familia AV “libres de regalías”, pero en la práctica cada vez se ven más como una apuesta legal y financiera

    • Este tipo de comentarios vienen repitiéndose desde hace décadas
      Nunca he entendido por qué a algunas personas les gusta que las empresas sean dueñas de las matemáticas como si estuvieran alentando a su equipo deportivo del barrio
      Durante un tiempo pensé que era porque había gente que había invertido mucho esfuerzo en codificadores H.264, así que los siervos digitales se enojaban y les daba envidia la gente que defendía una libertad desordenada. Pero parece que a algunos simplemente les encanta la idea misma de que las empresas cobren un impuesto por distribuir video
      Por suerte, esas empresas codiciosas se han disparado al pie una y otra vez, y su influencia va disminuyendo
    • ¿Cuánto tiempo hace que salió AV1? Ya pasaron unos 8 años y todavía no hay titulares de patentes creíbles
      Siempre hay buitres rondando alrededor de los estándares de compresión, así que no hace falta tomárselo demasiado en serio. Incluso si aparece una demanda, existe un fondo de defensa legal para frenar reclamos infundados
    • Si los códecs de la familia AV parecen una apuesta legal y financiera, ¿cuál sería la alternativa?
      H.265 tiene dos pools de licencias HEVC a los que hay que adherirse, y además hay por lo menos dos empresas que no están en ningún pool
      https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#P...
      No parece que elegir un códec que no sea AVx lo vuelva menos complejo ni reduzca el riesgo de litigio
    • ¿Quieres decir que incluso comparado con algo como HEVC? Si quieres estar realmente cubierto con HEVC, tienes que pagarle a 3 pools de patentes con condiciones distintas entre sí, y además hay titulares de patentes fuera de cualquier pool que pueden pedir regalías en cualquier momento bajo sus propios términos
    • Los estándares de telecomunicaciones no deberían poder patentarse. El potencial de abuso mediante efectos de lock-in es demasiado grande
  • ¿Cuánto tiempo pasará desde que alguien implemente este estándar hasta que Adobe o Dolby, o alguien así, quiera demandarlo para dar un escarmiento? Puede que mi conocimiento esté desactualizado, pero si esto es tan “abierto” como AV1, soy bastante escéptico de que cada empresa individual realmente lo permita. También está la codicia

    • La primera reclamación de patente sobre AV1 tardó 7 años en llegar a tribunales, y parece que también pasará bastante tiempo antes de que ese caso se resuelva
      Curiosamente, no vino del pool de patentes que llevaba años apareciendo en las noticias. O sea, podría pasar bastante tiempo antes de que aparezca un intento así
    • Los trolls de patentes son nefastos. ¿Cuánto tardarán en recibir el apoyo total de quienes socavan la independencia del sistema judicial estadounidense por su propio beneficio? Ojalá esa corrupción se detenga antes
  • Medio en broma, pero estaba esperando un Apple TV compatible con AV1, y ahora también me tocará esperar el soporte para AV2 en Apple TV

  • No soy especialista en codificación de video, pero me pregunto si en el futuro se dependerá más de que redes de IA reconstruyan el video para hacerlo mucho más liviano que el video comprimido, en lugar de usar métodos de compresión de función fija
    Los códecs neuronales como github.com/Orange-OpenSource/Cool-Chic son un ejemplo de eso

    • Probablemente dependerá de si las NPU se vuelven comunes en los smartphones y de si aparece una API estándar para acceder a ellas
      Aun así, no sé si un códec basado en IA podrá competir en consumo de batería con hardware de función fija
  • AV1 ya fue un gran salto hacia un formato de video abierto y eficiente, y AV2 también se ha hecho esperar bastante
    Tomará tiempo hasta que se implemente en chips y hardware para usar codificación y decodificación por hardware de forma eficiente y rápida, pero considerando el aumento en los precios del almacenamiento y la crisis de chips, una mejora de eficiencia de alrededor del 25% se ve muy prometedora

  • Dav2d no suena tan bien. Ojalá antes de eso contribuya alguien con talento para los juegos de palabras en nombres de repositorios
    ¿avi2ude? ¿av2go?

    • rav2d se ve bastante bien — https://github.com/stukenov/rav2d. Es un port en Rust, y tiene una vibra similar a rav1d→dav1d
    • Fue difícil encontrar un buen nombre con av2
      En francés sería d2vid, o sea Deuvid
  • Espero que salga un codificador bastante rápido. El codificador de referencia de AV1 tampoco era gran cosa, y aquí parece pasar lo mismo
    Pero en cuanto aparezca algo como SVT-AV2, creo que quedaré muy satisfecho