20 puntos por GN⁺ 2025-12-24 | 1 comentarios | Compartir por WhatsApp
  • Se dio a conocer que el scheduler de Linux SCX-LAVD diseñado para el Steam Deck de Valve también funciona de forma efectiva en el entorno de servidores a gran escala de Meta
  • Este scheduler fue diseñado con el objetivo de lograr una gestión eficiente de recursos al nivel de una consola de videojuegos, y Meta busca con él mejorar el rendimiento de las cargas de trabajo del servidor y minimizar la latencia
  • La arquitectura de Latency-criticality Aware Virtual Deadline orientada a dispositivos portátiles sensibles a la latencia también mostró rendimiento y estabilidad en servidores hiperescalables
  • En comparación con el scheduler EEVDF existente, ofrece un rendimiento similar o mejor y puede adaptarse a diversas configuraciones de hardware
  • Meta está evaluando SCX-LAVD como candidato a scheduler predeterminado para servidores, no solo para fines especializados
  • Un caso poco común en el que una tecnología para hardware de videojuegos se expande a grandes centros de datos

Contexto de la presentación en Linux Plumbers Conference 2025

  • Ingenieros de Meta presentaron estos detalles en la Linux Plumbers Conference 2025 celebrada en Tokyo
  • El título de la charla fue “How do we make a Steam Deck scheduler work on large servers”, donde explican el proceso de llevar un scheduler para dispositivos portátiles al entorno de servidores
  • Compartieron su experiencia validando y ajustando un scheduler diseñado para el Steam Deck a un entorno de servidores

Resumen del scheduler SCX-LAVD

  • SCX-LAVD fue diseñado como un scheduler Latency-criticality Aware Virtual Deadline
  • Fue desarrollado en el entorno del Steam Deck de Valve con el objetivo de ofrecer baja latencia y rendimiento estable
  • Usa una estructura de scheduler extensible que funciona sobre el framework Linux sched_ext
  • Meta espera con ello reducir la latencia, mejorar la consistencia del rendimiento y mejorar la eficiencia de los servidores
  • Como el diseño de Valve estaba orientado a las exigencias de procesamiento en tiempo real para videojuegos, también ofrece una estructura ventajosa para la gestión sostenida de carga en servidores

Resultados de su aplicación en el entorno de servidores de Meta

  • Se confirmó un funcionamiento estable en diversas configuraciones de CPU y memoria de los servidores de Meta
  • Mostró un excelente rendimiento de balanceo de carga entre los límites de CCX y LLC
  • Resulta adecuado como opción predeterminada en entornos donde no se necesita un scheduler optimizado para cargas de trabajo específicas

Scheduler existente y otros casos de uso

  • SCX-LAVD mostró un rendimiento similar o mejor en comparación con el scheduler EEVDF
  • Ya se usa en entornos Linux para videojuegos como CachyOS Handheld Edition y Bazzite
  • Es un scheduler cuyo desarrollo fue liderado por Igalia mediante un contrato con Valve

Próximo enfoque de uso de Meta

  • Meta se refiere a SCX-LAVD como “Meta’s New Default Scheduler”
  • Lo está evaluando como un scheduler de uso general aplicable a toda su flota de servidores a gran escala
  • Más detalles de investigación y análisis de rendimiento fueron publicados en el video de la charla de LPC y en las diapositivas

1 comentarios

 
GN⁺ 2025-12-24
Opiniones de Hacker News
  • Valve está impulsando prácticamente por sí sola el desarrollo del ecosistema Linux
    Proton/Wine avanzó muchísimo para poder correr juegos de Windows en Linux, y gracias a Steam Deck también llegaron el soporte de HDR y VRR en Wayland
    El scheduler que hicieron para mejorar el frame pacing ahora también se usa en los centros de datos de Meta
    Al final, la eficiencia de los servidores de Meta mejoró gracias a que Valve le pagó a Igalia para reducir el stuttering de Elden Ring. Este es el verdadero círculo virtuoso del open source
    • Al intentar reducir el stuttering en juegos, terminaron obteniendo mejores resultados al optimizar el compilador de shaders de la pila gráfica open source
      Anuncio relacionado: Steam Community Announcement
    • El desarrollo de videojuegos sigue siendo un área subestimada
      Muchísimas optimizaciones de software y hardware nacieron en el desarrollo de juegos
      Ahora que el precio de la RAM está subiendo otra vez, ojalá se vuelva a priorizar la optimización para reducir la carga innecesaria en toda la industria
    • Ha habido varias distribuciones de Linux enfocadas en el escritorio, pero la mayoría estaban en un punto de “técnicamente funciona, pero tienes que aguantar incomodidades”
      Hasta que Valve se involucró directamente, no había nadie que realmente se hiciera cargo de resolver esos problemas
    • Con el tiempo, parece que Valve va a terminar metiéndose incluso en cosas que Microsoft ha pospuesto durante años
      Me parece mucho mejor cambiar las cosas uno mismo que quedarse esperando
    • Gracias a los juegos, la industria de las GPU ya estaba preparada para el boom de la IA
      Históricamente, el desarrollo de juegos siempre ha estado en la primera línea de la optimización de software
  • Es interesante que Valve lleve el desarrollo relacionado con Linux con una estructura centrada en contratistas como Igalia
    He escuchado que Proton también se hizo de una forma parecida. Parece que Valve usa bastante más contratación externa que personal interno
    • Igalia es una empresa peculiar que gestiona de forma organizada el patrocinio de desarrollo open source para varias compañías
      Colabora con empresas como Google y muchas otras, y maneja de forma eficiente temas complejos de pagos y prestaciones
    • Valve se enfoca internamente solo en juegos, hardware y distribución, y delega otras áreas a contratistas especializados
      Creo que esa estructura explica por qué es rentable y a la vez produce resultados de alta calidad
      Claro, Valve también tiene sus controversias, pero hay que reconocer tanto lo bueno como lo malo
    • Valve es una organización pequeña y plana de unas 350 a 400 personas
      Por eso le resulta mucho más fácil expandirse con contratistas que con empleados de planta
    • Proton es un proyecto hecho entre desarrolladores internos de Valve, CodeWeavers y la comunidad
      Áreas técnicas muy especializadas como la conversión de DirectX→Vulkan u OpenGL→Vulkan se encargan a organizaciones como Igalia
    • Valve tiende a mantener la plantilla lo más reducida posible
      Para proyectos fijos y de alta complejidad como estos, externalizar es razonable para cualquier empresa
  • sched_ext es un scheduler desarrollado en Meta
    Varias empresas colaboran en su desarrollo en un repositorio compartido de GitHub
  • Me pregunto qué tan bueno es el game streaming en Linux
    Se acaba el soporte para Windows 10, así que ahora quiero pasarme por completo a Linux
  • Llevo 4 meses usando Bazzite Desktop como sistema principal, y ahora Windows ya parece prácticamente software abandonado
    Aunque lo actualices, sigue siendo pesado y difícil de administrar
    • ¿Bazzite no es una distro centrada en juegos?
      Hacer todo ahí se ve un poco raro. Es como usar Excel en una Steam Deck
  • La magia del open source es que Valve no exige cosas como una licencia enterprise
    • Sí, pero Red Hat no está obligado a publicar el código fuente si no distribuye los binarios de RHEL
      Mientras Meta lo use solo en sus servidores internos, también puede mantener privado su Linux con parches propios
    • Sorprende que un scheduler para una consola portátil también funcione bien en los servidores de Facebook
    • A la inversa, SteamOS y varias distribuciones de Linux también han adoptado el scheduler de IO Kyber de Meta para resolver el microstuttering
      Es una relación de influencia mutua
    • Pensándolo bien, tal vez la comisión del 30% que pagamos al comprar juegos en Steam sea una especie de costo de licencia
  • Es interesante que Meta haya aplicado el scheduler de Valve a sus servidores
    Me da curiosidad cómo empezó algo así
    • Probablemente algún ingeniero lo probó, vio mejoras de rendimiento y eso se propagó de abajo hacia arriba
      Incluso en empresas grandes, la innovación suele surgir así
  • Creo que es mejor ver el video original en lugar del artículo de Phoronix
    Enlace de YouTube
    • En el momento en que dejas de confiar en videos de YouTube como fuente primaria, la vida se vuelve mucho más fácil
    • Sorprende que llamen spam de blog a Phoronix
  • Me pregunto qué tipo de workloads de ultra baja latencia ejecuta Meta para necesitar un scheduler así
    • Según el video, los workers de Erlang de WhatsApp requieren latencias por debajo del milisegundo
    • Probablemente sea por el sistema de subasta de anuncios
    • En una empresa tan grande como Meta, la latencia se traduce directamente en pérdidas de negocio
    • En Meta siempre apuntan a ir “lo más rápido posible”, incluso cuando es más de lo necesario
    • Si reduces apenas 1% en 50 mil servidores, ya son 50 menos; a 8 mil dólares por servidor, eso son 400 mil dólares de ahorro al año
      A la escala de Meta, el impacto real sería mucho mayor
  • Es interesante que los workloads de servidor adopten ideas de otras áreas
    Hace poco vi sistemas operativos dedicados a Kubernetes que aplican actualizaciones como Android
    • Dan ganas de responder preguntando si se refiere a un sistema inmutable