La APU de chiplets de AMD: resumen de Strix Halo

(chipsandcheese.com)

1 puntos por GN⁺ 2025-10-20 | 1 comentarios | Compartir por WhatsApp

Strix Halo es la APU de chiplets para clientes más grande presentada por AMD, diseñada para procesar de manera integrada tareas de CPU y GPU de alto rendimiento
Integra 16 núcleos Zen 5 y 40 unidades de cómputo de iGPU RDNA 3.5, ofreciendo un rendimiento cercano al de una CPU de escritorio y una GPU externa de gama media
Incorpora un bus de memoria LPDDR5X-8000 y Infinity Cache de 32 MB para lograr mayor ancho de banda y baja latencia
El rendimiento de iGPU supera ampliamente a los APU móviles anteriores y, en algunos escenarios, también puede competir con GPUs externas de gama media
El rendimiento en ML (aprendizaje automático) está pendiente de la compatibilidad con ROCm, por lo que se espera potencial de expansión y evolución futura

Introducción y visión general del producto

Strix Halo es la primera APU de chiplets para consumidores que AMD presentó en CES 2025
Aunque es un procesador móvil, busca un rendimiento elevado comparable al de escritorio, con soporte de TDP de 55 W~120 W y alto rendimiento incluso sin una GPU discreta
Utiliza una arquitectura Zen 5 de 16 núcleos (doble CCD de 8 núcleos) y una FPU de 512 b idéntica a productos de escritorio
Soporta reloj máximo de impulso de 5,1 GHz (600 MHz menos que el Ryzen 9 9950X de escritorio)
La iGPU RDNA 3.5 como GPU principal: 40 unidades de cómputo, 32 MB de Infinity Cache y reloj de impulso de 2,9 GHz → rendimiento de cómputo en el rango de RX 7600 XT~RX 7700
Integra bus LPDDR5X-8000 de 256 b (hasta 256 GB/s, compartido entre todos los bloques; algo por debajo de los 288 GB/s de la RX 7600 XT, pero claramente superior al resto de APU anteriores)

Entorno de pruebas y dispositivos

Se midió rendimiento real de uso con Asus ROG Flow Z13 (2025) y HP ZBook Ultra G1a 14”
El ROG Flow Z13 se usó para pruebas con enfoque en juegos, y el ZBook Ultra G1a para microbenchmarks

Subsistema de memoria desde la perspectiva de la CPU

Latencia de memoria: entre Strix Point (~128 ns) y Strix Halo (~123 ns) prácticamente no hay diferencia
La CPU no puede acceder directamente a la cache Infinity Cache de 32 MB dentro del chiplet de E/S (IO die), lo cual fue confirmado oficialmente en una entrevista
La CPU de escritorio (9950X) muestra una latencia de 75~80 ns, considerablemente menor que la móvil
Ancho de banda de memoria: con 16 núcleos, en operaciones de lectura-modificación-suma supera 175 GB/s y puede alcanzar 124 GB/s en lecturas
- El ancho de banda por un solo CCD es de 64 GB/s (lectura) y 43 GB/s (escritura), con un total real de unos 103 GB/s
- Al igual que en escritorio, el enlace entre el CCD y el die de E/S es de 2000 MHz y 32 bytes por ciclo

Rendimiento de CPU

La CPU de Strix Halo iguala el rendimiento en enteros del flagship de escritorio anterior (7950X), con una caída de frecuencia del 11,7 %
El rendimiento de coma flotante es cercano al del flagship actual (9950X), con fenómenos de inversión en algunas subpruebas
En los subtests Integer/FP de SPEC CPU 2017, Strix Halo se acerca o supera al 9950X en varios puntos, aunque una latencia más alta del bus LPDDR5X genera diferencias menores

Arquitectura de memoria desde la perspectiva de la GPU

El ancho de banda de memoria de la GPU de Strix Halo es abrumadoramente alto entre todos los SoC móviles
Aun así, es 50 % menor que el de la RTX 5070 Mobile
El rendimiento de Infinity Cache (MALL) es 40 % superior al L2 de 5070M y su capacidad es 33 % mayor; la cache L2 de 4 MB ofrece 2,5 TB/s de ancho de banda
La latencia de cache L2 de Strix Halo es menor que la de 5070M, mientras que la de su MALL de 32 MB es similar a la de 5070M L2
La latencia total de memoria es 35 % menor frente a 5070M

Rendimiento de procesamiento (Throughput) de la GPU

Rendimiento de cálculo de coma flotante: alrededor de 2,5 veces el de Strix Point, similar o superior al de 5070M
- En resultados FP16, 5070M queda por debajo de lo esperado (probablemente una anomalía del benchmark)
Rendimiento de cálculo entero: 5070M es superior al de Radeon 8060S

Rendimiento de GPU y juegos

Como iGPU, Strix Halo es claramente superior a las iGPU de Intel/AMD existentes y muy competitiva incluso frente a una GPU externa
En pruebas de un juego con gran salto de rendimiento (Cyberpunk 2077):
- En modo batería: Radeon 8060S logra 7,5 % más rendimiento a 1080p que 5070M en las mismas condiciones
- En modo con fuente de pared: a 1080p, Radeon 8060S adelanta 2,5 %, y a 1440p 5070M adelanta 8,3 %
- Según la configuración y condiciones de potencia, ambos resultados muestran competitividad, y la iGPU puede ofrecer un rendimiento prácticamente equivalente al de una GPU externa
En Fluid X3D y cargas de trabajo de cómputo, Radeon 8060S supera completamente a las iGPU anteriores de Intel/AMD

Conclusión

Strix Halo busca ser un SoC integrado CPU-GPU de alto rendimiento que rinde muy bien en diversos escenarios de uso
Compite con CPU Zen 5 de escritorio y GPU externas de gama media, y está orientada tanto a mobile como a desktop
Mantiene eficiencia e integración (ventajas de la iGPU) mientras conserva rendimiento elevado
No se sitúa por encima de las GPU externas de gama alta, pero en dispositivos compactos y entornos integrados ofrece la mejor combinación de flexibilidad y rendimiento
El rendimiento en ML requiere análisis posterior por la demora en la compatibilidad con ROCm. Se menciona también el potencial de escalamiento y de bus de memoria amplia para cargas pesadas, en una línea similar a Apple Max/Ultra
Se prevé que el diseño exitoso de Strix Halo sea la base para la expansión futura de la línea de APUs de alto rendimiento de AMD

1 comentarios

GN⁺ 2025-10-20

Comentarios de Hacker News

Tengo muchas ganas de probar una mini PC con este producto, pero en Europa es carísima o de plano imposible de comprar, y pedirla directamente desde China también da desconfianza por el tema del soporte; como ROCm 7 ya funciona en la mayoría de las distribuciones de Linux, creo que estaría genial usarla como workstation o como servidor de inferencia casero para LLM u Ollama y otros servicios
- Encontré un producto que envían desde Alemania y que además tiene un precio relativamente accesible: BOSGAME M5 AI Mini Desktop
- Me pregunto si ya revisaste la Corsair AI Workstation 300 Desktop PC; dependiendo del modelo que elijas, cuesta entre 2000 y 2700 euros, y considerando el IVA, se siente más o menos alineada con el precio en dólares en EE. UU. (1700~2300USD) Corsair AI Workstations
- Pedí la versión framework desktop 395 128Gb por un poco menos de 1900 euros, y con configuraciones adicionales terminé pagando un poco más de 2000 euros con envío incluido, pero no sentí que fuera cara
- Entiendo que la razón principal del precio elevado es la memoria de alto ancho de banda (aunque comparada con una GPU realmente de alto rendimiento, el ancho de banda de memoria tampoco es tan alto)
- ROCm ha mejorado mucho, pero como también tuve algunos problemas con una RX9070XT de escritorio, por ahora recomendaría una solución de Nvidia o Apple para trabajo de IA; aun así, creo que pronto se pondrán al día. El mejor sistema de IA en relación precio/rendimiento sigue siendo armar tú mismo una desktop con dos RTX 3090 (claro, necesitas una tarjeta madre que soporte doble tarjeta), y simplemente ponerla a correr en un clóset
Comparándolo con una dGPU móvil y con el producto DGX Spark (que por fin se hizo realidad), este mercado todavía se siente como un segmento no del todo maduro y con potencial por desarrollar. No sé por qué DGX Spark se retrasó tanto, pero gracias a eso AMD tuvo la oportunidad de ganar cuota de mercado primero. La ventaja de las GPU discretas (incluidas las móviles) es el ancho de banda de memoria, y la desventaja es el alto consumo eléctrico y la capacidad de memoria (voy a dejar CUDA fuera de la discusión, aunque claro que es un factor enorme). Si se suma un desktop compacto DGX Spark, con puertos de red duales de 200Gb se podría usar RDMA entre varios dispositivos, así que podría tener más utilidad que la misma cantidad de equipos Strix Halo 395. Pero en trabajo real, probablemente usaría un servidor GPU o una workstation Threadripper con GPU en vez de cuatro DGX Spark. Y además, el hecho de que DGX Spark no cabe en una laptop también favorece a Strix Halo. En resumen, creo que este es un nuevo nicho de mercado y tengo curiosidad por ver cómo se establecerá en las próximas generaciones
- En la siguiente generación, se espera que AMD lance Medusa Halo, y dicen que vendrá con un bus LPDDR6 de 384 bits; en ese caso, podría alcanzar el doble de memoria y 1.7 veces más ancho de banda que Strix Halo. Como Strix Halo está teniendo éxito como plataforma de inferencia, creo que este segmento del mercado seguirá creciendo
- Como referencia, no es dual de 200Gb sino uno solo de 200Gb o dual de 100Gb
- “dGPU” normalmente significa GPU discreta; me pregunto si no querrás decir “iGPU” (gráficos integrados). Los productos Strix Halo sí se están promocionando también para gaming, pero en la práctica su rendimiento se siente un poco desbalanceado: el CPU es exageradamente rápido, mientras que el rendimiento de la iGPU se queda relativamente corto. Aun así, el rendimiento en multiplicación de matrices (matmul) sí parece claramente potente
- El propósito principal de DGX Spark parece ser el desarrollo y testing local de modelos de IA. Strix Halo, al ser una iGPU basada en amd64, también sirve para tareas tradicionales de PC y además es perfectamente válida como dispositivo objetivo para IA local. En mi opinión, Strix Halo parece ser el inicio del fin de la era de las GPU discretas en laptops. Nvidia también parece haberse dado cuenta de eso y da la impresión de que está intentando crear una solución iGPU en colaboración con Intel
Lo frustrante es que ya pasaron seis meses desde el lanzamiento y todavía solo hay dos laptops utilizables, y de esas la única de alto rendimiento es la Z13. También está el producto de Framework, pero en muchos países ni siquiera se puede comprar y me parece que apunta a un público bastante limitado. Me encanta la Z13, pero este producto también es claramente de nicho. No sé si hay problemas con la fabricación del chip, y también me pregunto si Apple se estará llevando toda la producción
- El precio de la HP ZBook Ultra en Estados Unidos era absurdamente alto, pero en Europa se sentía razonable, parecido al de una laptop normal. Lo que más me pesa es no haber esperado la versión de 128GB por haber hecho el pedido el primer día. Pero en batería y rendimiento, no he visto ningún competidor que se le acerque en las cargas pesadas que he manejado hasta ahora. Y además de laptops, empresas como Beelink también están sacando NUC a precios razonables. Sí coincido en que la escasez de oferta ha complicado evaluar bien la oportunidad
- La HP ZBook Ultra G1a es una buena opción porque puede configurarse con hasta 128GB de RAM
- Beelink, GMKtec, Minisforum y Corsair también están lanzando productos
- En la mayor parte de Europa no se puede comprar la Z13 con más de 32GB de RAM, y además normalmente no ofrecen garantía de 2~3 años, así que es frustrante. Al final, hasta dan ganas de comprar una Framework 13 con RAM/CPU/GPU más débiles
High Yield subió un video analizando a fondo el chip 395 a nivel de silicio, vale la pena verlo: High Yield - 395 Chip Deep Dive
Me pregunto si en framework desktop se puede usar un TDP (límite de potencia) más alto; esta desktop parece tener mucha mejor refrigeración que las laptops con el mismo chip, así que quizá haya una diferencia real de rendimiento
- Se puede configurar hasta 140W sostenidos y 160W en burst (unos 10 segundos)
- No he medido el consumo eléctrico, pero estoy usando la motherboard de Framework dentro de un case ITX más grande para mejorar la refrigeración. Mi PC principal es una 7950X3D, y esa unidad Strix tiene la misma cantidad de núcleos/hilos; en benchmarks casi no hay diferencia entre ambas. O sea, es impresionante que una laptop pueda ofrecer rendimiento de cómputo a nivel desktop
Leí en algún lado que una de las principales razones por las que este APU no es tan eficiente energéticamente como los productos de Apple es que se tomaron decisiones para compartir arquitectura con Epyc. La idea era que eso implicó un trade-off que perjudica la eficiencia a bajo consumo. Me pregunto si alguien puede confirmarlo
- En la reseña de Hardware Canucks hay pruebas del M4 Pro (3nm de segunda generación) frente al 395+ (4nm) a 50W, y el rendimiento es bastante parecido, así que eso podría explicarse por la diferencia entre procesos de 3nm y 4nm reseña en YouTube
- El APU está bien, pero en ancho de banda de memoria jamás va a alcanzar algo como un m3 ultra. Eso sí, es muchísimo más barato. Yo estoy considerando reemplazar una desktop vieja, y para mí es importante poder pedir prestada una GPU externa (A6000 o algo así) en la empresa por un rato sin tardarme demasiado en dejarla configurada
Compré una framework desktop para probarla, y aunque es pequeña, de verdad es una máquina muy impresionante. Ojalá este tipo de producto atraiga más interés y participación de la comunidad de ingeniería. Un ecosistema con buen soporte para vulkan o rocm sería bueno para todos
Tengo una pregunta relacionada: si armo una Zen 5 de escritorio + RX 7600 XT + memoria, ¿sería posible crear de forma barata algo como Strix Halo o Apple Silicon, donde la memoria del sistema y la GPU comparten ancho de banda? Y además, ¿sería posible correr LLM grandes localmente a un precio razonable? También puede que esté equivocado, pero según entiendo, solo en los APU se comparte la memoria y en una GPU discreta no; quisiera confirmar si eso es correcto
- La memoria no es “unificada” cuando la GPU está físicamente separada. En ese caso se accede a través del bus PCIe, lo que genera un cuello de botella importante en ancho de banda. El máximo de PCIe 5.0 x16 es 64GB/s, y ni siquiera todas las GPU soportan eso
Me pregunto si el rendimiento gráfico está a un nivel capaz de competir con una 5070M. Si el precio y el consumo energético son razonables, se ve muy atractivo
- El consumo ronda los 75W. Se puede subir manualmente, pero en cualquier caso se mantiene por debajo de 100W (esto lo saqué investigando la Z13). El chip en sí puede tolerar más potencia, y como ASUS suele meterles más de 130W a sus laptops, la cifra de 75W me pareció un poco inesperada
Me pregunto cómo se compara el rendimiento de la GPU frente a las GPU de las Mac de la serie M

La APU de chiplets de AMD: resumen de Strix Halo

Introducción y visión general del producto

Entorno de pruebas y dispositivos

Subsistema de memoria desde la perspectiva de la CPU

Rendimiento de CPU

Arquitectura de memoria desde la perspectiva de la GPU

Rendimiento de procesamiento (Throughput) de la GPU

Rendimiento de GPU y juegos

Conclusión

Lecturas relacionadas

1 comentarios

Comentarios de Hacker News