- Strix Halo es la APU de chiplets para clientes más grande presentada por AMD, diseñada para procesar de manera integrada tareas de CPU y GPU de alto rendimiento
- Integra 16 núcleos Zen 5 y 40 unidades de cómputo de iGPU RDNA 3.5, ofreciendo un rendimiento cercano al de una CPU de escritorio y una GPU externa de gama media
- Incorpora un bus de memoria LPDDR5X-8000 y Infinity Cache de 32 MB para lograr mayor ancho de banda y baja latencia
- El rendimiento de iGPU supera ampliamente a los APU móviles anteriores y, en algunos escenarios, también puede competir con GPUs externas de gama media
- El rendimiento en ML (aprendizaje automático) está pendiente de la compatibilidad con ROCm, por lo que se espera potencial de expansión y evolución futura
Introducción y visión general del producto
- Strix Halo es la primera APU de chiplets para consumidores que AMD presentó en CES 2025
- Aunque es un procesador móvil, busca un rendimiento elevado comparable al de escritorio, con soporte de TDP de 55 W~120 W y alto rendimiento incluso sin una GPU discreta
- Utiliza una arquitectura Zen 5 de 16 núcleos (doble CCD de 8 núcleos) y una FPU de 512 b idéntica a productos de escritorio
- Soporta reloj máximo de impulso de 5,1 GHz (600 MHz menos que el Ryzen 9 9950X de escritorio)
- La iGPU RDNA 3.5 como GPU principal: 40 unidades de cómputo, 32 MB de Infinity Cache y reloj de impulso de 2,9 GHz → rendimiento de cómputo en el rango de RX 7600 XT~RX 7700
- Integra bus LPDDR5X-8000 de 256 b (hasta 256 GB/s, compartido entre todos los bloques; algo por debajo de los 288 GB/s de la RX 7600 XT, pero claramente superior al resto de APU anteriores)
Entorno de pruebas y dispositivos
- Se midió rendimiento real de uso con Asus ROG Flow Z13 (2025) y HP ZBook Ultra G1a 14”
- El ROG Flow Z13 se usó para pruebas con enfoque en juegos, y el ZBook Ultra G1a para microbenchmarks
Subsistema de memoria desde la perspectiva de la CPU
- Latencia de memoria: entre Strix Point (~128 ns) y Strix Halo (~123 ns) prácticamente no hay diferencia
- La CPU no puede acceder directamente a la cache Infinity Cache de 32 MB dentro del chiplet de E/S (IO die), lo cual fue confirmado oficialmente en una entrevista
- La CPU de escritorio (9950X) muestra una latencia de 75~80 ns, considerablemente menor que la móvil
- Ancho de banda de memoria: con 16 núcleos, en operaciones de lectura-modificación-suma supera 175 GB/s y puede alcanzar 124 GB/s en lecturas
- El ancho de banda por un solo CCD es de 64 GB/s (lectura) y 43 GB/s (escritura), con un total real de unos 103 GB/s
- Al igual que en escritorio, el enlace entre el CCD y el die de E/S es de 2000 MHz y 32 bytes por ciclo
Rendimiento de CPU
- La CPU de Strix Halo iguala el rendimiento en enteros del flagship de escritorio anterior (7950X), con una caída de frecuencia del 11,7 %
- El rendimiento de coma flotante es cercano al del flagship actual (9950X), con fenómenos de inversión en algunas subpruebas
- En los subtests Integer/FP de SPEC CPU 2017, Strix Halo se acerca o supera al 9950X en varios puntos, aunque una latencia más alta del bus LPDDR5X genera diferencias menores
Arquitectura de memoria desde la perspectiva de la GPU
- El ancho de banda de memoria de la GPU de Strix Halo es abrumadoramente alto entre todos los SoC móviles
- Aun así, es 50 % menor que el de la RTX 5070 Mobile
- El rendimiento de Infinity Cache (MALL) es 40 % superior al L2 de 5070M y su capacidad es 33 % mayor; la cache L2 de 4 MB ofrece 2,5 TB/s de ancho de banda
- La latencia de cache L2 de Strix Halo es menor que la de 5070M, mientras que la de su MALL de 32 MB es similar a la de 5070M L2
- La latencia total de memoria es 35 % menor frente a 5070M
Rendimiento de procesamiento (Throughput) de la GPU
- Rendimiento de cálculo de coma flotante: alrededor de 2,5 veces el de Strix Point, similar o superior al de 5070M
- En resultados FP16, 5070M queda por debajo de lo esperado (probablemente una anomalía del benchmark)
- Rendimiento de cálculo entero: 5070M es superior al de Radeon 8060S
Rendimiento de GPU y juegos
- Como iGPU, Strix Halo es claramente superior a las iGPU de Intel/AMD existentes y muy competitiva incluso frente a una GPU externa
- En pruebas de un juego con gran salto de rendimiento (Cyberpunk 2077):
- En modo batería: Radeon 8060S logra 7,5 % más rendimiento a 1080p que 5070M en las mismas condiciones
- En modo con fuente de pared: a 1080p, Radeon 8060S adelanta 2,5 %, y a 1440p 5070M adelanta 8,3 %
- Según la configuración y condiciones de potencia, ambos resultados muestran competitividad, y la iGPU puede ofrecer un rendimiento prácticamente equivalente al de una GPU externa
- En Fluid X3D y cargas de trabajo de cómputo, Radeon 8060S supera completamente a las iGPU anteriores de Intel/AMD
Conclusión
- Strix Halo busca ser un SoC integrado CPU-GPU de alto rendimiento que rinde muy bien en diversos escenarios de uso
- Compite con CPU Zen 5 de escritorio y GPU externas de gama media, y está orientada tanto a mobile como a desktop
- Mantiene eficiencia e integración (ventajas de la iGPU) mientras conserva rendimiento elevado
- No se sitúa por encima de las GPU externas de gama alta, pero en dispositivos compactos y entornos integrados ofrece la mejor combinación de flexibilidad y rendimiento
- El rendimiento en ML requiere análisis posterior por la demora en la compatibilidad con ROCm. Se menciona también el potencial de escalamiento y de bus de memoria amplia para cargas pesadas, en una línea similar a Apple Max/Ultra
- Se prevé que el diseño exitoso de Strix Halo sea la base para la expansión futura de la línea de APUs de alto rendimiento de AMD
1 comentarios
Comentarios de Hacker News
Tengo muchas ganas de probar una mini PC con este producto, pero en Europa es carísima o de plano imposible de comprar, y pedirla directamente desde China también da desconfianza por el tema del soporte; como ROCm 7 ya funciona en la mayoría de las distribuciones de Linux, creo que estaría genial usarla como workstation o como servidor de inferencia casero para LLM u Ollama y otros servicios
Encontré un producto que envían desde Alemania y que además tiene un precio relativamente accesible: BOSGAME M5 AI Mini Desktop
Me pregunto si ya revisaste la Corsair AI Workstation 300 Desktop PC; dependiendo del modelo que elijas, cuesta entre 2000 y 2700 euros, y considerando el IVA, se siente más o menos alineada con el precio en dólares en EE. UU. (1700~2300USD) Corsair AI Workstations
Pedí la versión framework desktop 395 128Gb por un poco menos de 1900 euros, y con configuraciones adicionales terminé pagando un poco más de 2000 euros con envío incluido, pero no sentí que fuera cara
Entiendo que la razón principal del precio elevado es la memoria de alto ancho de banda (aunque comparada con una GPU realmente de alto rendimiento, el ancho de banda de memoria tampoco es tan alto)
ROCm ha mejorado mucho, pero como también tuve algunos problemas con una RX9070XT de escritorio, por ahora recomendaría una solución de Nvidia o Apple para trabajo de IA; aun así, creo que pronto se pondrán al día. El mejor sistema de IA en relación precio/rendimiento sigue siendo armar tú mismo una desktop con dos RTX 3090 (claro, necesitas una tarjeta madre que soporte doble tarjeta), y simplemente ponerla a correr en un clóset
Comparándolo con una dGPU móvil y con el producto DGX Spark (que por fin se hizo realidad), este mercado todavía se siente como un segmento no del todo maduro y con potencial por desarrollar. No sé por qué DGX Spark se retrasó tanto, pero gracias a eso AMD tuvo la oportunidad de ganar cuota de mercado primero. La ventaja de las GPU discretas (incluidas las móviles) es el ancho de banda de memoria, y la desventaja es el alto consumo eléctrico y la capacidad de memoria (voy a dejar CUDA fuera de la discusión, aunque claro que es un factor enorme). Si se suma un desktop compacto DGX Spark, con puertos de red duales de 200Gb se podría usar RDMA entre varios dispositivos, así que podría tener más utilidad que la misma cantidad de equipos Strix Halo 395. Pero en trabajo real, probablemente usaría un servidor GPU o una workstation Threadripper con GPU en vez de cuatro DGX Spark. Y además, el hecho de que DGX Spark no cabe en una laptop también favorece a Strix Halo. En resumen, creo que este es un nuevo nicho de mercado y tengo curiosidad por ver cómo se establecerá en las próximas generaciones
En la siguiente generación, se espera que AMD lance Medusa Halo, y dicen que vendrá con un bus LPDDR6 de 384 bits; en ese caso, podría alcanzar el doble de memoria y 1.7 veces más ancho de banda que Strix Halo. Como Strix Halo está teniendo éxito como plataforma de inferencia, creo que este segmento del mercado seguirá creciendo
Como referencia, no es dual de 200Gb sino uno solo de 200Gb o dual de 100Gb
“dGPU” normalmente significa GPU discreta; me pregunto si no querrás decir “iGPU” (gráficos integrados). Los productos Strix Halo sí se están promocionando también para gaming, pero en la práctica su rendimiento se siente un poco desbalanceado: el CPU es exageradamente rápido, mientras que el rendimiento de la iGPU se queda relativamente corto. Aun así, el rendimiento en multiplicación de matrices (
matmul) sí parece claramente potenteEl propósito principal de DGX Spark parece ser el desarrollo y testing local de modelos de IA. Strix Halo, al ser una iGPU basada en amd64, también sirve para tareas tradicionales de PC y además es perfectamente válida como dispositivo objetivo para IA local. En mi opinión, Strix Halo parece ser el inicio del fin de la era de las GPU discretas en laptops. Nvidia también parece haberse dado cuenta de eso y da la impresión de que está intentando crear una solución iGPU en colaboración con Intel
Lo frustrante es que ya pasaron seis meses desde el lanzamiento y todavía solo hay dos laptops utilizables, y de esas la única de alto rendimiento es la Z13. También está el producto de Framework, pero en muchos países ni siquiera se puede comprar y me parece que apunta a un público bastante limitado. Me encanta la Z13, pero este producto también es claramente de nicho. No sé si hay problemas con la fabricación del chip, y también me pregunto si Apple se estará llevando toda la producción
El precio de la HP ZBook Ultra en Estados Unidos era absurdamente alto, pero en Europa se sentía razonable, parecido al de una laptop normal. Lo que más me pesa es no haber esperado la versión de 128GB por haber hecho el pedido el primer día. Pero en batería y rendimiento, no he visto ningún competidor que se le acerque en las cargas pesadas que he manejado hasta ahora. Y además de laptops, empresas como Beelink también están sacando NUC a precios razonables. Sí coincido en que la escasez de oferta ha complicado evaluar bien la oportunidad
La HP ZBook Ultra G1a es una buena opción porque puede configurarse con hasta 128GB de RAM
Beelink, GMKtec, Minisforum y Corsair también están lanzando productos
En la mayor parte de Europa no se puede comprar la Z13 con más de 32GB de RAM, y además normalmente no ofrecen garantía de 2~3 años, así que es frustrante. Al final, hasta dan ganas de comprar una Framework 13 con RAM/CPU/GPU más débiles
High Yield subió un video analizando a fondo el chip 395 a nivel de silicio, vale la pena verlo: High Yield - 395 Chip Deep Dive
Me pregunto si en framework desktop se puede usar un TDP (límite de potencia) más alto; esta desktop parece tener mucha mejor refrigeración que las laptops con el mismo chip, así que quizá haya una diferencia real de rendimiento
Se puede configurar hasta 140W sostenidos y 160W en burst (unos 10 segundos)
No he medido el consumo eléctrico, pero estoy usando la motherboard de Framework dentro de un case ITX más grande para mejorar la refrigeración. Mi PC principal es una 7950X3D, y esa unidad Strix tiene la misma cantidad de núcleos/hilos; en benchmarks casi no hay diferencia entre ambas. O sea, es impresionante que una laptop pueda ofrecer rendimiento de cómputo a nivel desktop
Leí en algún lado que una de las principales razones por las que este APU no es tan eficiente energéticamente como los productos de Apple es que se tomaron decisiones para compartir arquitectura con Epyc. La idea era que eso implicó un trade-off que perjudica la eficiencia a bajo consumo. Me pregunto si alguien puede confirmarlo
En la reseña de Hardware Canucks hay pruebas del M4 Pro (3nm de segunda generación) frente al 395+ (4nm) a 50W, y el rendimiento es bastante parecido, así que eso podría explicarse por la diferencia entre procesos de 3nm y 4nm reseña en YouTube
El APU está bien, pero en ancho de banda de memoria jamás va a alcanzar algo como un m3 ultra. Eso sí, es muchísimo más barato. Yo estoy considerando reemplazar una desktop vieja, y para mí es importante poder pedir prestada una GPU externa (A6000 o algo así) en la empresa por un rato sin tardarme demasiado en dejarla configurada
Compré una framework desktop para probarla, y aunque es pequeña, de verdad es una máquina muy impresionante. Ojalá este tipo de producto atraiga más interés y participación de la comunidad de ingeniería. Un ecosistema con buen soporte para vulkan o rocm sería bueno para todos
Tengo una pregunta relacionada: si armo una Zen 5 de escritorio + RX 7600 XT + memoria, ¿sería posible crear de forma barata algo como Strix Halo o Apple Silicon, donde la memoria del sistema y la GPU comparten ancho de banda? Y además, ¿sería posible correr LLM grandes localmente a un precio razonable? También puede que esté equivocado, pero según entiendo, solo en los APU se comparte la memoria y en una GPU discreta no; quisiera confirmar si eso es correcto
Me pregunto si el rendimiento gráfico está a un nivel capaz de competir con una 5070M. Si el precio y el consumo energético son razonables, se ve muy atractivo
Me pregunto cómo se compara el rendimiento de la GPU frente a las GPU de las Mac de la serie M