3 puntos por GN⁺ 2024-10-13 | 1 comentarios | Compartir por WhatsApp

Turin de AMD: lanzamiento de EPYC de 5.ª generación

  • CPU para servidores de 5 GHz
    • Un artículo de presentación sobre el nuevo CPU para servidores EPYC 9575F de AMD, escrito a partir de una experiencia práctica directa, a diferencia de la cobertura previa de Granite Rapids.
    • Como ya se han tratado las diferencias entre las versiones móviles y de escritorio de los núcleos Zen 5, este artículo se enfoca en los cambios del subsistema de memoria de Turin.

Ancho de banda de memoria

  • El 9575F registra aproximadamente 52 GB/s de ancho de banda de lectura de memoria, 48 GB/s de escritura y 95 GB/s en lectura-modificación-escritura.
  • Al observar el uso del ancho de banda de memoria en un solo CCD, un solo núcleo puede usar menos de la mitad del ancho de banda total de lectura del CCD, alrededor del 55% del ancho de banda de escritura y más de 2/3 del ancho de banda de lectura-modificación-escritura.
  • El 9575F ofrece un ancho de banda hacia el CCD considerablemente mayor que las piezas Zen 5 de escritorio, porque proporciona 2 enlaces GMI al die de I/O a través de GMI3-W.
  • Turin admite hasta DDR5-6400 MT/s, aunque solo en ciertos sistemas con 1 DIMM por canal. La mayoría de los sistemas admiten 6000 MT/s, y con configuraciones de 2 DIMM por canal baja a 4400 MT/s.

Latencia de memoria

  • La latencia de memoria sin carga de Turin es similar a la de Genoa.
  • Al medir la latencia de memoria bajo carga, cuando un solo CCD está cargado aumenta unos 39 nanosegundos frente al estado sin carga, y cuando todo el sistema está cargado aumenta unos 31 nanosegundos.
  • La latencia dentro del CCD es de unos 45 ns, entre CCD es de unos 150 ns y entre sockets es de unos 260 ns, lo que representa un aumento frente a Genoa.

Velocidad de reloj

  • Los 64 núcleos del 9575F pueden alcanzar hasta 5 GHz en pruebas de un solo hilo, y en pruebas de ancho de banda de memoria 8 núcleos operan a 5 GHz.
  • Cuando 128 hilos están activos en Cinebench 2024, el 9575F mantiene alrededor de 4.3 GHz, mientras que en cargas de trabajo de servidor web/transacciones TLS registra cerca de 4.9 GHz.

Conclusión

  • Turin de AMD es una actualización generacional previsible, que ofrece SKU con alto número de núcleos y SKU de alta frecuencia con menos núcleos para cubrir las necesidades de distintos mercados.
  • Turin se parece más a una evolución de Milan a Genoa que a un cambio revolucionario como el de Naples a Rome, e incluye más ancho de banda de memoria, más núcleos y una actualización de núcleos.
  • Esta generación ofrece mucho valor en un ecosistema competitivo y resultará interesante para muchas personas.

Resumen de GN⁺

  • Turin de AMD representa un avance importante en el mercado de CPU para servidores, y destacan especialmente sus mejoras en ancho de banda de memoria y rendimiento de núcleos.
  • Este artículo es útil para quienes quieran entender la tecnología más reciente de AMD y puede ayudar a ingenieros interesados en optimizar el rendimiento de servidores.
  • Entre los productos con funciones similares a Turin está la serie Xeon de Intel, y compararlos con AMD permite identificar las ventajas y desventajas de cada opción.

1 comentarios

 
GN⁺ 2024-10-13
Comentarios en Hacker News
  • El AMD EPYC 9175F es un producto inusual con 16 núcleos y 512 MB de caché L3. Parece estar dirigido a clientes que quieren minimizar los costos de licencia "por núcleo". Me pregunto si Oracle todavía usa este tipo de licenciamiento

    • Para ciertos fines específicos, como HFT, también podría servir para meter todo el algoritmo en la L3 y buscar la mínima latencia
    • Pero lo más probable es que esté relacionado principalmente con problemas de licenciamiento de software
  • Phoronix publicó una comparativa entre el Turin Dense de 196 núcleos y el AmpereOne de 192 núcleos

    • El MSRP de Ampere es de $5.5K y el de EPYC es de $15K
    • El Turin 196 ofrece 1.6 veces más rendimiento
    • Ampere es 1.2 veces más eficiente en consumo de energía
    • En términos reales de $/rendimiento, el Ampere de 192 núcleos es 1.7 veces mejor que el Turin Dense de 196 núcleos
  • Por $5.5K se puede comprar un CPU AmpereOne de 192 núcleos (274w) o un CPU Turin Dense de 48 núcleos (300w)

    • Ampere planea lanzar el próximo año un producto con 256 núcleos, 3nm y 12 canales de memoria, que podría ser un mejor competidor frente a Turin Dense y Sierra Forest en rendimiento
    • Por ahora, su propuesta de valor es el $/rendimiento
  • Me interesa muchísimo el rendimiento de los chips de servidor de Qualcomm basados en Nuvia

    • Si las mejoras en los núcleos cliente de ARM sirven como indicador, tengo mucha curiosidad por ver cómo competirán los chips propios como AWS Graviton, Google Axion, Microsoft Cobalt, Nvidia Grace y Alibaba Yitian frente a mejores núcleos Neoverse
    • Tengo ganas de ver la competencia entre Nuvia vs ARM vs AmpereOne
  • Puede que estemos viviendo una época dorada para los CPU de servidor

    • Hace 7 años solo estaba Intel Xeon
    • Ahora hay muchas opciones distintas
  • Tengo muchas ganas de que Hetzner despliegue servidores bare metal con AMD Turin

    • La generación anterior ya ofrecía una excelente relación valor/precio, pero esta vez parece haber subido otro nivel
  • Hace 20 años, los CPU tenían solo 1 o 2 núcleos, y tener 4 núcleos en un servidor de doble socket ya era una suerte

    • Ahora puedes tener casi 400 núcleos en un solo servidor
    • ARM puede tener más núcleos, pero por ahora no rinden tan bien como estos
  • Para quienes no les gusta el cambio hacia Substack, hay un sitio alternativo

  • Estoy usando un Dell PowerEdge de 12 años con Xeon duales

    • Espero a que los servidores Epyc de primera generación empiecen a aparecer baratos en eBay
  • ChipsAndCheese es una de las nuevas publicaciones técnicas, con un conocimiento sobresaliente, especialmente en benchmarks profundos

    • Con la desaparición de sitios técnicos más antiguos como Anandtech, TechReport y HardCOP, da gusto ver nuevas publicaciones capaces de mantener ese estilo
  • Salió en el momento justo para Factorio 2.0

  • Quiero ver cómo funciona realmente el 9965

    • Estas piezas son una locura
    • Planeo comprar una máquina de esta generación
  • En el minuto 1:11 del video está la tabla de TDP

    • Funciona a 125-500W, bastante caliente