- Arm presentó el CPU AGI basado en la plataforma Neoverse, ofreciendo directamente silicio listo para producción para infraestructura de IA autónoma
- Este CPU está optimizado para cargas de trabajo de IA paralelas en entornos de racks de alta densidad, manteniendo alto rendimiento por hilo y ancho de banda de memoria incluso bajo carga sostenida
- Socios clave como Meta, OpenAI y SK Telecom ya comenzaron despliegues comerciales, y lo están aplicando a distintos entornos de infraestructura de IA como gestión de aceleradores y orquestación de agentes
- Arm presentó el 1OU Dual Node Reference Server e impulsa la expansión del ecosistema con factor de forma estándar de OCP y herramientas de código abierto
- Este lanzamiento significa que Arm entra de lleno al mercado de silicio para centros de datos y se posiciona como una base clave de la arquitectura de centros de datos nativos para IA
Arm presenta el CPU AGI: una base de silicio para la era de la nube con IA agéntica
- El Arm AGI CPU es un nuevo producto de silicio basado en la plataforma Arm Neoverse, diseñado como un CPU listo para producción con el objetivo de impulsar la infraestructura de IA de próxima generación
- Por primera vez en los 35 años de historia de Arm, la compañía ofrece directamente un producto de silicio, brindando a los clientes, de forma opcional, soluciones a nivel de plataforma y procesadores diseñados por Arm más allá del IP y Compute Subsystem (CSS)
- Se trata de una medida para responder a la rápida evolución de la infraestructura de IA y al aumento de la demanda por plataformas Arm capaces de desplegarse a gran escala
El auge de la infraestructura de IA agéntica
- Los sistemas de IA están entrando globalmente en una era de operación continua y autónoma
- Antes, la velocidad de interacción humana limitaba la velocidad de procesamiento del sistema, pero con la IA agéntica, los agentes de software interactúan con múltiples modelos en tiempo real y toman decisiones
- Con este cambio, el CPU emerge como el elemento central de coordinación de la infraestructura moderna
- El CPU gestiona aceleradores, memoria, almacenamiento, programación de cargas de trabajo y movimiento de datos, además de coordinar múltiples agentes de forma simultánea
- Arm Neoverse ya se utiliza como base de plataformas hiperescalables y de IA clave como AWS Graviton, Google Axion, Microsoft Azure Cobalt y NVIDIA Vera
- El Arm AGI CPU fue desarrollado para responder a estas necesidades de expansión de la infraestructura global de IA
Arm AGI CPU: diseñado para eficiencia agéntica a nivel de rack
- El Arm AGI CPU fue diseñado para mantener un alto rendimiento por tarea individual incluso bajo carga sostenida en entornos paralelos a gran escala
- Todos los elementos, como la frecuencia de operación, la memoria y la arquitectura de I/O, están optimizados para soportar cargas de trabajo de IA paralelas en despliegues de racks de alta densidad
- La configuración de servidor de referencia de Arm es un diseño 1OU de 2 nodos, con 272 núcleos por blade (2 chips, con memoria dedicada e I/O)
- Un rack de 36 kW con refrigeración por aire puede alojar 30 blades (8,160 núcleos en total)
- Un diseño de 200 kW con refrigeración líquida desarrollado junto con Supermicro puede alojar 336 Arm AGI CPU (más de 45,000 núcleos en total)
- Esta configuración ofrece más del doble de rendimiento por rack frente a sistemas x86 actuales*
- El ancho de banda de memoria es alto, lo que permite mantener la eficiencia por hilo incluso bajo carga sostenida
- El rendimiento por hilo basado en los núcleos Neoverse V3 mejora, aumentando el procesamiento por hilo
Expansión inicial dentro del ecosistema de IA
- El Arm AGI CPU entra en la fase de despliegue comercial junto con socios principales
- Sus áreas de aplicación incluyen gestión de aceleradores, orquestación de agentes, densificación de servicios y aplicaciones, redes y expansión de cómputo para data plane
- Meta participa como socio líder, avanzando en la optimización de infraestructura a escala de gigavatios para la familia de apps de Meta y en la integración con el acelerador MTIA
- Entre los socios iniciales están Cerebras, Cloudflare, F5, OpenAI, Positron, Rebellions, SAP y SK Telecom
- Es posible pedir sistemas comerciales a través de ASRockRack, Lenovo y Supermicro
- Arm presentó el Arm AGI CPU 1OU Dual Node Reference Server, ofrecido en el factor de forma estándar DC-MHS del Open Compute Project (OCP)
- Planea aportar como código abierto el diseño del servidor, firmware, especificaciones de arquitectura del sistema, framework de depuración y herramientas de diagnóstico y validación
- Los detalles se darán a conocer en el OCP EMEA Summit
Un nuevo capítulo para la infraestructura de Arm
- El lanzamiento del Arm AGI CPU marca una nueva etapa en la estrategia de centros de datos de Arm
- Apunta a respaldar una base diversa de clientes, desde nubes hiperescalables hasta startups de IA
- El Arm AGI CPU es el primer modelo de la línea de productos de silicio para centros de datos de Arm y ya está disponible para pedido
- Los productos que seguirán se están desarrollando con el objetivo de alcanzar el más alto nivel en rendimiento, escalabilidad y eficiencia
- En paralelo con la hoja de ruta de Arm Neoverse CSS, la compañía busca que todos los clientes de centros de datos de Arm mantengan una arquitectura de plataforma común y compatibilidad de software
- Más de 50 empresas líderes respaldan la expansión del silicio de Arm y entran en una etapa de definir y construir directamente una arquitectura de centro de datos nativa para IA
Resumen de declaraciones de socios
-
Cerebras
- La escalabilidad y eficiencia del Arm AGI CPU cumplen un papel clave en la construcción de infraestructura de IA enfocada en inferencia a escala masiva
-
Cloudflare
- Adopta el Arm AGI CPU como infraestructura de cómputo de alto rendimiento y bajo consumo para escalar eficientemente en su red global
-
Meta
- Avanza en el desarrollo conjunto con Arm para mejorar la densidad de rendimiento en centros de datos y respaldar una hoja de ruta de sistemas de IA de múltiples generaciones
-
OpenAI
- Se espera que el Arm AGI CPU contribuya a fortalecer la capa de coordinación de cargas de trabajo de IA a gran escala y a mejorar la eficiencia del sistema y el ancho de banda
-
Positron
- Espera mejorar la eficiencia de rendimiento y costos del centro de datos al combinar tecnología de aceleración de inferencia con la eficiencia energética del Arm AGI CPU
-
Rebellions
- Ofrece una plataforma optimizada para cargas de inferencia a gran escala con una configuración de servidor de alta densidad que combina Arm AGI CPU y NPU
-
SAP
- Destaca la madurez de las cargas empresariales basadas en Arm y amplía el Arm AGI CPU como base para respaldar soluciones empresariales de IA de próxima generación
-
SK Telecom
- Está construyendo una infraestructura de centro de datos para inferencia de IA a gran escala que integra los aceleradores de IA de Rebellions con el Arm AGI CPU, con el objetivo de fortalecer su competitividad en AIDC
Avisos y descargos de responsabilidad
- Este documento incluye declaraciones prospectivas sobre la hoja de ruta de productos de Arm, rendimiento y planes de despliegue de socios
- Los resultados reales pueden variar según factores como la configuración del sistema y las cargas de trabajo
- Las cifras de rendimiento son estimaciones internas de Arm y se basan en una comparación a nivel de rack entre un servidor basado en Arm AGI CPU y un servidor x86 equivalente*
- Todos los nombres de productos y empresas son marcas comerciales o marcas registradas de sus respectivos propietarios
1 comentarios
Opiniones de Hacker News
El nombre de este CPU está casi al nivel de un fraude bursátil
Hoy en día, cuando se dice "AGI", la mayoría piensa en Artificial General Intelligence, pero Arm lo está usando como "Agentic AI Infrastructure"
Los inversionistas minoristas no van a notar la diferencia y van a comprar acciones de ARM, y Arm lo sabe. En la industria, a eso se le llama ‘mentir’
Como también se menciona en este artículo de PBS, el marketing siempre mezcla los términos de esta manera
A quien invierte sin verificar nada no lo puede proteger ninguna ley
Este marketing tan absurdo podría incluso hacer que la industria abandone la palabra ‘AGI’ y vuelva a la realidad
Agarrar términos existentes y empaquetarlos con un significado nuevo es un truco viejo
El “Personal Computer” de IBM, “Windows” de Microsoft e “Intel Core” también hicieron eso
(Por cierto, soy un pequeño inversionista de ARM)
Esto es simplemente Arm fabricando y vendiendo directamente CPUs Neoverse
No es un AI CPU. No es diferente de Graviton, Epyc o Xeon
Esto ya había quedado claro hace años en la demanda de Qualcomm vs Arm
Arm no planeaba limitarse a dar licencias, sino vender CPUs directamente, y aunque el CEO lo negó en ese momento, al final resultó ser cierto
También tengo esta publicación sobre el tema
Por eso parece que le pusieron el nombre para subirse a la moda de la IA
Pero los fabricantes de hardware se van a dar cuenta de esta fanfarronería. Al final, si no tiene precio competitivo, no se va a vender
Lo interesante es que Arm está sacando su primer producto de silicio propio en 35 años de historia
Ahora ARM va a competir cara a cara con sus clientes
Llegó el punto en que vender chips directamente da más ganancia que el negocio de licencias
AGI significa Agentic AI Infrastructure
Por si alguien estaba pensando en otra cosa
Considerando lo bien que ARM había diferenciado A, R y M en su marca, decepciona
Dicen que AGI (Agentic AI Infrastructure) se suma a la línea junto con CSS (Compute Subsystems)
Me pregunto quién pone estos nombres
El modo de vida básico del marketero parece ser el fraude
Esto es como ponerle a tu hijo World President Smith
Según este paper de la APA, los nombres sí influyen en la conducta
El apellido de mi agente inmobiliario también es ‘House’
Hoy en día todo es AGI
Ayer era Agentic, antier era AI
Ya mero vamos a ver papel higiénico AGI Agentic AI Crypto en el supermercado. Al lado seguro estará el atún UML Rational Rose
Arm ahora va a vender su propio CPU directamente
No entiendo qué significa “Built for rack-scale agentic efficiency”
Según la explicación de Arm, las futuras cargas de trabajo agentic van a cargar tanto CPU como GPU, así que la eficiencia del CPU importa
Ver este enlace de Wikipedia