- En 2020 publicamos un preprint que presentaba un nuevo método de aprendizaje por refuerzo para diseñar layouts de chips
- Más tarde, este método fue publicado en Nature y se ofreció como código abierto
- Hoy publicamos un addendum en Nature que explica en detalle este método y el impacto que ha tenido en el campo del diseño de chips
- También publicamos checkpoints preentrenados, compartimos los pesos del modelo y presentamos el nombre AlphaChip
- Los chips de computadora han impulsado los sorprendentes avances de la inteligencia artificial (IA), y AlphaChip usa IA para acelerar y optimizar el diseño de chips
- Este método se ha usado para diseñar layouts de chips sobrehumanos en las 3 generaciones más recientes de la Tensor Processing Unit (TPU), el acelerador de IA personalizado de Google
- AlphaChip es uno de los primeros enfoques de aprendizaje por refuerzo usados para resolver un problema real de ingeniería
- En lugar de requerir semanas o meses de trabajo humano, genera layouts de chips sobrehumanos o comparables en cuestión de horas, y estos layouts se usan en distintos chips, desde centros de datos en todo el mundo hasta teléfonos móviles
Cómo funciona AlphaChip
- Diseñar el layout de un chip no es una tarea simple
- Los chips de computadora están compuestos por muchos bloques interconectados, conectados tanto por jerarquías de componentes de circuito como por cables muy delgados
- Además, hay muchas restricciones de diseño complejas y entrelazadas que deben cumplirse al mismo tiempo
- Debido a esa complejidad, los diseñadores de chips han tenido dificultades durante más de 60 años para automatizar el proceso de floorplanning de chips
- Al igual que AlphaGo y AlphaZero, construimos AlphaChip para que abordara el floorplanning de chips como si fuera una especie de juego
- Empezando desde una cuadrícula vacía, AlphaChip coloca un componente del circuito a la vez y repite esto hasta completar la colocación de todos los componentes
- Luego recibe una recompensa según la calidad del layout final
- Mediante una nueva red neuronal de grafos “basada en aristas”, AlphaChip puede aprender las relaciones entre componentes interconectados del chip y generalizar a lo largo del chip, lo que le permite mejorar con cada layout que diseña
Diseñando con IA los chips aceleradores de IA de Google
- Desde su presentación en 2020, AlphaChip ha generado layouts de chips sobrehumanos usados en todas las generaciones de TPU de Google
- Estos chips hacen posibles grandes modelos de IA basados en la arquitectura Transformer de Google
- Las TPU están en el corazón de potentes sistemas de IA generativa, desde grandes modelos de lenguaje como Gemini hasta generadores de imagen y video como Imagen y Veo
- Estos aceleradores de IA también son centrales para los servicios de IA de Google y se ofrecen a usuarios externos a través de Google Cloud
- Para diseñar layouts de TPU, AlphaChip primero practica con varios bloques de chips de generaciones anteriores, como bloques de red dentro del chip y entre chips, controladores de memoria y búferes de transferencia de datos (a esto se le llama preentrenamiento)
- Luego se ejecuta AlphaChip sobre los bloques de la TPU actual para generar layouts de alta calidad
- A diferencia de enfoques anteriores, AlphaChip mejora y se vuelve más rápido cuanto más instancias de tareas de colocación de chips resuelve, de manera similar a un experto humano
- En cada nueva generación de TPU, incluida la más reciente Trillium (sexta generación), AlphaChip ha diseñado mejores layouts de chips y cubierto una mayor parte del floorplan completo, acelerando el ciclo de diseño y produciendo chips de mayor rendimiento
El amplio impacto de AlphaChip
- El impacto de AlphaChip puede verse en aplicaciones en Alphabet, en la comunidad de investigación y en toda la industria del diseño de chips
- Más allá del diseño de aceleradores de IA especializados como las TPU, AlphaChip ha generado layouts para otros chips dentro de Alphabet, como el procesador Axion, el primer CPU de propósito general para centros de datos basado en Arm de Google
- Organizaciones externas también han adoptado AlphaChip y están construyendo sobre él (por ejemplo: MediaTek, una de las principales compañías de diseño de chips del mundo, amplió AlphaChip para mejorar potencia, rendimiento y área del chip, al mismo tiempo que aceleraba el desarrollo de sus chips más avanzados, como Dimensity Flagship 5G usado en teléfonos Samsung)
- AlphaChip desató una explosión de trabajo en IA para diseño de chips y se ha extendido a otras etapas importantes del diseño de chips, como la síntesis lógica y la selección de macros
Creando los chips del futuro
- Creemos que AlphaChip tiene el potencial de optimizar todas las etapas del ciclo de diseño de chips, desde la arquitectura computacional hasta la fabricación
- Puede revolucionar el diseño de chips para hardware personalizado presente en dispositivos cotidianos como smartphones, equipos médicos y sensores agrícolas
- Ya se están desarrollando futuras versiones de AlphaChip, y esperamos seguir innovando en este campo y colaborar con la comunidad para construir un futuro en el que los chips sean más rápidos, más baratos y más eficientes energéticamente
Opinión de GN⁺
- El enfoque basado en IA de AlphaChip está revolucionando el campo del diseño de chips. En particular, ha logrado grandes avances en la automatización del proceso de diseño de layouts de chips
- AlphaChip es uno de los primeros casos de aplicación del aprendizaje por refuerzo a un problema real de ingeniería, y es un buen ejemplo de cómo la IA puede usarse en el mundo real
- El impacto de AlphaChip en el diseño de TPU será un hito importante en el avance del hardware acelerador de IA. Mejores aceleradores de IA permitirán modelos de IA más potentes, lo que a su vez acelerará aún más el avance de la IA
- Sin embargo, depender en exceso de herramientas de diseño con IA podría llevar a la pérdida de experiencia de los diseñadores humanos. A largo plazo, la colaboración entre IA y expertos humanos será lo más deseable
- Herramientas de diseño similares basadas en IA incluyen Cerebrus de Cadence y DSO.ai de Synopsys. Parece que la competencia entre herramientas de automatización de diseño basadas en IA se intensificará en el futuro
1 comentarios
Opiniones de Hacker News