La IA aprende la “magia negra” del diseño de RFIC

(spectrum.ieee.org)

1 puntos por GN⁺ 4 시간 전 | 1 comentarios | Compartir por WhatsApp

Los RFIC son la base de tecnologías inalámbricas como 5G, radar automotriz y comunicaciones satelitales, pero siguen siendo un problema difícil centrado en trabajo manual porque hay que ajustar al mismo tiempo electromagnetismo, temperatura y confiabilidad del empaquetado
Investigadores de Princeton no parten de plantillas de diseño humanas, sino que combinan aprendizaje por refuerzo y diseño inverso para explorar desde cero arquitecturas, topologías de circuitos, parámetros de dispositivos e interfaces electromagnéticas
Un emulador basado en IA predice en milisegundos los parámetros de dispersión de estructuras electromagnéticas bidimensionales arbitrarias, reduciendo drásticamente las iteraciones de minutos a horas de los solvers electromagnéticos tradicionales
En 2023, en un amplificador de potencia de ondas milimétricas de 30 a 100 GHz, obtuvo en ese momento la mejor combinación de ancho de banda, potencia de salida y eficiencia entre los amplificadores de potencia basados en silicio; en 2024 también generó estructuras de IC multiport en cuestión de minutos
La IA también puede crear circuitos que no funcionan, por lo que la validación requiere supervisión humana; para avanzar hacia modelos generales hace falta un ecosistema abierto que comparta datos de diseño de RFIC y analógico hoy sujetos a NDA

Por qué el diseño de RFIC sigue siendo “magia negra”

Los RFIC son circuitos clave que permiten a los dispositivos enviar y recibir información de forma inalámbrica, y los avances en vehículos autónomos, comunicaciones cuánticas, 6G y comunicaciones satelitales también dependen de chips RF más avanzados
El diseño de CPU o GPU se ha acercado más a una ciencia estandarizada, pero el diseño RF conserva un fuerte carácter de técnica basada en trabajo manual que se aprende con muchos años de experiencia
El diseño de RFIC abarca varias áreas físicas al mismo tiempo
- Las ecuaciones de Maxwell rigen cómo los campos electromagnéticos interactúan con dispositivos activos y pasivos
- La termodinámica determina cómo se genera y se elimina el calor durante la operación
- La expansión y contracción térmica se relacionan con la capacidad del chip y el paquete para mantenerse estables ante cambios de temperatura
Como hay que considerar juntas todas las restricciones físicas, el espacio de diseño es enorme, y al mejorar una métrica de rendimiento suelen aparecer trade-offs que empeoran otras métricas

Flujo tradicional de diseño de RFIC y cuellos de botella

Para diseñar un amplificador de potencia de 28 GHz para teléfonos 5G de ondas milimétricas, primero hay que definir la arquitectura y la topología del circuito
La arquitectura de un RFIC define los componentes necesarios y las rutas de señal, como el plano de una casa
- En un amplificador de potencia, la cantidad de etapas de amplificación se vuelve un factor importante
- La mayor parte del área de un RFIC la ocupan componentes pasivos y estructuras electromagnéticas, como inductores y líneas de transmisión, más que los transistores
Las señales 5G operan a 28 GHz y 39 GHz, las comunicaciones satelitales a 26.5~40 GHz o más, y el radar automotriz a 77 GHz; a esas altas frecuencias, los RFIC gestionan la energía de la señal mediante estructuras electromagnéticas precisas
Si la ruta de señal no encaja bien con el siguiente componente, aparece un problema de adaptación de impedancia, donde la energía no fluye hacia adelante sino que se refleja hacia atrás
- Los ingenieros diseñan pequeñas estructuras de transición entre componentes para reducir las reflexiones
- Estas estructuras pueden usarse no solo para transmitir señales, sino también para dividirlas, combinarlas y distribuirlas por múltiples rutas
Si no se cumplen las especificaciones, hay que corregir de nuevo la topología o la arquitectura y repetir las simulaciones; diseñar un chip nuevo puede requerir años y decenas a cientos de millones de dólares

Un enfoque de diseño con IA más allá de las plantillas

Investigaciones anteriores usaron machine learning para optimizar plantillas de circuitos, pero todavía dependían de bibliotecas de diseños existentes creadas por humanos
El objetivo de los investigadores de Princeton es que el algoritmo defina desde cero todos los parámetros de la arquitectura, los circuitos componentes y las estructuras electromagnéticas pasivas, sin una topología prefabricada
Este método parte de un punto distinto al de la optimización tradicional
- El enfoque tradicional ajusta parámetros como el tamaño de los transistores o la forma de los componentes pasivos dentro de estructuras creadas por humanos
- El nuevo enfoque crea combinaciones candidatas de circuitos desde un punto de partida casi vacío, mapea los trade-offs de rendimiento y explora el espacio de diseño
El enfoque desarrolla estrategias de diseño mediante exploración y evaluación propias, en vez de seguir ejemplos humanos, de forma similar a AlphaGo Zero
El algoritmo aprende circuitos, electromagnetismo y el codiseño entre ambos, con el objetivo de lograr diseño de RFIC end-to-end

Combinación de aprendizaje por refuerzo y diseño inverso

La primera etapa es un marco de aprendizaje por refuerzo, que define la arquitectura óptima del sistema, la topología del circuito, los parámetros de los dispositivos y las características de la interfaz electromagnética
El agente de aprendizaje por refuerzo prueba múltiples combinaciones como una computadora que aprende un juego, observa la relación entre acciones y puntajes, y va encontrando mejores circuitos
- El entrenamiento toma desde varios días hasta una semana
- Una vez terminado el entrenamiento, puede diseñar circuitos muy rápidamente
La segunda etapa es el diseño inverso, que busca una estructura electromagnética física que produzca los parámetros de dispersión deseados
- Los parámetros de dispersión miden si una señal avanza o se refleja hacia atrás al entrar en un componente
- Es similar a buscar arcos o estructuras de soporte en ingeniería estructural para crear el espacio objetivo
El diseño inverso de RFIC debe ajustar al mismo tiempo el funcionamiento del circuito y la respuesta electromagnética de interconexiones y componentes pasivos, por lo que es difícil resolverlo solo con exploración manual iterativa

Las iteraciones de diseño electromagnético que redujo el emulador de IA

Los investigadores reemplazaron el simulador de circuitos RF por un emulador basado en IA
Este modelo recibe como entrada una estructura bidimensional arbitraria y predice sus parámetros de dispersión sin calcular directamente las ecuaciones de Maxwell
- Reduce a milisegundos tareas que antes tomaban de minutos a horas con solvers electromagnéticos tradicionales
El emulador se construyó sobre una red neuronal convolucional, fuerte en procesamiento de imágenes
- Las imágenes de estructuras contienen información espacial que permite predecir el rendimiento electromagnético
- Los investigadores entrenaron el modelo con numerosas estructuras de píxeles aleatorias etiquetadas con parámetros de dispersión
Al combinar diseño inverso basado en aprendizaje por refuerzo con el emulador de IA, construyeron un diseñador de IA end-to-end y lo aplicaron al diseño de amplificadores de potencia

Resultados de arquitecturas RF distintas a las humanas

La prueba de concepto publicada en 2023 se enfocó en amplificadores de potencia para la banda de ondas milimétricas de 30 a 100 GHz
- Ese rango cubre la mayoría de las frecuencias relevantes de 5G y radar
- El diseño final tuvo en ese momento la mejor combinación de wide bandwidth, output power y efficiency entre los amplificadores de potencia basados en silicio, y mantuvo una record efficiency
Las rutas electromagnéticas generadas, a diferencia de las estructuras regulares y simétricas que suelen considerar los humanos, parecían patrones arbitrarios o códigos QR
Este resultado muestra que no hay garantía de que las plantillas usadas históricamente estén cerca de ser óptimas para los objetivos de diseño modernos
Después, los investigadores ampliaron el modelo a estructuras con muchos puertos de entrada y salida
- Dos puertos implican 4 parámetros de dispersión; 4 puertos implican 16, por lo que la complejidad crece rápidamente
- En un estudio de 2024 sobre multiport integrated circuits, demostraron que el algoritmo de IA también puede manejar estructuras multiport
- Antes, una simulación electromagnética multiport requería días o semanas, pero este modelo evoluciona nuevas estructuras en cuestión de minutos
Al combinar el marco de aprendizaje por refuerzo con diseño inverso, mostraron un flujo que va desde las especificaciones hasta un fabrication-ready layout, y lo aplicaron a amplificadores de bajo ruido, subterahertz y power amplifiers broadband

Diseño con IA interpretable

Las pruebas y la depuración de RFIC pueden tomar tanto tiempo como el diseño, o ser incluso más difíciles, por lo que los ingenieros prefieren estructuras interpretables que puedan entender y corregir cuando aparece un problema
Los investigadores aplicaron al diseño de estructuras RFIC los diffusion models usados en IA generativa de imágenes
En vez de prompts de texto, usan parámetros de dispersión como entrada y generan como salida la estructura electromagnética del RFIC
Al incluir un dial de frecuencia espacial en la entrada, permitieron que el diseñador controle la forma de la estructura resultante
- Frecuencia espacial baja: formas clásicas e interpretables
- Frecuencia espacial media: estructuras similares a laberintos
- Frecuencia espacial alta: estructuras pixeladas o cercanas a formas arbitrarias
Todo el proceso, del prompt a la salida, toma alrededor de 6 minutos, y si los parámetros de dispersión son físicamente realizables bajo las ecuaciones de Maxwell, puede generar la estructura correspondiente

Límites pendientes y desafíos de datos

Los métodos de diseño basados en IA despertaron interés en la comunidad RF y empezaron a invertir el flujo tradicional de diseño bottom-up
Todavía quedan preguntas sin resolver
- Qué tanto puede generalizarse el método
- Si puede ofrecer rendimiento alto de forma constante
- Si puede optimizar de manera integral todos los trade-offs posibles
- Si puede inventar, más allá de los RFIC, otros circuitos que los humanos nunca hayan creado
La IA puede tener hallucinations y generar malos circuitos que no funcionan, por lo que la validación sigue requiriendo supervisión humana
Para crear un foundational model de propósito general se necesitan datos a gran escala que permitan aprender las leyes que gobiernan el electromagnetismo y el comportamiento de los circuitos
- ImageNet, con 14 millones de imágenes diversas y etiquetadas por humanos, es un caso que permitió la generalización de modelos de reconocimiento de imágenes
- En diseño RFIC y analógico también se necesitan datos de escala y diversidad similares
Gran parte de los datos existe en simulaciones de empresas y laboratorios de todo el mundo, pero la mayoría está atada a NDA
Natcast operaba el programa de I+D de la U.S. CHIPS and Science Act y podía fortalecer la infraestructura compartida y la innovación para tecnologías inalámbricas, de sensado y defensa de próxima generación, pero la organización y el programa relacionado con machine learning y RFIC fueron cerrados
Si el campo de RFIC amplía la colaboración entre investigadores de IA y diseñadores de chips y crea un ecosistema abierto, podrá aprovechar mucho más el potencial del diseño de IC basado en IA

1 comentarios

GN⁺ 4 시간 전

Opiniones de Hacker News

Me recuerda a las antiguas búsquedas con algoritmos genéticos. El enfoque de adivinar y verificar puede ser bastante potente, sobre todo si se puede incorporar la guía de un agente en el proceso.
https://en.wikipedia.org/wiki/Evolved_antenna
- Iba a comentar algo parecido. Recuerdo una anécdota sobre cómo se creó con un algoritmo genético un oscilador con la mínima cantidad de componentes; al final tuvo éxito con un solo cable, lo que sorprendió a la gente. Es decir, en realidad era una antena que captaba RF ruidosa cercana.
- También está esto: https://en.wikipedia.org/wiki/Evolvable_hardware
  Como punto de partida: https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
Me pregunto si la expectativa común de que una teoría verdadera debe ser de algún modo bella y elegante sobrevivirá otro siglo. ¿Y si los fenómenos naturales reales, en el fondo, se explican mejor como un montón de ecuaciones terriblemente desordenadas que solo las máquinas pueden manejar y razonar? Sería bastante triste.
- Creo que eso de “expectativa común” es un poco exagerado. La mayoría de la gente entiende las teorías científicas como aproximaciones. F=ma solo es válido dentro del marco de la mecánica newtoniana, y cada término viene con muchísimas salvedades, así que las mediciones reales siempre son solo aproximaciones.
  El chiste de que los físicos asumen una “vaca perfectamente esférica” va en ese sentido, y de hecho el núcleo del ensayo sobre “la irrazonable efectividad de las matemáticas” está cerca de eso: lo irracionalmente sorprendente es que las aproximaciones matemáticas describan el mundo tan bien.
- Pienso esto a menudo al ver la medicina y el cuerpo humano. Queremos creer que el cuerpo es una máquina milagrosamente bien aceitada, pero en realidad muchas veces parece una bolsa desastrosa que apenas se mantiene unida.
- Últimamente también pienso mucho en esto. Sobre todo al ver que están apareciendo muchas demostraciones verificables por máquina que son difíciles de entender.
  La navaja de Ockham es una heurística útil, pero también nos sesga hacia explicaciones más simples.
- A mí me parecería realmente genial. En el nivel más bajo, ya sabemos que todo es una nube de probabilidades. También hay belleza y consuelo en que nada pueda quedar determinado para siempre.
- Creo que lo de “expectativa común” no da en el blanco. No significa que una teoría fundamental deba ser simple o elegante, sino más bien que, si hay que elegir entre una teoría más compleja y una más simple, por lo general la teoría más simple es la opción más correcta. Las ecuaciones de la física cuántica también son bastante feas.
Un gran uso del diseño con IA es la contaminación de patentes. Se pueden generar con IA grandes cantidades de variantes de diseño, publicarlas en un sitio web y, si más tarde aparece una patente, usar las partes que se superpongan para invalidarla o al menos reducir su alcance. La generalización de una patente queda limitada por el estado de la técnica.
- Me recuerda a la respuesta performática del abogado Damien Riehl durante el fallo de infracción de Sam Smith en 2019/2020. Él, junto con el programador Noah Rubin, afirmó haber generado algorítmicamente en formato MIDI todas las melodías posibles dentro de cierto espacio combinatorio y haberlas publicado bajo licencia CC-0 [0].
  Después explicó su razonamiento en un evento TEDx local y recibió cierta atención [1]; recuerdo que los comentaristas legales fueron más bien escépticos, diciendo que los jueces distinguen de forma rutinaria diferencias mucho más sutiles que eso. Aun así, fue un intento simpático.
  [0] https://allthemusic.info/
  [1] https://m.youtube.com/watch?v=sJtm0MoOgiU and
  https://www.the-independent.com/tech/music-copyright-algorit...
Es un poco frustrante. La IA puede hacer muchas cosas, pero al seguir mezclando LLM con Monte Carlo, algoritmos genéticos, sistemas expertos y otras formas tradicionales de machine learning y magia estadística, se están agrupando de forma demasiado agresiva actividades de machine learning ya establecidas y moralmente neutras con las preocupaciones sobre los LLM y Stable Diffusion.
Y también se me ocurre que quizá esa sea la intención.
- El problema es que la gente dice que la IA puede hacer algo e insinúa como si un LLM pudiera hacerlo. Así parece que un LLM puro puede hacer casi cualquier cosa. A la inversa, también dicen que la IA jamás podrá hacer X solo porque los LLM no son naturalmente buenos en cierta tarea. La palabra IA se volvió tan ambigua que perdió utilidad.
- Me gustaría agitar una varita mágica y eliminar la propia palabra IA. No tiene un significado real. Puede referirse a cualquier cosa, desde los personajes rivales de Mario Kart hasta Stable Diffusion.
- “IA” es un término maldito por sus connotaciones geniales de ciencia ficción. Por eso es potente como término de marketing. Mucha gente está familiarizada con la IA de la ciencia ficción, y la creencia de que “tal medio predijo tal tecnología” también está bastante extendida para X como Star Trek, Guía del autoestopista galáctico o Arthur C. Clarke, y Y como internet, teléfonos móviles o VR.
  Cuando quieres decir que hubo un gran avance en algo, conectarlo con la comprensión popular-científica de que la ciencia ficción predice los logros humanos es una vía de poco esfuerzo y mucho impacto. Si la prioridad número uno es entusiasmar a la gente, no se trata de comunicar con precisión.
- Por eso estoy practicando llamar ML al machine learning tradicional y LLM a los modelos de lenguaje grandes. Intento ya no usar la palabra IA en lo posible. Es demasiado ambigua. Incluso cuando hablo de IA en juegos, trato de usar la abreviatura del algoritmo que parece estar usando esa IA. A menudo lo describo como un diagrama de flujo, aunque no estoy seguro de que por dentro sea necesariamente uno.
- Así como durante el invierno de la IA los campos más exitosos del machine learning se distanciaron de ese término, ahora que llegó el verano de la IA probablemente veremos que vuelven a adoptarlo, y quizá ya esté pasando.
La frase “los humanos ni siquiera podían imaginarlo” parece exagerada. Aun así, parece totalmente posible que los algoritmos de aprendizaje automático puedan llegar, mediante búsqueda por fuerza bruta, a diseños de chips que nadie había intentado, y que algunos de ellos nos resulten útiles. Es algo bastante razonable para que lo haga una computadora.
- Es palabrería de marketing. Por un lado, es como demostrar una negativa: no se puede demostrar que los humanos no podían imaginarlo. En segundo lugar, los humanos ya hemos imaginado un montón de cosas rarísimas.
- Suena como un pastel de capas de aprendizaje automático con migajas de búsqueda por fuerza bruta encima.
Una cosa que se puede sacar del artículo es que, para lograr estos avances, tuvieron que desechar los bloques básicos ya probados del diseño de chips. Me pregunto si lo mismo aplicará a la programación común. ¿Será que las innovaciones sorprendentes en coding con AI en realidad están frenadas por Rust y Python? ¿Deberíamos dejar que las herramientas de AI simplemente programen al nivel más bajo posible?
- Es una pregunta interesante, pero parece tener implicaciones bastante preocupantes para la portabilidad.
Me recordó a este artículo viejo: https://www.damninteresting.com/on-the-origin-of-circuits/
Una de esas pequeñas joyas que encontré en internet.
- Yo también iba a publicarlo. Me alegra ver que otros también lo disfrutan, porque cuando lo leí por primera vez me impactó muchísimo.
  En otro comentario cercano se hablaba de la robustez de los diseños desarrollados en laboratorio, y una de las partes más interesantes del artículo de Damn Interesting era que el programa evolucionado no podía separarse de la única FPGA física que se usó para entrenarlo. Este modelo de aprendizaje para RFIC usa un simulador, así que me pregunto si las características del hardware físico donde corre el simulador quedan lo bastante aisladas del aprendizaje como para que los diseños se comporten de forma similar al ejecutar el simulador en hardware distinto.
  La pregunta más obvia es si hay alguna esperanza de que un diseño evolucionado en el simulador funcione como se espera en hardware físico real. Mi intuición sobre eso último es que no, pero aun así parece una investigación interesante, y a menudo pienso que entender bien qué ocurrió realmente en la FPGA quizá sea un requisito previo para abordar de verdad el aprendizaje por refuerzo.
  Me alegra que hayas compartido ese artículo; si tienes otros favoritos relacionados con esta área, me gustaría que los enviaras.
- También es un ejemplo de una especie que se volvió tan especializada y optimizada que ya no puede adaptarse. También es un ejemplo de POSIWID.
La gran pregunta es qué tan robustos son estos diseños.
El paper sí muestra que las mediciones de los dispositivos reales coinciden bien con las predicciones, pero no encontré una parte del texto que trate esto de forma explícita. Además, algunos de los sistemas presentados incluyen subbloques diseñados de manera tradicional, así que esos podrían estar asumiendo parte del trabajo.
Tal vez solo lo estoy viendo con mala cara porque parece que viene por mi empleo, o tal vez quieren que pensemos eso.
En la práctica, creo que lo que gana son las ideas simples que pueden resistir variaciones de fabricación y del entorno, además de límites del modelo. Cosas como feedback o simetría. Pero lo que se muestra aquí parece casi lo contrario. He hecho optimización a ciegas de parámetros de circuitos algunas veces, y al final, cuando te das cuenta de una idea simple que se te había escapado, como “aquí hace falta simetría” o “aquí hace falta más ancho de banda”, todo cobra completo sentido. Por eso me pregunto si, al ajustar apenas unos píxeles de esta estructura, no aparecería algo más simple.
Y, obligatoriamente, también hay que mencionar la “antena genética”.
- Justo esto es lo que me incomoda de este artículo y de varios artículos similares anteriores. No incluye evidencia de que la AI sea útil en el diseño.
  Según el texto, el papel de la AI es reemplazar al simulador electromagnético durante el proceso de optimización para estimar el comportamiento de la estructura, y supuestamente es varios órdenes de magnitud más rápida que la simulación.
  Suena plausible, pero para creerlo me gustaría ver la diferencia entre las estimaciones de la AI y las mediciones reales para geometrías muy distintas de las usadas en el entrenamiento de la AI. También habría que ver contra qué simulador exactamente se comparó la velocidad del modelo de AI.
  En campos electromagnéticos y circuitos electrónicos hay varios enfoques de simulación que intercambian precisión por velocidad. Por eso no estoy seguro de que la inferencia de AI necesariamente consuma mucho menos tiempo que una simulación de baja precisión más rápida. Esa simulación también podría ser más precisa y confiable que la estimación de la AI.
- Yo también venía a mencionar la antena genética.
  Como ya lo dijeron antes, agregaría algo relacionado con eso de “darse cuenta de una idea bastante simple”: creo que una de las grandes ventajas de este tipo de diseño asistido por computadora es la “innovization”[1]. Es un término algo torpe, pero la idea central es que estos sistemas pueden llevar a una comprensión más profunda de un proceso determinado. Cuando lo experimentas en la práctica, se siente bastante divertido.
  [1]: https://dl.acm.org/doi/10.1145/1143997.1144266
- Es simplemente un artículo basura inflado con hype.
Los métodos descritos en este artículo no son nuevos. Desde hace décadas, los científicos diseñan con algoritmos genéticos antenas que nadie entiende, pero que funcionan bien.
No es algo tan mágico. Como dice el artículo, el diseño de RFIC va mucho más allá de la ingeniería RF normal: se acerca más a la magia negra, depende mucho del conocimiento y la experiencia del diseñador, y se apoya en herramientas de modelado y diseño que hace unas décadas habrían sido de nivel supercomputadora.
Lo que puede hacer la AI es explorar en anchura todos los resultados posibles y luego elegir el de mejor desempeño. Es distinto a la forma en que una persona dice: “este camino se ve prometedor, profundicemos ahí”.
- ¿Tiene que ser mágico para ser interesante o útil?

La IA aprende la “magia negra” del diseño de RFIC

Por qué el diseño de RFIC sigue siendo “magia negra”

Flujo tradicional de diseño de RFIC y cuellos de botella

Un enfoque de diseño con IA más allá de las plantillas

Combinación de aprendizaje por refuerzo y diseño inverso

Las iteraciones de diseño electromagnético que redujo el emulador de IA

Resultados de arquitecturas RF distintas a las humanas

Diseño con IA interpretable

Límites pendientes y desafíos de datos

Lecturas relacionadas

1 comentarios

Opiniones de Hacker News