La memoria ya representa casi dos tercios del costo de los componentes de los chips de IA
(epoch.ai)- HBM subió de 52% en el 1er trimestre de 2024 a 63% en el 4º trimestre de 2025, según el promedio ponderado por volumen de producción de los chips de IA de Nvidia, AMD, Google y Amazon
- En el mismo periodo, la proporción de los logic dies se mantuvo casi sin cambios en alrededor de 13%, mientras que el empaquetado avanzado bajó de 19% a 15% y los componentes auxiliares de 15% a 9%
- El gasto en HBM de las cuatro empresas de diseño aumentó de unos 12 mil millones de dólares en 2024 a 32 mil millones de dólares en 2025, creciendo interanualmente más rápido que otros componentes
- El gasto total en componentes de chips de IA aumentó de unos 22 mil millones de dólares a 52 mil millones de dólares, y solo HBM explicó alrededor de 20 mil millones de dólares del incremento
- En 2026, la presión de costos podría aumentar aún más por la escasez de memoria y el alza de precios, y Microsoft y Meta también señalaron el aumento en los precios de componentes como un factor detrás del mayor gasto de capital
Cambios clave
- La participación de la memoria de alto ancho de banda (HBM) en el gasto de componentes de chips de IA subió de 52% en el 1er trimestre de 2024 a 63% en el 4º trimestre de 2025
- Esta estimación es un promedio ponderado por volumen de producción para todos los chips de IA diseñados por Nvidia, AMD, Google y Amazon
- En el mismo periodo, los logic dies se mantuvieron casi sin cambios en alrededor de 13%, mientras que el empaquetado avanzado cayó de 19% a 15% y los componentes auxiliares de 15% a 9%
- El gasto en HBM de las cuatro empresas de diseño aumentó de unos 12 mil millones de dólares en 2024 a 32 mil millones de dólares en 2025, con un crecimiento interanual más rápido que el de otros componentes
- El gasto total en componentes de chips de IA pasó de unos 22 mil millones de dólares en 2024 a alrededor de 52 mil millones de dólares en 2025, y el gasto en HBM por sí solo representó cerca de 20 mil millones de dólares del aumento
Presión de costos en 2026
- HBM podría representar una porción aún mayor de los costos en 2026, a medida que continúan la escasez de suministro de memoria y el aumento de precios
- La proyección de 190 mil millones de dólares en gasto de capital para el año fiscal 2026 de Microsoft incluye alrededor de 25 mil millones de dólares por aumentos en precios de componentes
- Meta elevó en 10 mil millones de dólares su rango de gasto de capital para 2026 y citó precios más altos de componentes como motivo
Método de cálculo y alcance de los datos
- Para cada chip de IA diseñado por Nvidia, AMD, Google y Amazon, se estimó el costo por chip de memoria, logic die, empaquetado avanzado y componentes auxiliares
- Al multiplicar el costo de componentes de cada chip por el volumen de producción trimestral estimado, se calculó el gasto total por categoría y se obtuvo su proporción frente al gasto total en componentes entre el 1er trimestre de 2024 y el 4º trimestre de 2025
- Las estimaciones de costo de componentes provienen de AI Chip Components explorer y construyen una especificación de componentes por chip con base en reportes financieros, materiales de proveedores e informes de analistas
- La metodología detallada puede consultarse en la documentación metodológica del explorer
Categorías de componentes
-
Memoria
- Incluye stacks HBM, con HBM3 y HBM3e
-
Lógica
- Incluye logic dies de procesos avanzados de 3 a 5 nm
-
Empaquetado
- Incluye el empaquetado avanzado CoWoS de TSMC
-
Componentes auxiliares
- Incluye sustratos, suministro de energía y otros insumos no lógicos ni de memoria
Tratamiento de la incertidumbre
- Existen incertidumbres de costo en los costos unitarios de cada componente, como el precio de los stacks HBM, el de los logic dies y el de los paquetes CoWoS
- El costo por componente de cada chip se modeló con un intervalo de confianza del 90%
- La participación de cada componente es el costo de ese componente dividido entre el costo total, por lo que tanto el numerador como el denominador son inciertos
- Se presentan dos tipos de rangos
- Rango donde solo cambia el costo de ese componente: la participación cuando ese componente está en el percentil 5 o 95 y los otros tres componentes están en la mediana
- Rango donde todos los componentes cambian a valores extremos: la participación cuando ese componente está en un extremo del intervalo de confianza y todos los demás están simultáneamente en el extremo opuesto
Participación trimestral de componentes
-
1er trimestre de 2024
- La participación de memoria fue de 52%, con un rango de 48~56% cuando solo cambiaba el costo de ese componente, y de 42~62% cuando todos los componentes variaban a valores extremos
- La participación de lógica fue de 14%, con un rango de 12~17% cuando solo cambiaba el costo de ese componente, y de 10~20% cuando todos los componentes variaban a valores extremos
- La participación de empaquetado fue de 19%, con un rango de 14~24% cuando solo cambiaba el costo de ese componente, y de 12~27% cuando todos los componentes variaban a valores extremos
- La participación de componentes auxiliares fue de 15%, con un rango de 13~18% cuando solo cambiaba el costo de ese componente, y de 11~21% cuando todos los componentes variaban a valores extremos
-
4º trimestre de 2025
- La participación de memoria fue de 63%, con un rango de 60~67% cuando solo cambiaba el costo de ese componente, y de 54~73% cuando todos los componentes variaban a valores extremos
- La participación de lógica fue de 13%, con un rango de 10~16% cuando solo cambiaba el costo de ese componente, y de 9~19% cuando todos los componentes variaban a valores extremos
- La participación de empaquetado fue de 15%, con un rango de 11~19% cuando solo cambiaba el costo de ese componente, y de 9~22% cuando todos los componentes variaban a valores extremos
- La participación de componentes auxiliares fue de 10%, con un rango de 8~10% cuando solo cambiaba el costo de ese componente, y de 7~12% cuando todos los componentes variaban a valores extremos
Supuestos y limitaciones
- Los costos de componentes pueden variar según contrato, proveedor y momento, por lo que existe incertidumbre en las estimaciones de costo por chip
- También existe incertidumbre en las estimaciones del volumen trimestral de producción de chips y en la composición por tipos de chip, y esa incertidumbre se refleja en las proporciones reportadas
Datos y herramienta de exploración
- AI chip component cost shares by quarter: CSV, actualizado el 21 de mayo de 2026
- AI Chip Components: herramienta para explorar datos de consumo en la cadena de suministro de chips de IA
1 comentarios
Comentarios de Hacker News
Parece que para la inferencia y el entrenamiento de IA hay una ruta para reducir los costos de hardware en unas 3 veces y los costos totales en unas 2 veces, incluso sin ninguna innovación tecnológica
Solo hace falta que la oferta de DRAM alcance la demanda; ya sea expandiendo la fabricación o cubriendo el aumento de la demanda con el ritmo actual de producción, es solo cuestión de tiempo
Hay mucho que criticar de las cosas que Sam Altman ha difundido culturalmente, pero a largo plazo, la frase “ahora es lo peor que va a ser” me parece un punto bastante interesante y subestimado
En 10 años, entrenar LLM del nivel actual probablemente será una suposición tan básica como operar bases de datos hoy. El nivel actual ya es bastante avanzado, y aun aparte del progreso del hardware, creo que hay mucho margen de mejora adicional con solo construir mejores esquemas de entrenamiento con aprendizaje por refuerzo
Recomiendo mucho revisar los proyectos de GitHub y HF del Allen Institute. Hay materiales open source para entrenar LLM desde cero con Common Crawl y ajustes interesantes de qwen, así que se puede probar cómo podrían verse pronto los proyectos de una tarde o los materiales educativos
Esta industria tiende a mantener el mercado en escasez de oferta, porque si no, el exceso de oferta posterior termina dañando a las empresas. En su lugar, la oferta de áreas menos rentables, como móvil y computación personal, simplemente se reasignará hacia los segmentos más rentables
El punto flotante IEEE es notoriamente malo en anchos de bit bajos, especialmente en 16 bits o menos. Formatos como posit son mucho mejores en 16 bits u 8 bits. Si se pudiera entrenar con 16 bits por valor en vez de 32, y la pérdida de precisión fuera mucho menor que al pasar de IEEE32 a IEEE16, sería bastante importante
Hace unos años compré 96 GB de RAM por unos 250 dólares, y ahora esa misma RAM cuesta 1200 dólares
Ahora en Amazon ese mismo kit cuesta 1,048.90 dólares
Los módulos de memoria enterprise usados estaban regalados en eBay
Ahora están como en 22 dólares por módulo, así que serían unos 350 dólares en total. No tengo idea de quién está haciendo qué con DDR3
El valor de SSD ultrarrápidos como Optane podría volverse mucho mayor
En todo lo que leo, parece que la capacidad de RAM aumentará alrededor de 20~25% al año, pero no parece suficiente
Incluso para uso de consumo, los teléfonos y laptops mejorarían mucho si duplicaran la RAM, y ni hablar de la enorme demanda de IA
No parece que esta tendencia vaya a desaparecer. Tal vez no crezca tan rápido como ahora, pero tampoco va a irse. Entiendo por qué las empresas de memoria no quieren llevarse a sí mismas a la quiebra, pero debería haber alguna manera de trasladar ese riesgo a los proveedores de modelos u otros participantes del ecosistema para aumentar la capacidad de RAM cerca de 50% al año
En un mercado competitivo, es ineficiente que los fabricantes de RAM dejen compradores sin venderles
No sé cuál era realmente la tasa de crecimiento antes de octubre, pero seguro alguien aquí la conoce
Sobre que un crecimiento de 20~25% no basta, tampoco me parece una cifra tan descabellada si se asume que los planes de expansión de centros de datos chocan con un muro, se desaceleran fuerte y se enfría el entusiasmo por la IA
A corto plazo, puede que 20~25% no sea suficiente, pero si la expansión de IA se detiene este año, en vez de escasez habría un exceso de oferta enorme
Porque permitiría a los proveedores de DRAM cubrir ese riesgo
¿Y si para todos fuera mejor comprar computadoras, por ejemplo, a 1/3 de velocidad y cambiar todo a HBM?
La brecha entre cómputo y memoria lleva mucho tiempo creciendo, y quizá cambiar a HBM, aunque sea doloroso, sea justo lo que hace falta
¿Es mejor tener 3 computadoras de gama media con poco ancho de banda de memoria, o esperar un poco más estadísticamente para que todos compren computadoras nuevas a 1/3 de velocidad en proporción de área pero con mucho más ancho de banda?
Viendo la tendencia actual, de verdad me pregunto cómo se va a sostener el mercado de consumo para cosas como gaming o machine learning
El gaming en la nube claramente llegará en el futuro, y probablemente solo puristas como yo comprarán una RTX 5090 y pagarán un premium por jugar offline
Porque es económicamente más eficiente amortizar entre varios consumidores el costo del hardware necesario para renderizar gráficos, no dejarlo ocioso cuando no se usa y desplegarlo en POP junto con los assets del juego
Si suficiente cómputo para juegos corre en el edge, también se vuelven posibles juegos más avanzados técnicamente que hoy no son viables económicamente. Creo que no vemos muchos juegos así ahora porque todavía faltan mercado y adopción de cloud gaming, y por lo tanto también falta know-how técnico
En el momento en que sea demasiado caro asumir el costo de renderizar con hardware de consumo los juegos que la gente quiere, al final incluso quienes se resistían serán convencidos y este modelo podría consolidarse
No me voy a mover de una build con DDR4 hasta que los precios vuelvan al menos parcialmente a la normalidad
Todavía tengo 32 GB de memoria DDR4 2133MHz de respaldo que compré antes, y ahora uso 3200MHz. Eso significa que los fabricantes de CPU tampoco van a recibir mi dinero. El 5800X me alcanza por bastante tiempo, y tampoco tengo motivo para comprar un GPU nuevo. Claro, el B580 no es perfecto
Es muy irónico que Irán haya bloqueado el suministro de helio
Al mismo tiempo, Irán depende de propaganda barata generada por IA para sacudir a sus enemigos. Parece una de esas ironías que la historia revela tarde
Para los gamers y aficionados a la PC que no están completamente metidos en IA, este es un momento realmente horrible
Cuando empecé a armar PCs para gaming, la tarjeta gráfica tope de gama costaba 750 dólares neozelandeses. Ahora solo el GPU cuesta 10,000 dólares y además hay que sumarle otros 1,000~2,000 dólares de RAM
Antes una PC gamer era un hobby accesible, pero ahora hasta la aviación general parece una alternativa razonable
A corto plazo sí, el segmento aficionado está bajo presión, pero el capital necesario para empujar la frontera no es tan grande comparado con el de las Fortune 500. Pronto los aficionados también verán beneficios, y especialmente si el mercado colapsa
Me pregunto por qué los hyperscalers no hacen más integración vertical y construyen sus propias fabs
Aunque una fab costara 1,000 millones de dólares, ahora mismo están gastando cientos de miles de millones en comprar chips de Nvidia y otros proveedores
Pero el hecho de que los hyperscalers y las empresas de IA no lo hagan dice mucho sobre cuánto creen realmente en la demanda futura de IA
Las empresas de IA dicen que hace falta una expansión masiva enorme, pero no quieren asumir el riesgo de capital necesario para esa expansión
Se escucha mucho el lamento triste del lado de la IA de que los fabricantes de chips los están frenando, pero ¿quién tiene realmente el dinero para financiar fácilmente esa expansión? Los fabricantes de chips llevan muchísimo más tiempo en este juego. Cuando Sam Altman andaba diciendo que hacían falta fabs por 7 billones de dólares, las empresas de IA demostraron que estaban dispuestas a hacer afirmaciones absurdas y perdieron credibilidad
Lo que hace falta ahora es que una parte muy pequeña de la enorme caja que han acumulado fluya directamente a financiar fabs
Es una especie de “rocket science” actual, y no es algo que se resuelva solo con dinero. Hay una posibilidad muy alta de quemar miles de millones de dólares y no conseguir nada
Basta ver lo mucho que Intel ha sufrido para competir en los últimos años. Es una empresa que lleva décadas en este negocio
Si no tienes ese know-how, hacen falta experimentos adicionales antes de poder competir con los fabricantes existentes. Para cuando logres producir chips útiles, la escasez de oferta quizá ya haya terminado
Probablemente no sea un negocio en el que quieran integrarse
Además requiere una especialización que ninguna de esas empresas tiene
Hace una semana compré un servidor Dell usado
El precio de todo el equipo, con CPU de 12 núcleos y 32 GB de RAM DDR4 ECC, fue parecido al de comprar solo 64 GB de DDR RAM. Espero que esta situación absurda termine pronto. Si no, el dolor va a contagiarse a otros mercados. Hace poco leí que la venta de gabinetes para PC se desplomó más de 40%
https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
Los fabricantes que pasaron a producir componentes “enterprise” no van a volver al mercado de componentes para consumo. Para entonces ese mercado ya no va a existir
Y cuando sobren centros de datos que no logren ganar dinero con contenido generado de baja calidad, se reutilizarán para SaaS. Algo como OnShape extendido a todas las aplicaciones
A la mayoría de los usuarios no parece importarles mucho guardar en servicios en la nube todo lo que generan, y eso se puede vender fácilmente como alternativa a poseer hardware de escritorio o laptop “caro”
Si los hyperscalers usan más RAM y esa RAM no llega a los consumidores, eso significa que todo el trabajo pesado ocurre en la nube
¿Por qué los hyperscalers y los consumidores tendrían que tener RAM al mismo tiempo? Los consumidores querrán más RAM para correr modelos locales, pero entonces la capacidad de los hyperscalers quedaría ociosa
Los fabricantes de memoria tienen montañas de propiedad intelectual
Así que, aunque alguien tuviera capacidad ociosa en fabs y quisiera entrar a fabricar memoria, tendría que pelear contra una barrera enorme de patentes
La mayoría de las empresas de memoria tienen acuerdos tras bambalinas para compensar mutuamente las infracciones de patentes entre ellas
No veo bien cómo podría surgir un nuevo fabricante de memoria sin hundirse en costos de licencias