La memoria ya representa casi dos tercios del costo de los componentes de los chips de IA

(epoch.ai)

2 puntos por GN⁺ 2026-05-25 | 1 comentarios | Compartir por WhatsApp

HBM subió de 52% en el 1er trimestre de 2024 a 63% en el 4º trimestre de 2025, según el promedio ponderado por volumen de producción de los chips de IA de Nvidia, AMD, Google y Amazon
En el mismo periodo, la proporción de los logic dies se mantuvo casi sin cambios en alrededor de 13%, mientras que el empaquetado avanzado bajó de 19% a 15% y los componentes auxiliares de 15% a 9%
El gasto en HBM de las cuatro empresas de diseño aumentó de unos 12 mil millones de dólares en 2024 a 32 mil millones de dólares en 2025, creciendo interanualmente más rápido que otros componentes
El gasto total en componentes de chips de IA aumentó de unos 22 mil millones de dólares a 52 mil millones de dólares, y solo HBM explicó alrededor de 20 mil millones de dólares del incremento
En 2026, la presión de costos podría aumentar aún más por la escasez de memoria y el alza de precios, y Microsoft y Meta también señalaron el aumento en los precios de componentes como un factor detrás del mayor gasto de capital

Cambios clave

La participación de la memoria de alto ancho de banda (HBM) en el gasto de componentes de chips de IA subió de 52% en el 1er trimestre de 2024 a 63% en el 4º trimestre de 2025
Esta estimación es un promedio ponderado por volumen de producción para todos los chips de IA diseñados por Nvidia, AMD, Google y Amazon
En el mismo periodo, los logic dies se mantuvieron casi sin cambios en alrededor de 13%, mientras que el empaquetado avanzado cayó de 19% a 15% y los componentes auxiliares de 15% a 9%
El gasto en HBM de las cuatro empresas de diseño aumentó de unos 12 mil millones de dólares en 2024 a 32 mil millones de dólares en 2025, con un crecimiento interanual más rápido que el de otros componentes
El gasto total en componentes de chips de IA pasó de unos 22 mil millones de dólares en 2024 a alrededor de 52 mil millones de dólares en 2025, y el gasto en HBM por sí solo representó cerca de 20 mil millones de dólares del aumento

Presión de costos en 2026

HBM podría representar una porción aún mayor de los costos en 2026, a medida que continúan la escasez de suministro de memoria y el aumento de precios
La proyección de 190 mil millones de dólares en gasto de capital para el año fiscal 2026 de Microsoft incluye alrededor de 25 mil millones de dólares por aumentos en precios de componentes
Meta elevó en 10 mil millones de dólares su rango de gasto de capital para 2026 y citó precios más altos de componentes como motivo

Método de cálculo y alcance de los datos

Para cada chip de IA diseñado por Nvidia, AMD, Google y Amazon, se estimó el costo por chip de memoria, logic die, empaquetado avanzado y componentes auxiliares
Al multiplicar el costo de componentes de cada chip por el volumen de producción trimestral estimado, se calculó el gasto total por categoría y se obtuvo su proporción frente al gasto total en componentes entre el 1er trimestre de 2024 y el 4º trimestre de 2025
Las estimaciones de costo de componentes provienen de AI Chip Components explorer y construyen una especificación de componentes por chip con base en reportes financieros, materiales de proveedores e informes de analistas
La metodología detallada puede consultarse en la documentación metodológica del explorer

Categorías de componentes

Memoria
- Incluye stacks HBM, con HBM3 y HBM3e
Lógica
- Incluye logic dies de procesos avanzados de 3 a 5 nm
Empaquetado
- Incluye el empaquetado avanzado CoWoS de TSMC
Componentes auxiliares
- Incluye sustratos, suministro de energía y otros insumos no lógicos ni de memoria

Tratamiento de la incertidumbre

Existen incertidumbres de costo en los costos unitarios de cada componente, como el precio de los stacks HBM, el de los logic dies y el de los paquetes CoWoS
El costo por componente de cada chip se modeló con un intervalo de confianza del 90%
La participación de cada componente es el costo de ese componente dividido entre el costo total, por lo que tanto el numerador como el denominador son inciertos
Se presentan dos tipos de rangos
- Rango donde solo cambia el costo de ese componente: la participación cuando ese componente está en el percentil 5 o 95 y los otros tres componentes están en la mediana
- Rango donde todos los componentes cambian a valores extremos: la participación cuando ese componente está en un extremo del intervalo de confianza y todos los demás están simultáneamente en el extremo opuesto

Participación trimestral de componentes

1er trimestre de 2024
- La participación de memoria fue de 52%, con un rango de 48~56% cuando solo cambiaba el costo de ese componente, y de 42~62% cuando todos los componentes variaban a valores extremos
- La participación de lógica fue de 14%, con un rango de 12~17% cuando solo cambiaba el costo de ese componente, y de 10~20% cuando todos los componentes variaban a valores extremos
- La participación de empaquetado fue de 19%, con un rango de 14~24% cuando solo cambiaba el costo de ese componente, y de 12~27% cuando todos los componentes variaban a valores extremos
- La participación de componentes auxiliares fue de 15%, con un rango de 13~18% cuando solo cambiaba el costo de ese componente, y de 11~21% cuando todos los componentes variaban a valores extremos
4º trimestre de 2025
- La participación de memoria fue de 63%, con un rango de 60~67% cuando solo cambiaba el costo de ese componente, y de 54~73% cuando todos los componentes variaban a valores extremos
- La participación de lógica fue de 13%, con un rango de 10~16% cuando solo cambiaba el costo de ese componente, y de 9~19% cuando todos los componentes variaban a valores extremos
- La participación de empaquetado fue de 15%, con un rango de 11~19% cuando solo cambiaba el costo de ese componente, y de 9~22% cuando todos los componentes variaban a valores extremos
- La participación de componentes auxiliares fue de 10%, con un rango de 8~10% cuando solo cambiaba el costo de ese componente, y de 7~12% cuando todos los componentes variaban a valores extremos

Supuestos y limitaciones

Los costos de componentes pueden variar según contrato, proveedor y momento, por lo que existe incertidumbre en las estimaciones de costo por chip
También existe incertidumbre en las estimaciones del volumen trimestral de producción de chips y en la composición por tipos de chip, y esa incertidumbre se refleja en las proporciones reportadas

Datos y herramienta de exploración

AI chip component cost shares by quarter: CSV, actualizado el 21 de mayo de 2026
AI Chip Components: herramienta para explorar datos de consumo en la cadena de suministro de chips de IA

1 comentarios

GN⁺ 2026-05-25

Comentarios de Hacker News

Parece que para la inferencia y el entrenamiento de IA hay una ruta para reducir los costos de hardware en unas 3 veces y los costos totales en unas 2 veces, incluso sin ninguna innovación tecnológica
Solo hace falta que la oferta de DRAM alcance la demanda; ya sea expandiendo la fabricación o cubriendo el aumento de la demanda con el ritmo actual de producción, es solo cuestión de tiempo
- Si además se considera el margen de Nvidia inflado por la escasez actual de chips de punta, el margen para bajar costos podría ser mucho mayor
  Hay mucho que criticar de las cosas que Sam Altman ha difundido culturalmente, pero a largo plazo, la frase “ahora es lo peor que va a ser” me parece un punto bastante interesante y subestimado
  En 10 años, entrenar LLM del nivel actual probablemente será una suposición tan básica como operar bases de datos hoy. El nivel actual ya es bastante avanzado, y aun aparte del progreso del hardware, creo que hay mucho margen de mejora adicional con solo construir mejores esquemas de entrenamiento con aprendizaje por refuerzo
  Recomiendo mucho revisar los proyectos de GitHub y HF del Allen Institute. Hay materiales open source para entrenar LLM desde cero con Common Crawl y ajustes interesantes de qwen, así que se puede probar cómo podrían verse pronto los proyectos de una tarde o los materiales educativos
- Las empresas de memoria no van a aumentar mucho la oferta para igualar la demanda
  Esta industria tiende a mantener el mercado en escasez de oferta, porque si no, el exceso de oferta posterior termina dañando a las empresas. En su lugar, la oferta de áreas menos rentables, como móvil y computación personal, simplemente se reasignará hacia los segmentos más rentables
- Parece que la jugada tan elegante con la que Sam Altman intentó dominar el mercado de memoria produjo consecuencias no previstas
- Me pregunto si aumentará la adopción de formatos de punto flotante alternativos
  El punto flotante IEEE es notoriamente malo en anchos de bit bajos, especialmente en 16 bits o menos. Formatos como posit son mucho mejores en 16 bits u 8 bits. Si se pudiera entrenar con 16 bits por valor en vez de 32, y la pérdida de precisión fuera mucho menor que al pasar de IEEE32 a IEEE16, sería bastante importante
- Me pregunto cuál es la vida útil y la posibilidad de reacondicionamiento de componentes de gasto de capital como los módulos “GPU” o la DRAM soldada dentro de ellos
Hace unos años compré 96 GB de RAM por unos 250 dólares, y ahora esa misma RAM cuesta 1200 dólares
- El 22 de octubre del año pasado compré RAM Crucial 96 GB DDR5 5600MHz SO-DIMM por 279 dólares
  Ahora en Amazon ese mismo kit cuesta 1,048.90 dólares
- Me da muchísima rabia no haber llenado mi servidor principal al máximo cuando tuve la oportunidad
  Los módulos de memoria enterprise usados estaban regalados en eBay
- Hace 1 año compré 192 GB DDR3 literalmente por 60 dólares, 5 dólares por módulo
  Ahora están como en 22 dólares por módulo, así que serían unos 350 dólares en total. No tengo idea de quién está haciendo qué con DDR3
- La idea previa de que se podían conseguir decenas de GB de RAM barata se vino completamente abajo
  El valor de SSD ultrarrápidos como Optane podría volverse mucho mayor
- Ordenando el garaje encontré dos unidades Samsung EVO de 4 TB sin usar
En todo lo que leo, parece que la capacidad de RAM aumentará alrededor de 20~25% al año, pero no parece suficiente
Incluso para uso de consumo, los teléfonos y laptops mejorarían mucho si duplicaran la RAM, y ni hablar de la enorme demanda de IA
No parece que esta tendencia vaya a desaparecer. Tal vez no crezca tan rápido como ahora, pero tampoco va a irse. Entiendo por qué las empresas de memoria no quieren llevarse a sí mismas a la quiebra, pero debería haber alguna manera de trasladar ese riesgo a los proveedores de modelos u otros participantes del ecosistema para aumentar la capacidad de RAM cerca de 50% al año
- Solo el acuerdo con OpenAI podría absorber 2 años de ese crecimiento
  En un mercado competitivo, es ineficiente que los fabricantes de RAM dejen compradores sin venderles
  No sé cuál era realmente la tasa de crecimiento antes de octubre, pero seguro alguien aquí la conoce
- El mayor riesgo es que el lado chino de CXML termine beneficiándose, capture el mercado que otros dejaron desatendido y, cuando los costos empiecen a normalizarse, compita y desplace a los actores actuales
  Sobre que un crecimiento de 20~25% no basta, tampoco me parece una cifra tan descabellada si se asume que los planes de expansión de centros de datos chocan con un muro, se desaceleran fuerte y se enfría el entusiasmo por la IA
  A corto plazo, puede que 20~25% no sea suficiente, pero si la expansión de IA se detiene este año, en vez de escasez habría un exceso de oferta enorme
- En teoría, un nuevo mercado de futuros para componentes de chips podría ayudar
  Porque permitiría a los proveedores de DRAM cubrir ese riesgo
- Según un artículo reciente, HBM es 3 veces menos eficiente que LPDDR en términos de área de wafer, pero ofrece más de 3 veces el ancho de banda
  ¿Y si para todos fuera mejor comprar computadoras, por ejemplo, a 1/3 de velocidad y cambiar todo a HBM?
  La brecha entre cómputo y memoria lleva mucho tiempo creciendo, y quizá cambiar a HBM, aunque sea doloroso, sea justo lo que hace falta
  ¿Es mejor tener 3 computadoras de gama media con poco ancho de banda de memoria, o esperar un poco más estadísticamente para que todos compren computadoras nuevas a 1/3 de velocidad en proporción de área pero con mucho más ancho de banda?
Viendo la tendencia actual, de verdad me pregunto cómo se va a sostener el mercado de consumo para cosas como gaming o machine learning
El gaming en la nube claramente llegará en el futuro, y probablemente solo puristas como yo comprarán una RTX 5090 y pagarán un premium por jugar offline
- A largo plazo, el gaming en la nube es inevitable
  Porque es económicamente más eficiente amortizar entre varios consumidores el costo del hardware necesario para renderizar gráficos, no dejarlo ocioso cuando no se usa y desplegarlo en POP junto con los assets del juego
  Si suficiente cómputo para juegos corre en el edge, también se vuelven posibles juegos más avanzados técnicamente que hoy no son viables económicamente. Creo que no vemos muchos juegos así ahora porque todavía faltan mercado y adopción de cloud gaming, y por lo tanto también falta know-how técnico
  En el momento en que sea demasiado caro asumir el costo de renderizar con hardware de consumo los juegos que la gente quiere, al final incluso quienes se resistían serán convencidos y este modelo podría consolidarse
No me voy a mover de una build con DDR4 hasta que los precios vuelvan al menos parcialmente a la normalidad
Todavía tengo 32 GB de memoria DDR4 2133MHz de respaldo que compré antes, y ahora uso 3200MHz. Eso significa que los fabricantes de CPU tampoco van a recibir mi dinero. El 5800X me alcanza por bastante tiempo, y tampoco tengo motivo para comprar un GPU nuevo. Claro, el B580 no es perfecto
- ¿Y si los precios de ahora fueran el mínimo histórico de aquí en adelante?
Es muy irónico que Irán haya bloqueado el suministro de helio
Al mismo tiempo, Irán depende de propaganda barata generada por IA para sacudir a sus enemigos. Parece una de esas ironías que la historia revela tarde
Para los gamers y aficionados a la PC que no están completamente metidos en IA, este es un momento realmente horrible
- Esto va a matar al 100% el mercado de PC armadas en casa
  Cuando empecé a armar PCs para gaming, la tarjeta gráfica tope de gama costaba 750 dólares neozelandeses. Ahora solo el GPU cuesta 10,000 dólares y además hay que sumarle otros 1,000~2,000 dólares de RAM
  Antes una PC gamer era un hobby accesible, pero ahora hasta la aviación general parece una alternativa razonable
- Yo diría más bien lo contrario
  A corto plazo sí, el segmento aficionado está bajo presión, pero el capital necesario para empujar la frontera no es tan grande comparado con el de las Fortune 500. Pronto los aficionados también verán beneficios, y especialmente si el mercado colapsa
- También es un momento horrible para quienes sí están completamente metidos en IA
Me pregunto por qué los hyperscalers no hacen más integración vertical y construyen sus propias fabs
Aunque una fab costara 1,000 millones de dólares, ahora mismo están gastando cientos de miles de millones en comprar chips de Nvidia y otros proveedores
- No sé si necesariamente tienen que integrarse verticalmente; quizá sería mejor financiar directamente la expansión de capacidad de producción, como hace Apple cuando escala nuevas tecnologías para el iPhone
  Pero el hecho de que los hyperscalers y las empresas de IA no lo hagan dice mucho sobre cuánto creen realmente en la demanda futura de IA
  Las empresas de IA dicen que hace falta una expansión masiva enorme, pero no quieren asumir el riesgo de capital necesario para esa expansión
  Se escucha mucho el lamento triste del lado de la IA de que los fabricantes de chips los están frenando, pero ¿quién tiene realmente el dinero para financiar fácilmente esa expansión? Los fabricantes de chips llevan muchísimo más tiempo en este juego. Cuando Sam Altman andaba diciendo que hacían falta fabs por 7 billones de dólares, las empresas de IA demostraron que estaban dispuestas a hacer afirmaciones absurdas y perdieron credibilidad
  Lo que hace falta ahora es que una parte muy pequeña de la enorme caja que han acumulado fluya directamente a financiar fabs
- Las fabs están entre las tecnologías de punta más complejas que existen
  Es una especie de “rocket science” actual, y no es algo que se resuelva solo con dinero. Hay una posibilidad muy alta de quemar miles de millones de dólares y no conseguir nada
  Basta ver lo mucho que Intel ha sufrido para competir en los últimos años. Es una empresa que lleva décadas en este negocio
- Incluso con el know-how necesario, construir una fab toma años
  Si no tienes ese know-how, hacen falta experimentos adicionales antes de poder competir con los fabricantes existentes. Para cuando logres producir chips útiles, la escasez de oferta quizá ya haya terminado
- Los márgenes promedio de una fab son muy delgados comparados con los de las big tech, y por lo mismo el riesgo también es grande
  Probablemente no sea un negocio en el que quieran integrarse
- Una sola fab cuesta 15~20 mil millones de dólares y tarda al menos 5 años en construirse
  Además requiere una especialización que ninguna de esas empresas tiene
Hace una semana compré un servidor Dell usado
El precio de todo el equipo, con CPU de 12 núcleos y 32 GB de RAM DDR4 ECC, fue parecido al de comprar solo 64 GB de DDR RAM. Espero que esta situación absurda termine pronto. Si no, el dolor va a contagiarse a otros mercados. Hace poco leí que la venta de gabinetes para PC se desplomó más de 40%
- Por el aumento del costo unitario de la RAM, la gente pobre ya está siendo expulsada incluso del segmento de teléfonos baratos
  https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
- Para cuando estalle la burbuja de la IA, siento que el mercado de PC va a estar dañado sin posibilidad de recuperación
  Los fabricantes que pasaron a producir componentes “enterprise” no van a volver al mercado de componentes para consumo. Para entonces ese mercado ya no va a existir
  Y cuando sobren centros de datos que no logren ganar dinero con contenido generado de baja calidad, se reutilizarán para SaaS. Algo como OnShape extendido a todas las aplicaciones
  A la mayoría de los usuarios no parece importarles mucho guardar en servicios en la nube todo lo que generan, y eso se puede vender fácilmente como alternativa a poseer hardware de escritorio o laptop “caro”
- También puede verse desde otro ángulo
  Si los hyperscalers usan más RAM y esa RAM no llega a los consumidores, eso significa que todo el trabajo pesado ocurre en la nube
  ¿Por qué los hyperscalers y los consumidores tendrían que tener RAM al mismo tiempo? Los consumidores querrán más RAM para correr modelos locales, pero entonces la capacidad de los hyperscalers quedaría ociosa
Los fabricantes de memoria tienen montañas de propiedad intelectual
Así que, aunque alguien tuviera capacidad ociosa en fabs y quisiera entrar a fabricar memoria, tendría que pelear contra una barrera enorme de patentes
La mayoría de las empresas de memoria tienen acuerdos tras bambalinas para compensar mutuamente las infracciones de patentes entre ellas
No veo bien cómo podría surgir un nuevo fabricante de memoria sin hundirse en costos de licencias

La memoria ya representa casi dos tercios del costo de los componentes de los chips de IA

Cambios clave

Presión de costos en 2026

Método de cálculo y alcance de los datos

Categorías de componentes

Memoria

Lógica

Empaquetado

Componentes auxiliares

Tratamiento de la incertidumbre

Participación trimestral de componentes

1er trimestre de 2024

4º trimestre de 2025

Supuestos y limitaciones

Datos y herramienta de exploración

Lecturas relacionadas

1 comentarios

Comentarios de Hacker News